随笔分类 - 机器学习及实践
摘要:新冠预测 导包 1 import pandas as pd 2 import numpy as np 3 import matplotlib.pyplot as plt 4 from fbprophet import Prophet 5 data=pd.read_csv('covid_19_data
阅读全文
摘要:numpy基础 数组创建 1 # 创建一个二维数组 2 import numpy as np 3 tang_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) 4 tang_array.shape 5 tang_array.size 图1-1 打印
阅读全文
摘要:1 from numpy.random import RandomState 2 from sklearn.datasets import make_blobs 3 import matplotlib.pyplot as plt 4 from sklearn.cluster import KMean
阅读全文
摘要:散点图 导包 1 import numpy as np 2 import pandas as pd 3 import matplotlib as mpl 4 import matplotlib.pyplot as plt 5 import seaborn as sns 二维图(一个标签) X1是10
阅读全文
摘要:导入数据 测试集的data和target在两个csv里,我们先将它们合并成一个csv。训练集为了方便处理,我们将survived标签方杂质最后一列。 1 import pandas as pd 2 train=pd.read_csv('train.csv',index_col=0) 3 sub=pd
阅读全文
摘要:导入数据集 导入三个数据集,index_col=0表示将数据集第一列作为索引,如果数据集自带索引可以使用此属性。训练集里data和target放在一个csv里,测试集中的data和target放在两个csv.我们将测试集的target 和data放在一个csv里,这样更方便缺失值的处理。 1 imp
阅读全文
摘要:导入数据集 1 import pandas as pd 2 data=pd.read_csv("iris.csv",index_col=0) 数据分割 我们可以使用iloc和loc来分割数据集,iloc参数一般是索引,loc参数一般是特征值。 1 from sklearn.model_selecti
阅读全文
摘要:导入数据 1 # 从sklearn.datasets里导入手写体数字加载器。 2 from sklearn.datasets import load_digits 3 digits = load_digits() 数据分割及标准化 数据分割 1 from sklearn.model_selectio
阅读全文
摘要:导入数据 1 ''' 2 导入肿瘤数据,数据集第一个特征我们可以作为索引。 3 由于数据集无特征名,我们需要手动添加 4 ''' 5 import numpy as np 6 import pandas as pd 7 column_names = ['Sample code number', 'C
阅读全文

浙公网安备 33010602011771号