摘要: 1.导包 import pandas as pd 2.数据读取,文件在该代码文件夹内 food_info = pd.read_csv('food_info.csv') 3.查看类型 food_info.dtypes 4.查看前五条数据 food_info.head() 查看前三条数据 food_in 阅读全文
posted @ 2020-04-10 19:40 Hany47315 阅读(173) 评论(0) 推荐(0)
摘要: 1. /b 和 /B # /bthe 匹配任何以 the 开始的字符串 # /bthe/b 仅匹配 the # /Bthe 任何包含但并不以 the 作为起始的字符串 2. [cr] 表示 c 或者 r [cr][23][dp][o2] 一个包含四个字符的字符串,第一个字符是“c”或“r”, 然后是 阅读全文
posted @ 2020-04-10 18:23 Hany47315 阅读(169) 评论(0) 推荐(0)
摘要: 1 ''' 2 1.查看列上最大索引的位置 3 data.argmax(axis = 0) 4 2.输出索引位置上的元素 5 data[index,range(data.shape[1])] 6 使用 range 输出几个元素 7 3.对numpy 对象进行扩展 8 a = np.array([4, 阅读全文
posted @ 2020-04-10 12:41 Hany47315 阅读(241) 评论(0) 推荐(0)
摘要: ''' 1.b = a b 发生变化 a 也会发生变化 2.浅复制 c = a.view() c.shape 发生变化,a.shape 不会发生变化 c 和 a 共用元素值,id 指向不同 c[1,0] = 1234 , a 的值也会发生变化 3.深复制 d = a.copy() d[0,0] = 阅读全文
posted @ 2020-04-10 12:18 Hany47315 阅读(174) 评论(0) 推荐(0)
摘要: 1 程序要点:import numpy as np 2 1.查看 e 的 多少次方 3 np.exp(参数) 4 2.查看参数的平方根 5 np.sqrt(参数) 6 3.生成三维四列的随机值(-1,1)之间 7 np.random.random((3,4)) 8 4.向下取整 9 a = np.f 阅读全文
posted @ 2020-04-10 12:04 Hany47315 阅读(354) 评论(0) 推荐(0)
摘要: ''' KNN 近邻算法,有监督学习算法 用于分类和回归 思路: 1.在样本空间中查找 k 个最相似或者距离最近的样本 2.根据这 k 个最相似的样本对未知样本进行分类 步骤: 1.对数据进行预处理 提取特征向量,对原来的数据重新表达 2.确定距离计算公式 计算已知样本空间中所有样本与未知样本的距离 阅读全文
posted @ 2020-04-10 11:28 Hany47315 阅读(853) 评论(0) 推荐(1)
摘要: ''' 1.将所有样本都看作各自一类 2.定义类间距离计算公式 3.选择距离最小的一堆元素合并成一个新的类 4.重新计算各类之间的距离并重复上面的步骤 5.直到所有的原始元素划分成指定数量的类 程序要点: 1.生成测试数据 sklearn.datasets.make_blobs 2.系统聚类算法 s 阅读全文
posted @ 2020-04-10 10:46 Hany47315 阅读(2766) 评论(0) 推荐(0)