2020 年 4月 10 日随笔档案 - Hany47315

2020年4月10日

摘要： 1.导包 import pandas as pd 2.数据读取,文件在该代码文件夹内 food_info = pd.read_csv('food_info.csv') 3.查看类型 food_info.dtypes 4.查看前五条数据 food_info.head() 查看前三条数据 food_in 阅读全文

posted @ 2020-04-10 19:40 Hany47315 阅读(173) 评论(0) 推荐(0)

正则表达式补充

摘要： 1. /b 和 /B # /bthe 匹配任何以 the 开始的字符串 # /bthe/b 仅匹配 the # /Bthe 任何包含但并不以 the 作为起始的字符串 2. [cr] 表示 c 或者 r [cr][23][dp][o2] 一个包含四个字符的字符串，第一个字符是“c”或“r”，然后是阅读全文

posted @ 2020-04-10 18:23 Hany47315 阅读(169) 评论(0) 推荐(0)

排序和索引的问题

摘要： 1 ''' 2 1.查看列上最大索引的位置 3 data.argmax(axis = 0) 4 2.输出索引位置上的元素 5 data[index,range(data.shape[1])] 6 使用 range 输出几个元素 7 3.对numpy 对象进行扩展 8 a = np.array([4, 阅读全文

posted @ 2020-04-10 12:41 Hany47315 阅读(241) 评论(0) 推荐(0)

不同复制操作对比（三种）

摘要： ''' 1.b = a b 发生变化 a 也会发生变化 2.浅复制 c = a.view() c.shape 发生变化，a.shape 不会发生变化 c 和 a 共用元素值,id 指向不同 c[1,0] = 1234 ， a 的值也会发生变化 3.深复制 d = a.copy() d[0,0] = 阅读全文

posted @ 2020-04-10 12:18 Hany47315 阅读(174) 评论(0) 推荐(0)

矩阵常用操作

摘要： 1 程序要点：import numpy as np 2 1.查看 e 的多少次方 3 np.exp(参数) 4 2.查看参数的平方根 5 np.sqrt(参数) 6 3.生成三维四列的随机值(-1,1)之间 7 np.random.random((3,4)) 8 4.向下取整 9 a = np.f 阅读全文

posted @ 2020-04-10 12:04 Hany47315 阅读(354) 评论(0) 推荐(0)

KNN算法基本原理与sklearn实现

摘要： ''' KNN 近邻算法，有监督学习算法用于分类和回归思路: 1.在样本空间中查找 k 个最相似或者距离最近的样本 2.根据这 k 个最相似的样本对未知样本进行分类步骤： 1.对数据进行预处理提取特征向量，对原来的数据重新表达 2.确定距离计算公式计算已知样本空间中所有样本与未知样本的距离阅读全文

posted @ 2020-04-10 11:28 Hany47315 阅读(853) 评论(0) 推荐(1)

Python 实现分层聚类算法

摘要： ''' 1.将所有样本都看作各自一类 2.定义类间距离计算公式 3.选择距离最小的一堆元素合并成一个新的类 4.重新计算各类之间的距离并重复上面的步骤 5.直到所有的原始元素划分成指定数量的类程序要点： 1.生成测试数据 sklearn.datasets.make_blobs 2.系统聚类算法 s 阅读全文

posted @ 2020-04-10 10:46 Hany47315 阅读(2766) 评论(0) 推荐(0)

Hany47315

努力会有收获

公告