摘要:map函数格式为:map(function, iterable, ...) function:函数,含有两参数 iterable:一个或多个序列 function函数可以自己创建,之前使用的是将csv文件内的内容替换,例如将‘是’替换成‘yes’,将一些中文替换成数字表示等。 iterable:一般
阅读全文
摘要:最近在写爬虫的时候发现利用beautifulsoup解析网页html 利用解析结果片段为: <td valign="top"><div class="pl2"><a class="" href="https://movie.douban.com/subject/26588308/"> 死侍2 / <
阅读全文
摘要:使用pandas 读取csv文件前几行数据 文件内容如下: 先读取标题: 读取前几行数据: 将csv文件转化为list 删除csv文件的某一列 方法一:直接del DF['column-name'] 方法二:采用drop方法,有下面三种等价的表达式: 1. DF= DF.drop('column_n
阅读全文
摘要:1 KNN算法 1.1 KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类对应的关系。输入没有标签的数据后,将新数据中的每个特征与样本集中数据对应的特征进行比较,提取出样
阅读全文