摘要:最近在写爬虫的时候发现利用beautifulsoup解析网页html 利用解析结果片段为: <td valign="top"><div class="pl2"><a class="" href="https://movie.douban.com/subject/26588308/"> 死侍2 / <
阅读全文
摘要:一 及物以及不及物动词 eg: John Smith died in World War Two Jon Smith Killed three enemy soldiers 像die这种动作,可以独立发生,不牵扯到别的人或者物,这种动词就叫做“不及物”动词 但是像例子2中的kill这种动作,必须发生
阅读全文
摘要:贝叶斯公式: 即:B已经发生的情况下,A发生的概率, 等于A已经发生的情况下,B发生的概率,乘以A单独发生的概率,再整体除以B单独发生的概率。 其中P(A|B)称之为条件概率。 1.条件概率 条件概率公式为: 其中:P(AB)的概率为:A与B同时发生的概率。计算公式为:P(A)*P(B)=P(AB)
阅读全文
摘要:使用pandas 读取csv文件前几行数据 文件内容如下: 先读取标题: 读取前几行数据: 将csv文件转化为list 删除csv文件的某一列 方法一:直接del DF['column-name'] 方法二:采用drop方法,有下面三种等价的表达式: 1. DF= DF.drop('column_n
阅读全文
摘要:1 KNN算法 1.1 KNN算法简介 KNN(K-Nearest Neighbor)工作原理:存在一个样本数据集合,也称为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类对应的关系。输入没有标签的数据后,将新数据中的每个特征与样本集中数据对应的特征进行比较,提取出样
阅读全文