03 2019 档案

摘要:前言 在写python爬虫的时候遇到了多线程,使用多线程的目的是降低抓取时间。接着我接触了一些IO概念,IO就是Input和Ouput,数据进出CPU的意思。 数据从网线或网卡进入CPU算Input(get请求得到源码),反之就是Output,这是网络IO。 数据从硬盘进入CPU也是Input,反过 阅读全文
posted @ 2019-03-25 01:14 vlj 阅读(363) 评论(0) 推荐(0)
摘要:数据 标称型和数值型 算法 归一化处理:防止数值较大的特征对距离产生较大影响 计算欧式距离:测试样本与训练集 排序:选取前k个距离,统计频数(出现次数)最多的类别 1 def classify0(inX, dataSet, labels, k): 2 ''' 3 4 :param inX: 测试样本 阅读全文
posted @ 2019-03-12 22:29 vlj 阅读(946) 评论(0) 推荐(0)