04 2016 档案
摘要:0x01 Web数据挖掘类型 利用Python爬虫进行Web数据挖掘已经越来越普遍,网上的各种Python爬虫资料教程比较多,但是很少有人对Web数据挖掘进行系统地总结和分析。 从目标上来讲,Web数据挖掘分为三类。最常见的是对于网站内容的爬取,包括文本、图片和文件等;其次是对于网站结构的爬取,包括
阅读全文
摘要:0x01 感知机 感知机是一种二类分类的线性分类器,属于判别模型(另一种是生成模型)。简单地说,就是通过输入特征,利用超平面,将目标分为两类。感知机是神经网络和支持向量机的基础。 假设输入空间为,输出空间是.其中,为一个特征向量,。 定义从输入空间到输出空间的函数:为感知机。为感知机的权重,为偏置量
阅读全文

浙公网安备 33010602011771号