随笔分类 - 机器学习
摘要:import pandas as pd import numpy as np import matplotlib.pyplot as plt data = pd.read_csv(r"C:\Users\Oscar\Downloads\Advertising.csv") x = data[["TV","Radio","Newspaper"]] y=data["Sales"] plt.plot(d...
阅读全文
摘要:今天课上主要讲的是梯度下降算法。 上一次老师留了梯度下降算法求解线性回归的作业。大部分用java和C++实现的。 笔记也主要来自课程ppt,老师课程的ppt也主要参考的斯坦福吴恩达老师的讲义。 梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯
阅读全文
摘要:首先是爬取了我们学校贴吧的贴吧数据,每个帖子都有是否是精品贴的标签。 根据帖子标题信息,实现了贴吧精品贴和普通贴的分类。错误率在10%左右。 切词用的是jieba吧,没有过滤点停用词和标点符号,因为标点符号其实也是可以算是区分帖子是否是精品贴的而一个重要特征;其实还可以增加几个特征,比如第一页是否含
阅读全文
摘要:待处理的数据为放在两个文件夹中的各25个txt文本,文本信息为电子邮件内容,文件夹spam中的25个邮件都是正常邮件;ham中的25个邮件是垃圾邮件; 利用朴素贝叶斯算法,训练分类器,采取交叉验证的方式,结果证明,分类器能够很好的识别垃圾邮件; 代码主要参考【机器学习实战】,但是有的代码已经不能用了
阅读全文

浙公网安备 33010602011771号