2020 年 6月 14 日随笔档案 - 曾宇慧

2020年6月14日

摘要： 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 代码 from sklearn.datasets import load_digits digits = load_digits() print(dig 阅读全文

posted @ 2020-06-14 16:30 曾宇慧阅读(173) 评论(0) 推荐(0)

13-垃圾邮件分类2

摘要： 1.读取 file_path = r"E:\da3xia\jiqixuexi\SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') sms_data = [] sms_lable = [] csv_reader = csv.r 阅读全文

posted @ 2020-06-14 15:18 曾宇慧阅读(130) 评论(0) 推荐(0)

8、特征选择

摘要： 1.用过滤法对以下数据进行特征选择： [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求： 1、Variance Threshold（threshold =1.0） 2、将结果截图放上来（没有条件的备注说明原因）注意：每个人的电脑ID是不一样的阅读全文

posted @ 2020-06-14 15:12 曾宇慧阅读(83) 评论(0) 推荐(0)

7.逻辑回归实践

摘要： 1.逻辑回归是怎么防止过拟合的？为什么正则化可以防止过拟合？增加样本量，这是万能的方法，适用任何模型。过拟合的时候，拟合函数的系数往往非常大，而正则化是通过约束参数的范数使其不要太大，所以可以在一定程度上减少过拟合情况。 from sklearn.linear_model import Logis 阅读全文

posted @ 2020-06-14 15:06 曾宇慧阅读(163) 评论(0) 推荐(0)

5.线性回归算法

摘要： 1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性这个知识点非常重要，复习了矩阵的相关知识。线性回归都基于矩阵的基础。在代码上的实际运用重点递归下降，是优化方程的最佳途径。 2..思考线性回归算法可以用来做什么？（大家尽量不要写重复）线性回归算法可以将生活的具有某一阅读全文

posted @ 2020-06-14 14:52 曾宇慧阅读(96) 评论(0) 推荐(0)

3.K均值算法

摘要： 1）. 扑克牌手动演练k均值聚类过程：>30张牌，3类 2）. *自主编写K-means算法，以鸢尾花花瓣长度数据做聚类，并用散点图显示。（加分题） 3）. 用sklearn.cluster.KMeans，鸢尾花花瓣长度数据做聚类，并用散点图显示. 4）. 鸢尾花完整数据做聚类并用散点图显示. 5 阅读全文

posted @ 2020-06-14 14:36 曾宇慧阅读(104) 评论(0) 推荐(0)

曾哥哥好帅

公告