摘要:
1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 代码 from sklearn.datasets import load_digits digits = load_digits() print(dig 阅读全文
posted @ 2020-06-14 16:30
曾宇慧
阅读(173)
评论(0)
推荐(0)
摘要:
1.读取 file_path = r"E:\da3xia\jiqixuexi\SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') sms_data = [] sms_lable = [] csv_reader = csv.r 阅读全文
posted @ 2020-06-14 15:18
曾宇慧
阅读(130)
评论(0)
推荐(0)
摘要:
1.用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
posted @ 2020-06-14 15:12
曾宇慧
阅读(83)
评论(0)
推荐(0)
摘要:
1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? 增加样本量,这是万能的方法,适用任何模型。过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 from sklearn.linear_model import Logis 阅读全文
posted @ 2020-06-14 15:06
曾宇慧
阅读(163)
评论(0)
推荐(0)
摘要:
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 这个知识点非常重要,复习了矩阵的相关知识。线性回归都基于矩阵的基础。 在代码上的实际运用 重点递归下降,是优化方程的最佳途径。 2..思考线性回归算法可以用来做什么?(大家尽量不要写重复) 线性回归算法可以将生活的具有某一 阅读全文
posted @ 2020-06-14 14:52
曾宇慧
阅读(96)
评论(0)
推荐(0)
摘要:
1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5 阅读全文
posted @ 2020-06-14 14:36
曾宇慧
阅读(104)
评论(0)
推荐(0)

浙公网安备 33010602011771号