摘要: CountVectorizer是文本特征提取的一种方式:本文为稀疏矩阵具体含义 其中new_data所输出的值用toarray()可以转化为稀疏矩阵 new_data.shape():输出的是稀疏矩阵的维度(列表长度X词典个数) 阅读全文
posted @ 2022-10-20 15:04 许个未来— 阅读(584) 评论(0) 推荐(0)
摘要: 训练集和测试集的划分 Ytrain:指的是缺失值那行所对应的有值的部分 Ytest:指的是缺失值,需要预测的部分(一般的监督学习不会预测Ytest,因为我们是预测该缺失的数据,所以Ytest不用做比较,直接进行预测填补缺失值) Xtrain:指的是未缺失部分所对应的特征值 Xtest:指的是缺失部分 阅读全文
posted @ 2022-10-20 09:55 许个未来— 阅读(493) 评论(0) 推荐(0)
摘要: 1.找到安装路径位置的ProgramData【因为MySQL的隐藏文件基本上都在这个文件夹里面】 2.找到my.ini的配置文件打开,找到[mysqld]然后添加skip-grant-tables【指的是跳过命令登录】 3.登录以后使用: update user set authentication 阅读全文
posted @ 2022-07-18 23:26 许个未来— 阅读(65) 评论(0) 推荐(0)
摘要: directory:指的是建立一个纯粹的文件夹 python package:在建立文件夹的同时,生成一个__init__.py 的文件, 可以通过from ... import * 的方式进行同一目录下其它py文件的导入 阅读全文
posted @ 2022-07-04 21:40 许个未来— 阅读(181) 评论(0) 推荐(0)