摘要: 发现歌词中有一句中文 处理后歌词如下 发现歌词最多的五个单词为“you”,“i”,“to”,“play”,“get”,一共有288个英文词汇 阅读全文
posted @ 2019-04-22 00:10 lv3 阅读(583) 评论(0) 推荐(0) 编辑
摘要: 时间原因暂时如此,懒癌犯了。难受 阅读全文
posted @ 2019-04-08 23:26 lv3 阅读(102) 评论(0) 推荐(0) 编辑
摘要: 如今是只大三狗,做事3分钟热度。可以读书的时间就仅剩下不到4个月的时间。不想落到无书可读可的地步,还没有一门生存下去的手段。故开始记录学习笔记,希望能在都市存活,繁衍。 语言可视化是让人理解的一个重要手段,也是商务数据分析不可缺少的内容之一。 R语言画图之道。 阅读全文
posted @ 2019-02-25 23:31 lv3 阅读(661) 评论(0) 推荐(0) 编辑
摘要: #导入os包加载数据目录 import os path = r'E:\dzy' #停词库 with open(r'e:\\stopsCN.txt', encoding='utf-8') as f: stopwords = f.read().split('\n') #对数据进行标准编码处理(encoding='utf-8') import codecs import jie... 阅读全文
posted @ 2018-12-19 10:58 lv3 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 1.导入数据集 2.查看数据集 3.一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示 4.多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果 5. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示 阅读全文
posted @ 2018-12-11 21:02 lv3 阅读(136) 评论(0) 推荐(0) 编辑
摘要: from sklearn.metrics import confusion_matrix, classification_report from sklearn.naive_bayes import MultinomialNB import csv file_path=r'F:\duym\ai\smsspamcollection\sms.txt' sms=open(file_path,'r',e... 阅读全文
posted @ 2018-12-04 21:20 lv3 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 主要就是掌握 .format 的基本用法,以及python的简单操作。 阅读全文
posted @ 2018-09-03 18:59 lv3 阅读(130) 评论(0) 推荐(0) 编辑