摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 选取的网站是“http://www.4399.com/flash/” 打开网页源代码找到相应的类跟需要的 阅读全文
posted @ 2017-11-02 16:29 Fatmanwu 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) (1)单条新闻的详情字典:news 结果: (2)一个列表页所有单条新闻汇总列表:newsls.appe 阅读全文
posted @ 2017-10-19 21:50 Fatmanwu 阅读(222) 评论(0) 推荐(0) 编辑
摘要: import requests import re from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requests.get(url) res.encoding='utf-8' soup=BeautifulSoup(res.text,'html.parser') n=int(sou... 阅读全文
posted @ 2017-10-12 21:19 Fatmanwu 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 2.中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 **排除一些无意义词、合并同一词。 **使用wordcloud库绘制一个词 阅读全文
posted @ 2017-09-25 18:44 Fatmanwu 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2.字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3.列表,元组,字典,集合的遍历。总结列表,元组,字典,集合的联系与区别。 4.英文词频统计实例 阅读全文
posted @ 2017-09-21 20:13 Fatmanwu 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 1.星座 2.凯撒密码 3.99乘法表 4.输入名字 5.格式化输出 阅读全文
posted @ 2017-09-18 15:57 Fatmanwu 阅读(137) 评论(0) 推荐(0) 编辑
摘要: import turtleturtle .begin_fill()turtle.color('yellow')turtle.forward(300)turtle.left(144)turtle.forward(300)turtle.left(144)turtle.forward(300)turtle 阅读全文
posted @ 2017-09-07 17:52 Fatmanwu 阅读(190) 评论(0) 推荐(0) 编辑
摘要: 进入大数据时代,越来越多的数据都有统计,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及 阅读全文
posted @ 2017-09-04 21:11 Fatmanwu 阅读(148) 评论(0) 推荐(0) 编辑