摘要: 一个完整的大作业——新闻 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 本次大作业选择的主题是新闻,其链接是http://news.sina.com. 阅读全文
posted @ 2017-10-31 22:06 讲道理 阅读(367) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-19 21:55 讲道理 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3获取所有新闻列表页的网址,调用上述函数。 4完成所有校园新闻的爬取工作。 阅读全文
posted @ 2017-10-12 21:28 讲道理 阅读(124) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup gzccurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(gzccurl) res.encoding='utf-8' soup = BeautifulSoup(res.text,'html.parser') for... 阅读全文
posted @ 2017-09-28 15:54 讲道理 阅读(145) 评论(0) 推荐(0) 编辑
摘要: import jieba xxx=open("熊出没.txt","r",encoding='utf-8').read() words=jieba.lcut(xxx) counts={} for word in words: if len(word)==1: continue else: counts[word]=counts.get(word,0)... 阅读全文
posted @ 2017-09-25 18:47 讲道理 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 字典实例:建立学生学号成绩字典,做增删改查遍历操作。 列表,元组,字典,集合的遍历。 阅读全文
posted @ 2017-09-21 20:16 讲道理 阅读(119) 评论(0) 推荐(0) 编辑
摘要: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓ 请输入,明文密码:abc123789xyz def456012abc 中华人民共和国国内生产总值(GDP):689,136.89亿元(2015年) 阅读全文
posted @ 2017-09-18 16:01 讲道理 阅读(175) 评论(0) 推荐(0) 编辑
摘要: >>> print('hello') hello >>> a=float(input('输入三角形第一边长:')) 输入三角形第一边长:3 >>> b=float(input('输入三角形第二边长:')) 输入三角形第二边长:4 >>> c=float(input('输入三角形第三边长:')) 输入三角形第三边长:5 >>> s=(a+b+c)/2 >>> area=(s*(s-a)... 阅读全文
posted @ 2017-09-07 11:32 讲道理 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 以上这张图是八月份中国新歌声和中国有嘻哈的大数据分析,大部分时间中国有嘻哈的搜索量跟媒体指数都是高于中国新歌声的,由此可以看出,中国有嘻哈在观众的心目中更有影响力,中国有嘻哈的支持度逼中国新歌声高很多。 阅读全文
posted @ 2017-09-04 21:32 讲道理 阅读(705) 评论(0) 推荐(0) 编辑