讲道理 - 博客园

2017年10月31日

摘要：一个完整的大作业——新闻 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析，生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客，附上源代码、数据爬取及分析结果，形成一个可展示的成果。本次大作业选择的主题是新闻，其链接是http://news.sina.com. 阅读全文

posted @ 2017-10-31 22:06 讲道理阅读(378) 评论(0) 推荐(0)

2017年10月19日

数据结构化与保存

摘要： 1.结构化：单条新闻的详情字典：news 一个列表页所有单条新闻汇总列表：newsls.append(news) 所有列表页的所有新闻汇总列表：newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文

posted @ 2017-10-19 21:55 讲道理阅读(190) 评论(0) 推荐(0)

2017年10月12日

爬取所有校园新闻

摘要： 1获取单条新闻的#标题#链接#时间#来源#内容 #点击次数，并包装成一个函数。 2获取一个新闻列表页的所有新闻的上述详情，并包装成一个函数。 3获取所有新闻列表页的网址，调用上述函数。 4完成所有校园新闻的爬取工作。阅读全文

posted @ 2017-10-12 21:28 讲道理阅读(135) 评论(0) 推荐(0)

2017年9月28日

用requests库和BeautifulSoup4库爬取新闻列表

摘要： import requests from bs4 import BeautifulSoup gzccurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/' res = requests.get(gzccurl) res.encoding='utf-8' soup = BeautifulSoup(res.text,'html.parser') for... 阅读全文

posted @ 2017-09-28 15:54 讲道理阅读(155) 评论(0) 推荐(0)

2017年9月25日

中文词频统计及词云制作

摘要： import jieba xxx=open("熊出没.txt","r",encoding='utf-8').read() words=jieba.lcut(xxx) counts={} for word in words: if len(word)==1: continue else: counts[word]=counts.get(word,0)... 阅读全文

posted @ 2017-09-25 18:47 讲道理阅读(178) 评论(0) 推荐(0)

2017年9月21日

组合数据类型练习，英文词频统计实例

摘要：字典实例：建立学生学号成绩字典，做增删改查遍历操作。列表，元组，字典，集合的遍历。阅读全文

posted @ 2017-09-21 20:16 讲道理阅读(128) 评论(0) 推荐(0)

2017年9月18日

字符串操作练习

摘要： ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓ 请输入，明文密码：abc123789xyz def456012abc 中华人民共和国国内生产总值（GDP）:689，136.89亿元（2015年）阅读全文

posted @ 2017-09-18 16:01 讲道理阅读(193) 评论(0) 推荐(0)

2017年9月7日

python输入输出练习，运算练习和turtle练习

摘要： >>> print('hello') hello >>> a=float(input('输入三角形第一边长：')) 输入三角形第一边长：3 >>> b=float(input('输入三角形第二边长：')) 输入三角形第二边长：4 >>> c=float(input('输入三角形第三边长：')) 输入三角形第三边长：5 >>> s=(a+b+c)/2 >>> area=(s*(s-a)... 阅读全文

posted @ 2017-09-07 11:32 讲道理阅读(318) 评论(0) 推荐(0)

2017年9月4日

中国新歌声与中国有嘻哈大数据分析

摘要：以上这张图是八月份中国新歌声和中国有嘻哈的大数据分析，大部分时间中国有嘻哈的搜索量跟媒体指数都是高于中国新歌声的，由此可以看出，中国有嘻哈在观众的心目中更有影响力，中国有嘻哈的支持度逼中国新歌声高很多。阅读全文

posted @ 2017-09-04 21:32 讲道理阅读(721) 评论(0) 推荐(0)

公告