一个完整的大作业——凤凰网文化(文学)

摘要: 一、选一个自己感兴趣的主题 因为对网络上爬取相关的数据不是很了解,所以选择比较简单的,网址是:http://culture.ifeng.com/listpage/59665/1/list.shtml。 二、网络上爬取相关的数据 1.网络上爬取单条新闻的相关数据 2.爬取网页上所有新闻的相关数据并保存 阅读全文
posted @ 2017-11-01 14:34 ZJQ-013 阅读(289) 评论(0) 推荐(0) 编辑

数据结构化与保存

摘要: 一、结构化 1、单条新闻的详情字典:news 2、一个列表页所有单条新闻汇总列表:newsls.append(news) 3、所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 二、转换成pandas的数据结构DataFrame 三、从DataFrame保存到excel 阅读全文
posted @ 2017-10-26 13:41 ZJQ-013 阅读(90) 评论(0) 推荐(0) 编辑

爬取所有校园新闻

摘要: 1、获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数 2、获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数 3、获取所有新闻列表页的网址,调用上述函数 4、完成所有校园新闻的爬取工作 5、完成自己所选其他主题相应数据的爬取工作 阅读全文
posted @ 2017-10-12 19:25 ZJQ-013 阅读(225) 评论(0) 推荐(0) 编辑

用requests库和BeautifulSoup4库爬取新闻列表

摘要: 1、用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容 2、将其中的时间str转换成datetime类型 3、将取得详细内容的代码包装成函数 4、选一个自己感兴趣的主题,做类似的操作,为后面“爬取网络数据并进行文本分析”做准备 阅读全文
posted @ 2017-09-28 18:16 ZJQ-013 阅读(440) 评论(0) 推荐(0) 编辑

中文词频统计及词云制作

摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) python的实际应用,Python的实际操作案例 2.中文分词 A.下载一中文长篇小说,并转换成UTF-8编码 《三体》中的第一章节 B.使用jieba库,进行中文词频统计,输出TOP20的词及出现次 阅读全文
posted @ 2017-09-25 17:28 ZJQ-013 阅读(786) 评论(0) 推荐(0) 编辑

组合数据类型练习,英文词频统计实例

摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作 3、列表,元组,字典,集合的遍历,总结列表,元组,字典,集合的联系与区别 4、英文词频统计实例 A 阅读全文
posted @ 2017-09-21 17:21 ZJQ-013 阅读(147) 评论(0) 推荐(0) 编辑

字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理

摘要: 实例一:输出12个星座符号,以反斜线分隔 for i in range(12): print(chr(9800+i),end='\\') 实例二:恺撒密码的编码 plaincode=input("明文:") print("密文:") x=ord('A') y=ord('Z') i=ord('a') 阅读全文
posted @ 2017-09-18 18:42 ZJQ-013 阅读(219) 评论(0) 推荐(0) 编辑

条件、循环、函数定义、字符串操作练习

摘要: 一、注意标准库的两种导入与使用方式 1、第一种方式 演示效果: 2、第二种方式 演示效果: 二、对前面的代码进行优化,用for,while,if,def实现 1、用循环画五角星 演示效果: 2、用循环画同心圆 演示效果: 3、用while循环画太阳花 演示效果: 4、用函数定义画五个五角星 演示效果 阅读全文
posted @ 2017-09-14 17:30 ZJQ-013 阅读(202) 评论(0) 推荐(0) 编辑

Python输入输出练习,运算练习,turtle初步练习

摘要: 1、Hello World! #演示效果图 2、简单交互(交互式,文件式) #演示效果图 3、用户输入两个数字,计算并输出两个数字之和(尝试用一行代码实现) #演示效果图 4、用户输入三角形三边长度,并计算三角形的面积:(海伦公式) #演示效果图 5、输入半径,计算圆的面积 #演示效果图 6、画一组 阅读全文
posted @ 2017-09-07 14:15 ZJQ-013 阅读(408) 评论(0) 推荐(0) 编辑

大数据分析小说的发展趋势

摘要: 小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。人物、情节、环境是小说的三要素。情节一般包括开端、发展、高潮、结局四部分,有的包括序幕、尾声。环境包括自然环境和社会环境。小说按照篇幅及容量可分为长篇、中篇、短篇和微型小说(小小说)。按照表现的内容可分为科幻、公案、传 阅读全文
posted @ 2017-09-04 20:19 ZJQ-013 阅读(5340) 评论(0) 推荐(0) 编辑