摘要: 一个完整的大作业 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 阅读全文
posted @ 2017-11-02 17:03 丁镜钿 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat 阅读全文
posted @ 2017-10-19 21:54 丁镜钿 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3.获取所有新闻列表页的网址,调用上述函数。 4.完后所有校园新闻爬取工作 阅读全文
posted @ 2017-10-12 11:15 丁镜钿 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 1.用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 3.将其中的时间str转换成datetime类型。 4.选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-28 21:44 丁镜钿 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 在工作上一般用python操作什么,python的实际应用之类的,也可以虚拟一个项目来进行实践。 2.中文分词 阅读全文
posted @ 2017-09-25 18:39 丁镜钿 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2.字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3.列表,元组,字典,集合的遍历。 总结列表,元组,字典,集合的联系与区别。 4.英文词频统计实 阅读全文
posted @ 2017-09-21 20:19 丁镜钿 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 实例:输出12个星座符号,以反斜线分隔。 for i in range(12): print(chr(9800+i),end="/") 实例:恺撒密码的编码 plaincode=input('请输入明文:') print('密文:',end='') a=ord('a') z=ord('z') for 阅读全文
posted @ 2017-09-18 18:21 丁镜钿 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 一、标准数据库两种导入方式 a.第一种 b.第二种 二、 a.循环语句画五角星 b.循环语句画同心圆 c.while循环画太阳花 d.用函数定义画五个五角星 e.用函数定义画钻石花瓣的太阳花 三、字符串操作 a.输入学号,识别年级、专业、序号 b.输入1-7的数字,输出对应的“星期几” c.识别身份 阅读全文
posted @ 2017-09-14 21:03 丁镜钿 阅读(700) 评论(0) 推荐(0) 编辑
摘要: 练习1: 练习2: 练习3: 练习4: 练习5: 练习6: 练习7: 阅读全文
posted @ 2017-09-07 12:32 丁镜钿 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 根据中国有嘻哈和极限挑战的大数据分析,分析得出,在星期日对于极限挑战网友的网络点击率是最高的,正式因为星期日是极限挑战一周一次的播出时间,进而星期日极限挑战的网络点击率比中国有嘻哈多,而前一日,星期六,则是中国有嘻哈比极限挑战的网友点击率高,再一次证实了,在现代社会,大数据的优势和发展前景。 阅读全文
posted @ 2017-09-04 21:32 丁镜钿 阅读(241) 评论(0) 推荐(0) 编辑