摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 本次选取的网站是“https://news.qq.com/a/20171031/017099.htm” 阅读全文
posted @ 2017-10-31 19:54 lesssharp 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-19 21:53 lesssharp 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 1、获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数 2、获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3、获取所有新闻列表页的网址,调用上述函数。 4、完成所有校园新闻的爬取工作。 5、完成自己所选其他主题相应数据的爬取工作 阅读全文
posted @ 2017-10-12 20:11 lesssharp 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 将些Python的实际应用发展前景就业优势 2.中文分词 阅读全文
posted @ 2017-09-25 18:43 lesssharp 阅读(85) 评论(0) 推荐(0) 编辑
摘要: 1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2.字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3、列表,元组,字典,集合的遍历。 4、英文词频统计实例 阅读全文
posted @ 2017-09-21 20:16 lesssharp 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1星座 2凯撒 3输入姓名,格式输出 4格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 5.99乘法表 阅读全文
posted @ 2017-09-18 16:00 lesssharp 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 1 2 3 4 5 6 7 8 阅读全文
posted @ 2017-09-07 17:28 lesssharp 阅读(102) 评论(0) 推荐(0) 编辑