摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 我选择的网站是中国天气网中的苏州天气,准备抓取7天的天气以及最高/最低气温 获取网页中的html代码: 阅读全文
posted @ 2017-11-01 22:44 23许捷凯 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-19 19:39 23许捷凯 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 运行结果 2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 运行结果 3.获取所有新闻列表页的网址,调用上述函数。 运行结果 4.完成所有校园新闻的爬取工作。 运行结果 5.完成自己所选其他主题相应数据的 阅读全文
posted @ 2017-10-12 21:37 23许捷凯 阅读(158) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup url='http://news.gzcc.cn/html/xiaoyuanxinwen/' res=requests.get(url) res.encoding='utf-8' soup=BeautifulSoup(res.text,'html.parser') for news in s... 阅读全文
posted @ 2017-09-28 16:56 23许捷凯 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 大数据会用到哪些技术? 2.中文分词 阅读全文
posted @ 2017-09-25 20:55 23许捷凯 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作 3、分别做列表,元组,字典,集合的遍历,并总结列表,元组,字典,集合的联系与区别 4、英文词频统计实 阅读全文
posted @ 2017-09-21 18:06 23许捷凯 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 1.输出12个星座符号,以反斜线分隔 运行效果 2.恺撒密码的编码 运行效果 3.输入姓名,格式输出:占4位、居中、不足4字的以空格填充 4.格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 运行效果 5.输出99乘法表 运行效果 阅读全文
posted @ 2017-09-18 17:32 23许捷凯 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 1.用循环画五角星 运行结果 2.用循环画同心圆 运行结果 3.用while循环画太阳花 运行结果 4.用函数定义画五个五角星 运行结果 5.用函数定义画钻石花瓣的太阳花 运行结果 6.字符串操作 a.输入学号,识别年级、专业、序号 b.输入1-7的数字,输出对应的“星期几” 运行结果 c.识别身份 阅读全文
posted @ 2017-09-14 21:00 23许捷凯 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 1.输出hello world 2.简单交互 3.计算两数之和 4.计算三角形面积 5.计算圆的面积 6.画同切圆 7.画五角星 8.画一个填充颜色的五角星 9.国旗 国旗效果图 阅读全文
posted @ 2017-09-08 15:52 23许捷凯 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 在中国,随着华为的崛起,人们对华为越来越有兴趣,越来越有信心,所以考华为证书的人也就越来越多。 阅读全文
posted @ 2017-09-04 23:05 23许捷凯 阅读(102) 评论(0) 推荐(0) 编辑