摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 大作业细节: python环境:3.6 爬取得网页:http://bbs.lol.qq.com/foru 阅读全文
posted @ 2017-10-20 00:48 ELsky 阅读(340) 评论(0) 推荐(0) 编辑
摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat 阅读全文
posted @ 2017-10-19 17:18 ELsky 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 1.用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源 2.选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备 阅读全文
posted @ 2017-09-28 21:41 ELsky 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 1、中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) a、关于这门课的相关工作经历 b、自己对于这门课的看法 2、中文分词 a、将要测试词频的文章放在一个TXT里 引用: 结果: 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数 阅读全文
posted @ 2017-09-25 16:02 ELsky 阅读(699) 评论(0) 推荐(0) 编辑
摘要: 1、由字符串创建一个作业评分表,做增删改查询统计遍历操作,例如查询第一个3分的下标,统计1分的同学有几个,3分的同学有几个,增删改查等等。 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3、列表,元组,字典,集合的遍历,总结列表,元组,字典,集合的联系与区别。 4.词频统计 阅读全文
posted @ 2017-09-21 14:55 ELsky 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 1.输出12个星座符号,以反斜线分隔; 2.恺撒密码的编码 3.输入姓名,格式输出:占4位、居中、不足4字的以空格填充。 4.格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) #format()的{}以0为起点 5.打出99乘法表 6 阅读全文
posted @ 2017-09-18 15:41 ELsky 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 注意标准库的两种导入与使用方式,建议大家采用<库名>.<函数名>的方式。 对前面的代码进行优化,用for,while,if,def实现: 1:用循环画五角星 2:用循环画同心圆 3:用while循环画太阳花 4:用函数定义画五个五角星 5:用函数定义画钻石花瓣的太阳花 字符串操作 1:输入学号,识别 阅读全文
posted @ 2017-09-15 15:49 ELsky 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 阅读全文
posted @ 2017-09-07 18:54 ELsky 阅读(198) 评论(0) 推荐(0) 编辑
摘要: import turtle turtle.bgcolor('red') turtle.color('yellow') turtle.begin_fill() turtle.fillcolor('yellow') turtle.penup() turtle.goto(-310,200) turtle.pendown() for i in range(5): turtle.forward(15... 阅读全文
posted @ 2017-09-07 18:49 ELsky 阅读(656) 评论(0) 推荐(0) 编辑
摘要: import turtle turtle.penup() turtle.goto(0,-200) turtle.pendown() turtle.circle(200) turtle.penup() turtle.goto(0,-150) turtle.pendown() turtle.circle(150) turtle.penup() turtle.goto(0,-100) turtle.p... 阅读全文
posted @ 2017-09-07 18:48 ELsky 阅读(221) 评论(0) 推荐(0) 编辑