摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 我选择的主题是在新浪网的新闻中心中抓取近期国内新闻的内容,在数据中查看近期热点新闻。 网址:http:/ 阅读全文
posted @ 2017-11-02 01:25 11+陈泽廷 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da 阅读全文
posted @ 2017-10-19 21:58 11+陈泽廷 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 1.、获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2、获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3、获取所有新闻列表页的网址,调用上述函数。 4、完成所有校园新闻的爬取工作。 阅读全文
posted @ 2017-10-12 20:04 11+陈泽廷 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 1、用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 2、选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-28 15:56 11+陈泽廷 阅读(1524) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 2.中文分词 阅读全文
posted @ 2017-09-25 18:55 11+陈泽廷 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2、字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3、列表,元组,字典,集合的遍历。 列表:可读可修改,符号为[],可进行增删改查等操作。 元组: 阅读全文
posted @ 2017-09-21 21:12 11+陈泽廷 阅读(111) 评论(0) 推荐(0) 编辑
摘要: 1、实例:输出12个星座符号,以反斜线分隔。 >>>for i in range (12): >>>print(chr(9800+i),end=" ") 2、实例:恺撒密码的编码 s = input("请输入凯撒的明文密码:") for i in s: if ord("a") <= ord(i) < 阅读全文
posted @ 2017-09-18 21:52 11+陈泽廷 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 1、注意标准库的两种导入与使用方式,建议大家采用<库名>.<函数名>的方式。 2、对前面的代码进行优化,用for,while,if,def实现: a、用循环画五角星 from turtle import* color("red") fillcolor("red") begin_fill() whil 阅读全文
posted @ 2017-09-14 21:06 11+陈泽廷 阅读(159) 评论(0) 推荐(0) 编辑
摘要: 1.Hello World! 2.简单交互(交互式,文件式)教材P19 效果图: 3.用户输入两个数字,计算并输出两个数字之和(尝试用一行代码实现)。 效果图: 4.用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 效果图: 5.输入半径,计算圆的面积。 效果图: 6.画一组同切圆 效果图: 阅读全文
posted @ 2017-09-07 18:50 11+陈泽廷 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 在现代社会中,手机成为人们必备的无法离身的物品,随着时代的发展手机的更新换代也越来越快,让我们看看现在人们对手机的关注度如何,在百度指数中用大数据的方式来试验。 上图显示了近90天里国内人们在百度搜索手机的趋势图,其中的较高的几个点基本都是在周六周日,也显示出在周末闲暇的时候比较多人会花时间关注手机 阅读全文
posted @ 2017-09-04 21:35 11+陈泽廷 阅读(155) 评论(0) 推荐(0) 编辑