摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3.获取所有新闻列表页的网址,调用上述函数。 4.完成所有校园新闻的爬取工作。 5.完成自己所选其他主题相应数据的爬取工作。 阅读全文
posted @ 2017-10-12 21:54 34-潘志文 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 1、用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 2、选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。 阅读全文
posted @ 2017-09-27 22:33 34-潘志文 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答) 大数据具体的生活应用(具体到某个领域,以及其中起到的作用) 2.中文分词 阅读全文
posted @ 2017-09-25 19:21 34-潘志文 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 我给大家分享一下python的小知识,有兴趣的朋友可以看下 阅读全文
posted @ 2017-09-20 18:05 34-潘志文 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 在这里小编我写了一些关于python的应用小练习,希望大家感兴趣. 阅读全文
posted @ 2017-09-13 20:30 34-潘志文 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 1.选一个自己感兴趣的主题。我选的是途牛网,并定位到自己家乡韶关。 2.网络上爬取相关的数据,截取网站的标题以及来源。 3.进行文本分析,生成词云。我将网站复制下来,使用字典的方法统计出出现次数最多的20个词,并去掉一些符号。 生成词云。生成词云中遇到很多问题,其中找字体就是一个最麻烦的事。用中文制 阅读全文
posted @ 2017-10-31 22:00 34-潘志文 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat 阅读全文
posted @ 2017-10-18 22:49 34-潘志文 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 1:输出12个星座符号,以反斜线分隔。 2:恺撒密码的编码 3:输入姓名,格式输出:占4位、居中、不足4字的以空格填充 4:格式化输出:中华人民共和国国内生产总值(GDP)689,136.89亿元(2015年)(千分位、2位小数,浮点数) 5:打出99乘法表 阅读全文
posted @ 2017-09-18 23:19 34-潘志文 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 用游戏数据可以预测游戏产品趋势,通过数据可以做好精准营销。(腾讯老大的做法) 迄今为止,大数据已经成为了热门话题,但腾讯公司在公开场合很少提大数据,不是因为数据太少,而是积累的太多,所以腾讯如何发挥这些数据的价值一直是一个重大的议题。 而腾讯互娱在数据运用方面也有着自己的心得,在其与极客公园举办的公 阅读全文
posted @ 2017-09-08 14:17 34-潘志文 阅读(528) 评论(0) 推荐(1) 编辑
摘要: 1.Hello World! 2.简单交互(交互式,文件式)教材P19 3、用户输入两个数字,计算并输出两个数字之和(尝试用一行代码实现) 4、用户输入三角形三边长度,并计算三角形的面积:(海伦公式) 5、输入半径,计算圆的面积 6、画一组同切圆 7、画一个五角星 8、画一个全黄色的五角星 阅读全文
posted @ 2017-09-08 13:45 34-潘志文 阅读(109) 评论(0) 推荐(0) 编辑