会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
OK丁
博客园
首页
新随笔
联系
订阅
管理
2017年11月2日
一个完整的大作业
摘要: 一个完整的大作业 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。
阅读全文
posted @ 2017-11-02 17:03 丁镜钿
阅读(261)
评论(0)
推荐(0)
2017年10月19日
数据结构化与保存
摘要: 1、结构化 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2、转换成pandas的数据结构DataFrame 3、从DataFrame保存到excel 4、从Dat
阅读全文
posted @ 2017-10-19 21:54 丁镜钿
阅读(160)
评论(0)
推荐(0)
2017年10月12日
爬取所有校园新闻
摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3.获取所有新闻列表页的网址,调用上述函数。 4.完后所有校园新闻爬取工作
阅读全文
posted @ 2017-10-12 11:15 丁镜钿
阅读(165)
评论(0)
推荐(0)
2017年9月28日
用requests库和BeautifulSoup4库爬取新闻列表
摘要: 1.用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 3.将其中的时间str转换成datetime类型。 4.选一个自己感兴趣的主题,做类似的操作,为“爬取网络数据并进行文本分析”做准备。
阅读全文
posted @ 2017-09-28 21:44 丁镜钿
阅读(261)
评论(0)
推荐(0)
2017年9月25日
中文词频统计及词云制作
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 在工作上一般用python操作什么,python的实际应用之类的,也可以虚拟一个项目来进行实践。 2.中文分词
阅读全文
posted @ 2017-09-25 18:39 丁镜钿
阅读(254)
评论(0)
推荐(0)
2017年9月21日
组合数据类型练习,英文词频统计实例
摘要: 1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 2.字典实例:建立学生学号成绩字典,做增删改查遍历操作。 3.列表,元组,字典,集合的遍历。 总结列表,元组,字典,集合的联系与区别。 4.英文词频统计实
阅读全文
posted @ 2017-09-21 20:19 丁镜钿
阅读(151)
评论(0)
推荐(0)
2017年9月18日
字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理
摘要: 实例:输出12个星座符号,以反斜线分隔。 for i in range(12): print(chr(9800+i),end="/") 实例:恺撒密码的编码 plaincode=input('请输入明文:') print('密文:',end='') a=ord('a') z=ord('z') for
阅读全文
posted @ 2017-09-18 18:21 丁镜钿
阅读(137)
评论(0)
推荐(0)
2017年9月14日
条件、循环、函数定义、字符串操作练习
摘要: 一、标准数据库两种导入方式 a.第一种 b.第二种 二、 a.循环语句画五角星 b.循环语句画同心圆 c.while循环画太阳花 d.用函数定义画五个五角星 e.用函数定义画钻石花瓣的太阳花 三、字符串操作 a.输入学号,识别年级、专业、序号 b.输入1-7的数字,输出对应的“星期几” c.识别身份
阅读全文
posted @ 2017-09-14 21:03 丁镜钿
阅读(820)
评论(0)
推荐(0)
2017年9月7日
python代码练习
摘要: 练习1: 练习2: 练习3: 练习4: 练习5: 练习6: 练习7:
阅读全文
posted @ 2017-09-07 12:32 丁镜钿
阅读(329)
评论(0)
推荐(0)
2017年9月4日
中国有嘻哈和极限挑战之大数据分析
摘要: 根据中国有嘻哈和极限挑战的大数据分析,分析得出,在星期日对于极限挑战网友的网络点击率是最高的,正式因为星期日是极限挑战一周一次的播出时间,进而星期日极限挑战的网络点击率比中国有嘻哈多,而前一日,星期六,则是中国有嘻哈比极限挑战的网友点击率高,再一次证实了,在现代社会,大数据的优势和发展前景。
阅读全文
posted @ 2017-09-04 21:32 丁镜钿
阅读(317)
评论(0)
推荐(0)
公告
点击右上角即可分享