会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
袁志灵
博客园
首页
新随笔
联系
管理
订阅
2017年10月30日
一个完整的大作业
摘要: 大作业 内容要求 1.选一个自己感兴趣的主题。 2. 网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 1、选择网址http://news.hexun.com/2017-10/31/191
阅读全文
posted @ 2017-10-30 23:01 07袁志灵
阅读(408)
评论(0)
推荐(0)
2017年10月19日
数据结构化与保存
摘要: 1.结构化: 单条新闻的详情字典:news 一个列表页所有单条新闻汇总列表:newsls.append(news) 所有列表页的所有新闻汇总列表:newstotal.extend(newsls) 2.转换成pandas的数据结构DataFrame 3.从DataFrame保存到excel 4.从Da
阅读全文
posted @ 2017-10-19 15:48 07袁志灵
阅读(231)
评论(0)
推荐(0)
2017年10月12日
爬取所有校园新闻
摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 import requestsfrom bs4 import BeautifulSoupimport re res = requests.get("http://news.gzcc.cn/html/xibusudi/"
阅读全文
posted @ 2017-10-12 20:39 07袁志灵
阅读(304)
评论(0)
推荐(0)
2017年9月28日
用requests库和BeautifulSoup4库爬取新闻列表
摘要: 1、requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。 import requestsfrom bs4 import BeautifulSoupurl='http://news.gzcc.cn/html/xiaoyuanxinwen/'res=reques
阅读全文
posted @ 2017-09-28 13:57 07袁志灵
阅读(322)
评论(0)
推荐(0)
2017年9月25日
中文词频统计及词云制作
摘要: 1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容? 希望能讲一些关于python在一些突出领域的实际应用,工作中运用到的python主要知识,最好能讲解下关系我们以后工作中所用的python。 2.中文分词 a.下载一中文长篇小说,并转换成UTF-8编码。 b.使用jie
阅读全文
posted @ 2017-09-25 17:35 07袁志灵
阅读(311)
评论(0)
推荐(0)
2017年9月21日
组合数据类型练习,英文词频统计实例
摘要: 列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 >>> ls=list('123321231')>>> ls['1', '2', '3', '3', '2', '1', '2', '3', '1']>>>
阅读全文
posted @ 2017-09-21 13:05 07袁志灵
阅读(197)
评论(0)
推荐(0)
2017年9月18日
字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理
摘要: 1.实例:输出12个星座符号,以反斜线分隔。 for i in range(12): print(chr(9800+i),end='\\')结果: 2.实例:恺撒密码的编码。 mw=input('请输入明文:')print('密文:',end='')a=ord('a')z=ord('z')for i
阅读全文
posted @ 2017-09-18 19:39 07袁志灵
阅读(273)
评论(0)
推荐(0)
2017年9月14日
作业:条件、循环、函数定义、字符串操作练习
摘要: 1、注意标准库的两种导入与使用方式,建议大家采用<库名>.<函数名>的方式。 2、对前面的代码进行优化,用for,while,if,def实现: a.用循环画五角星 运行代码: from turtle import*color("red")fillcolor("red")begin_fill()wh
阅读全文
posted @ 2017-09-14 15:34 07袁志灵
阅读(243)
评论(0)
推荐(0)
2017年9月8日
python练习
摘要: 1、输出Hello World!程序。 运行结果: 2、用交互式和文件式分别练习简单的交互程序。 (1)交互式 运行结果: (2)文件式 运行结果: 3、用户输入两个数字,计算并输出两个数字之和(尝试用一行代码实现)。 运行结果: 4、用户输入三角形三边长度,并计算三角形的面积(海伦公式)。 运行程
阅读全文
posted @ 2017-09-08 17:09 07袁志灵
阅读(245)
评论(0)
推荐(0)
2017年9月4日
用大数据为企业输送中低端劳动力
摘要: 越是正确的路越难走,达到目标会有很多条路,你可以去走捷径,但是这些路无一例外都会通往那段难走的路。越是正确的路,越是难走。但是一旦你走到了一定程度,就会豁然开朗。如何保证企业发布的信息真实可靠。因为农民工、服务人员等没有很好的辨别虚假信息的能力,所以能不能取得他们的信任,保证他们不受欺骗,是核心问题
阅读全文
posted @ 2017-09-04 23:14 07袁志灵
阅读(167)
评论(0)
推荐(0)
公告