摘要: 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析,生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客,附上源代码、数据爬取及分析结果,形成一个可展示的成果。 用requests可获取网页信息 用BeautifulSoup可以将网页信息转换为可操作物块 1 sou 阅读全文
posted @ 2017-11-01 15:47 洪英杰 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数,并包装成一个函数。 2.获取一个新闻列表页的所有新闻的上述详情,并包装成一个函数。 3.获取所有新闻列表页的网址,调用上述函数。 4.完成所有校园新闻的爬取工作。 阅读全文
posted @ 2017-10-12 21:15 洪英杰 阅读(191) 评论(0) 推荐(0) 编辑
摘要: 用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源、详细内容。 import requests from bs4 import BeautifulSoup gzccurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen 阅读全文
posted @ 2017-09-28 20:55 洪英杰 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1.我希望老师能讲一点python在数据挖掘,数据分析领域的应用,最好能举些实例,或者说带我们实际操作一波。 2.中文分词 下载一中文长篇小说,并转换成UTF-8编码 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 >>>import jieba >>>lr = open('斗破 阅读全文
posted @ 2017-09-25 20:56 洪英杰 阅读(324) 评论(0) 推荐(0) 编辑
摘要: 1、列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作。例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等。 >>>score=list('21223113321') >>>print('作业评分列表:',score) >>>score.append('3') > 阅读全文
posted @ 2017-09-21 14:58 洪英杰 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 实例:输出12个星座符号,以反斜线分隔。 >>>for i in range (12): >>>print(chr(9800+i),end=" ") 实例:恺撒密码的编码 >>>kaisa=input('明文:') >>>s=ord('a') >>>for i in kaisa: if s<= or 阅读全文
posted @ 2017-09-18 15:59 洪英杰 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 用循环画五角星 用循环画同心圆 用while循环画太阳花 用函数定义画五个五角星 用函数定义画钻石花瓣的太阳花 输入学号,识别年级、专业、序号 输入1-7的数字,输出对应的“星期几” 识别身份证号中的省市区、年龄、性别 阅读全文
posted @ 2017-09-14 11:27 洪英杰 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 我们是做练习,请大家一句代码一句代码自己敲出来,不熟悉就多敲几遍,不要复制粘贴,没有意义。 阅读全文
posted @ 2017-09-07 11:39 洪英杰 阅读(251) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2017-09-04 19:04 洪英杰 阅读(6) 评论(0) 推荐(0) 编辑