洪英杰 - 博客园

2017年11月1日

摘要： 1.选一个自己感兴趣的主题。 2.网络上爬取相关的数据。 3.进行文本分析，生成词云。 4.对文本分析结果解释说明。 5.写一篇完整的博客，附上源代码、数据爬取及分析结果，形成一个可展示的成果。用requests可获取网页信息用BeautifulSoup可以将网页信息转换为可操作物块 1 sou 阅读全文

posted @ 2017-11-01 15:47 洪英杰阅读(437) 评论(0) 推荐(0)

2017年10月12日

爬取校园网新闻

摘要： 1.获取单条新闻的#标题#链接#时间#来源#内容 #点击次数，并包装成一个函数。 2.获取一个新闻列表页的所有新闻的上述详情，并包装成一个函数。 3.获取所有新闻列表页的网址，调用上述函数。 4.完成所有校园新闻的爬取工作。阅读全文

posted @ 2017-10-12 21:15 洪英杰阅读(231) 评论(0) 推荐(0)

2017年9月28日

用requests库和BeautifulSoup4库爬取新闻列表9-28

摘要：用requests库和BeautifulSoup4库，爬取校园新闻列表的时间、标题、链接、来源、详细内容。 import requests from bs4 import BeautifulSoup gzccurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen 阅读全文

posted @ 2017-09-28 20:55 洪英杰阅读(185) 评论(0) 推荐(0)

2017年9月25日

+中文词频统计及词云制作9-25

摘要： 1.我希望老师能讲一点python在数据挖掘，数据分析领域的应用，最好能举些实例，或者说带我们实际操作一波。 2.中文分词下载一中文长篇小说，并转换成UTF-8编码使用jieba库，进行中文词频统计，输出TOP20的词及出现次数。 >>>import jieba >>>lr = open('斗破阅读全文

posted @ 2017-09-25 20:56 洪英杰阅读(397) 评论(0) 推荐(0)

2017年9月21日

组合数据类型练习，英文词频统计实例9-21

摘要： 1、列表实例：由字符串创建一个作业评分列表，做增删改查询统计遍历操作。例如，查询第一个3分的下标，统计1分的同学有多少个，3分的同学有多少个等。 >>>score=list('21223113321') >>>print('作业评分列表:',score) >>>score.append('3') > 阅读全文

posted @ 2017-09-21 14:58 洪英杰阅读(168) 评论(0) 推荐(0)

2017年9月18日

字符串操作练习：星座、凯撒密码、99乘法表、词频统计预处理9-18

摘要：实例：输出12个星座符号，以反斜线分隔。 >>>for i in range (12): >>>print(chr(9800+i),end=" ") 实例：恺撒密码的编码 >>>kaisa=input('明文:') >>>s=ord('a') >>>for i in kaisa: if s<= or 阅读全文

posted @ 2017-09-18 15:59 洪英杰阅读(202) 评论(0) 推荐(0)

2017年9月14日

条件、循环、函数定义、字符串操作练习9-14

摘要：用循环画五角星用循环画同心圆用while循环画太阳花用函数定义画五个五角星用函数定义画钻石花瓣的太阳花输入学号，识别年级、专业、序号输入1-7的数字，输出对应的“星期几” 识别身份证号中的省市区、年龄、性别阅读全文

posted @ 2017-09-14 11:27 洪英杰阅读(245) 评论(0) 推荐(0)

2017年9月7日

python语言练习9-7

摘要：我们是做练习，请大家一句代码一句代码自己敲出来，不熟悉就多敲几遍，不要复制粘贴，没有意义。阅读全文

posted @ 2017-09-07 11:39 洪英杰阅读(298) 评论(0) 推荐(0)

2017年9月4日

国内外动漫电影的大数据对比

只有注册用户登录后才能阅读该文。阅读全文

posted @ 2017-09-04 19:04 洪英杰阅读(6) 评论(0) 推荐(0)

412洪英杰

公告