随笔分类 - python
jieba分词与词云图展示
摘要:一、文章分词: 主要利用jieba进行分词。首先需要下载相关插件,然后在python下运行分词代码。 将分词的结果以及数目存放在数据库中,如图所示: 在eclipse编写代码: 实体层: Dao层: Servlet层: 界面渲染云图: 结果展示: 二、选择某一类文章,绘制该类型新闻文章词云图,例如汽
阅读全文
python数据化中文是方块显示
摘要:遇到问题: 用python进行数据可视化展示时,中文却变成了方框 问题解决: 添加如下代码即可: from pylab import mpl mpl.rcParams['font.sans-serif'] = ['SimHei']
阅读全文
假期第四周周总结
摘要:一、收获 1.这是假期的第四周,主要学习了python爬虫的一些基础知识。 实例:爬取http://www.xiachufang.com/explore/的菜名 # 引用requests库 import requests # 引用BeautifulSoup库 from bs4 import Beau
阅读全文
假期第三周周总结
摘要:一、收获 1.这是假期的第三周,主要学习了python爬虫的一些基础知识。 爬虫的四个步骤: 第0步:获取数据。爬虫程序会根据我们提供的网址,向服务器发起请求,然后返回数据。 第1步:解析数据。爬虫程序会把服务器返回的数据解析成我们能读懂的格式。 第2步:提取数据。爬虫程序再从中提取出我们需要的数据
阅读全文
假期第二周周总结
摘要:一、收获 1.这是假期的第二周,主要学习了python的一些基础知识。 包括python的列表、字典、循环等基础知识。 从列表提取多个元素——切片法 左右空,取到头;左要取,右不取 2.每天主要花费1个小时来学习,并且会根据当天学习任务的多少与难度进行调整。 二、下周目标 下周继续学习python的
阅读全文
python爬取论文
摘要:python实现爬取论文的信息: 1 import requests 2 import pymysql 3 from jieba.analyse import extract_tags 4 from lxml import etree # 导入库 5 from bs4 import Beautifu
阅读全文
浙公网安备 33010602011771号