• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
戈瑾
博客园    首页    新随笔    联系   管理    订阅  订阅

随笔分类 -  python

jieba分词与词云图展示

摘要:一、文章分词: 主要利用jieba进行分词。首先需要下载相关插件,然后在python下运行分词代码。 将分词的结果以及数目存放在数据库中,如图所示: 在eclipse编写代码: 实体层: Dao层: Servlet层: 界面渲染云图: 结果展示: 二、选择某一类文章,绘制该类型新闻文章词云图,例如汽 阅读全文
posted @ 2021-12-13 08:04 戈瑾 阅读(169) 评论(0) 推荐(0)
python数据化中文是方块显示

摘要:遇到问题: 用python进行数据可视化展示时,中文却变成了方框 问题解决: 添加如下代码即可: from pylab import mpl mpl.rcParams['font.sans-serif'] = ['SimHei'] 阅读全文
posted @ 2021-12-10 15:37 戈瑾 阅读(486) 评论(0) 推荐(0)
假期第四周周总结

摘要:一、收获 1.这是假期的第四周,主要学习了python爬虫的一些基础知识。 实例:爬取http://www.xiachufang.com/explore/的菜名 # 引用requests库 import requests # 引用BeautifulSoup库 from bs4 import Beau 阅读全文
posted @ 2021-07-29 08:54 戈瑾 阅读(54) 评论(0) 推荐(0)
假期第三周周总结

摘要:一、收获 1.这是假期的第三周,主要学习了python爬虫的一些基础知识。 爬虫的四个步骤: 第0步:获取数据。爬虫程序会根据我们提供的网址,向服务器发起请求,然后返回数据。 第1步:解析数据。爬虫程序会把服务器返回的数据解析成我们能读懂的格式。 第2步:提取数据。爬虫程序再从中提取出我们需要的数据 阅读全文
posted @ 2021-07-22 08:48 戈瑾 阅读(48) 评论(0) 推荐(0)
假期第二周周总结

摘要:一、收获 1.这是假期的第二周,主要学习了python的一些基础知识。 包括python的列表、字典、循环等基础知识。 从列表提取多个元素——切片法 左右空,取到头;左要取,右不取 2.每天主要花费1个小时来学习,并且会根据当天学习任务的多少与难度进行调整。 二、下周目标 下周继续学习python的 阅读全文
posted @ 2021-07-15 14:06 戈瑾 阅读(69) 评论(0) 推荐(0)
python爬取论文

摘要:python实现爬取论文的信息: 1 import requests 2 import pymysql 3 from jieba.analyse import extract_tags 4 from lxml import etree # 导入库 5 from bs4 import Beautifu 阅读全文
posted @ 2021-06-08 09:04 戈瑾 阅读(933) 评论(0) 推荐(0)

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3