会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
小神龙1258
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
12
下一页
2020年2月14日
11 信息化领域热词分类分析及解释 第五步按目录爬取热词
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录,
阅读全文
posted @ 2020-02-14 23:59 小神龙1258
阅读(535)
评论(0)
推荐(0)
2020年2月12日
10 信息化领域热词分类分析及解释 第四步热词引用 :爬取跟热词相关的文章链接
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录,
阅读全文
posted @ 2020-02-12 01:02 小神龙1258
阅读(518)
评论(0)
推荐(0)
2020年2月10日
09 信息化领域热词分类分析及解释 第三步 将清洗完毕的热词添加百度百科解释
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录,
阅读全文
posted @ 2020-02-10 23:00 小神龙1258
阅读(414)
评论(0)
推荐(0)
08 信息化领域热词分类分析及解释 第二步 将爬取的数据使用jieba分词处理并清洗
摘要: 直接上代码: import jieba import pandas as pd import re from collections import Counter if __name__=='__main__': filehandle = open("news.txt", "r",encoding=
阅读全文
posted @ 2020-02-10 01:17 小神龙1258
阅读(699)
评论(0)
推荐(0)
2020年2月8日
07 信息化领域热词分类分析及解释 第一步爬取博客园推荐新闻内容
摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录,
阅读全文
posted @ 2020-02-08 23:39 小神龙1258
阅读(873)
评论(0)
推荐(0)
06 springboot+ECharts完成信件数据图表展示
摘要: 项目结构: 源码略微修改再上传,下面看看需求。 需求: 需求一:分析每年的信件数量,通过Echarts折线图展示出来。需求二:分析信件是属于投诉和咨询的比例,通过Echarts饼图展示出来。需求三:分析各个政府部门对信件的回答数量,通过Echarts柱状图展示出来。 一:每年的信件数量 二:信件是属
阅读全文
posted @ 2020-02-08 01:09 小神龙1258
阅读(723)
评论(0)
推荐(0)
2020年2月6日
2020学习05 爬虫,修改了一些bug
摘要: 在上个爬虫代码中没有对信件类型进行分类,而且爬取的数据会出现大片时间爬取不到和回复内容爬取不到, 对代码进行优化后, 得到如下数据: 只显示部分数据,可以看到爬取的完整度基本完好。 代码如下: #coding:utf-8 import requests from lxml import etree
阅读全文
posted @ 2020-02-06 00:48 小神龙1258
阅读(278)
评论(0)
推荐(0)
2020年2月5日
2020学习 04 python 爬取某政府网站信件
摘要: 直接上代码⑧: #coding:utf-8 import requests from lxml import etree import time import pymysql import datetime import urllib import json from IPython.core.pa
阅读全文
posted @ 2020-02-05 00:50 小神龙1258
阅读(985)
评论(0)
推荐(0)
2020年2月2日
2020学习03
摘要: 3
阅读全文
posted @ 2020-02-02 21:06 小神龙1258
阅读(164)
评论(0)
推荐(0)
2020学习02
摘要: 2
阅读全文
posted @ 2020-02-02 21:04 小神龙1258
阅读(148)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
12
下一页
公告