06 2021 档案
学习——构建民航业知识图谱并实现语义查询的
摘要:一、参考资料 构建民航业知识图谱并实现语义查询_ShawnHu的博客-CSDN博客 二、neo4j安装 下载地址:https://neo4j.com/download-center/ 安装教程:https://www.cnblogs.com/jpfss/p/10874303.html
阅读全文
新闻文本分类——词云可视化
摘要:一、参考资料 文本可视化(词云图)_huanxingchen1的博客-CSDN博客 一、文本可视化种类 在上篇博客提取完文本中的关键词之后,进行词云可视化 1)基于文本内容的可视化 基于文本内容的可视化研究包括基于词频的可视化和基于词汇分布的可视化,常用的有词云、分布图和 Document Card
阅读全文
新闻文本分类——关键词提取
摘要:一、参考资料 新闻关键字提取和新闻推荐_mawenqi0729的博客-CSDN博客_新闻关键词抽取 jieba 分词的三种模式_天主极乐大帝的博客-CSDN博客 二、使用jieba进行分类 1、结巴分词的三种模式 精确模式(默认)、全模式和搜索引擎模式 1)精确模式,试图将句子精确的分开,适用于文本
阅读全文
新闻文本分类——爬虫观察者官网
摘要:一、源代码 import requests import queue import pymysql from lxml import etree import threading import re import useful_functions import fake_user_agent # h
阅读全文
浙公网安备 33010602011771号