04 2019 档案

摘要:现在有一段文本 我就是想看看 里面的词的高频和低频 我需要做两件事情 1. 先分词,分词我们就按照标点和空格来分 2. 接着统计词频 运行结果如下 WordCounta 9he 6the 6and 5as 4was 4with 3i 2of 2 his 2 10 least common words 阅读全文
posted @ 2019-04-30 11:20 深度预习 阅读(355) 评论(0) 推荐(0)
摘要:一. 知识图谱和金融领域简述 什么是知识图谱? 借鉴其中一个理解: 知识图谱主要的目标是用来描述真实世界中间存在的各种实体和概念,以及它们之间的关联关系。 具体理论知识就不在此赘述,对于这个抽象的概念会有一篇文章来列举一个代表性的例子。 知识图谱起源于语义网络,最初由Google提出用与优化搜索结果 阅读全文
posted @ 2019-04-29 19:49 深度预习 阅读(7893) 评论(0) 推荐(0)
摘要:主要两块,第一个是文件类型的转换,第二个是用docx包去对word文档中的table进行parse 1. 文件格式装换 因为很多各种各样的原因,至今还有一些word文档是doc的格式存的,对于这种,如果我们想用python对这个word文档中的内容进行解析的话,理论上必须要处理成docx先。 如果你 阅读全文
posted @ 2019-04-01 01:31 深度预习 阅读(2449) 评论(0) 推荐(0)