03 2020 档案

第六周学习记录
摘要:对一段文本内容中的关键字进行提取: # -*- coding:utf-8 -*- import jieba.analyse def getkey(str): sentence = str keywords = " ".join(jieba.analyse.extract_tags(sentence, 阅读全文

posted @ 2020-03-28 22:34 丸za 阅读(69) 评论(0) 推荐(0)

第五周学习记录
摘要:使用kmeans对文本内容进行聚类: import numpy as np from sklearn.feature_extraction.text import CountVectorizer, TfidfTransformer from sklearn.cluster import KMeans 阅读全文

posted @ 2020-03-21 20:10 丸za 阅读(85) 评论(0) 推荐(0)

第四周学习记录
摘要:通过调用相关的接口,实现输入“名字”(公司名、公园等)输出“所在区域”(省市区)。 实现: package Dao; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; impo 阅读全文

posted @ 2020-03-14 11:10 丸za 阅读(108) 评论(0) 推荐(0)

关键字的获取
摘要:要求: 从一段“简介”中提取出“关键字”。 实现: 利用python通过jieba对“关键字”进行提取。 阅读全文

posted @ 2020-03-13 23:51 丸za 阅读(143) 评论(0) 推荐(0)

行政区划的获取
摘要:要求: 根据某单位的名称获得其所在的行政区划名称以及行政区划代码,并且补充到数据表中。 具体实现: 通过对地图接口的调用,通过单位名称获得其经纬度,再通过经纬度获得其行政区划名称,进而获得其行政区划代码。 实现结果展示: 阅读全文

posted @ 2020-03-12 23:00 丸za 阅读(189) 评论(0) 推荐(0)

第三周学习记录
摘要:对DataX进行了应用,将多个表数据同步到了一张数据库表中。 DataX在安装时需要注意python版本的影响。 如果是python需要替换一下文件: 实现: 通过编写json文件,实现利用DataX同步三个表数据到一个数据表里。 分别执行三个文件,在json文件中指定数据与列的对应关系,如下所示: 阅读全文

posted @ 2020-03-07 18:18 丸za 阅读(98) 评论(0) 推荐(0)

质量属性II
摘要:代码层实现六种质量属性战术——《信息领域热词分析》 2020-03-01 首先对可修改性战术进行分析。 可修改性战术的目标是控制实现、测试和部署变更的时间和成本。 我们可以把修改性战术根据其目标进行分组。 一组和修改性战术的目标是减少由某个变更直接影响的模块的数量。我们把这组可修改性战术称为“局部化 阅读全文

posted @ 2020-03-05 10:17 丸za 阅读(131) 评论(0) 推荐(0)

第二周学习记录
摘要:对“可修改性战术”进行了理解,并且对“热词分析系统”进行了“可修改性战术分析”。总结如下: 可修改性战术分析 对DataX进行了安装和学习,总结如下: DataX总结 阅读全文

posted @ 2020-03-01 20:38 丸za 阅读(105) 评论(0) 推荐(0)

DataX总结
摘要:下载dataX.tar.gz文件,解压。 由于我的是Python3,因此需要替换如下文件: 替换之后就完成了环境的配置。 以下通过实例测试是否配置成功。 准备好对应的json文件,创建相应的数据库和数据库表。 执行:python C:\study\datax\bin\datax.py C:\stud 阅读全文

posted @ 2020-03-01 19:38 丸za 阅读(141) 评论(0) 推荐(0)

热词分析系统——可修改性战术分析
摘要:首先对可修改性的概念进行理解。 可修改性战术的目标是控制实现、测试和部署变更的时间和成本。 我们可以把修改性战术根据其目标进行分组。 一组和修改性战术的目标是减少由某个变更直接影响的模块的数量。我们把这组可修改性战术称为“局部化修改”;另一组可修改性战术的目标是限制对局部化的模块的修改。我们使用这组 阅读全文

posted @ 2020-03-01 11:35 丸za 阅读(442) 评论(0) 推荐(0)

导航