03 2020 档案
摘要:到目前为止,主要完成了地域维度标准化和关键值的提取。 地域维度标准化主要是根据表中联系单位地址一栏给出的详细地区数据,进行字符串分割得到想要的地域维度。 联系单位地址栏原始数据: 我们要把这些地域信息规范到县区一级,就可以用java中的split函数进行分割,就可以得到标准地域维度。 接下来就是行政
阅读全文
摘要:本周主要看了机器学习的内容,基于大创项目的要求,看了一些关于图像处理的代码,学会了使用opencv。 大数据处理方面,学会了用datax操作表到表的数据传输,csv到sql表的数据传输和清洗,access数据库到sql的数据传输。 kettle相较于datax有可视化的界面,配置相对简单,但是处理速
阅读全文
摘要:github官方文档和项目:https://github.com/alibaba/DataX 下载后在windows环境下是可以直接用python编译执行的,但从github上下载的版本只支持python2.x版本,而现在python3.x正流行,这给我们带来不少麻烦。 在查找资料后我找到了解决办法
阅读全文
摘要:本篇博客参考《信息领域热词分析》,设计实现可测试性战术。 首先我们要了解一下可测试性,软件可测试性是指通过测试(通常是基于运行的测试)揭示软件缺陷的容易程度。 接下来就介绍在项目开发中运用的可测试性战术: 1.面向对象编程 作为一名软件工程的学生,我们都知道编码原则: 单一责任原则 开放/封闭原则
阅读全文
浙公网安备 33010602011771号