03 2020 档案
摘要:本周继续了大数据实验四,由于很多别的事情,这周花在代码上的时间有点少,再加上K_means算法对字符串的处理,我有点搞不明白,所以这一部分依旧没有完成,我会继续努力。
阅读全文
摘要:本周进行了大数据第四次实验,在第一步就卡住了,对于k-means算法对点的处理还很好理解,但是对于字符串的归类,就有点懵了。 在环境的搭建上也遇到了很多问题,特别是pyhanlp的导入,花费了我半天的时间,最后终于找到了解决方法,下面是解决方法的链接: 简单解决python安装中的Unable to
阅读全文
摘要:本周主要学习了,进行了大数据实验三,对数据进行了地域维度优化,提取关键字和行业分类操作,收获很多。 主要用到了: 1.调用百度地图API 通过调用百度地图API,给百度地图API一个地点名称,获取经纬,再根据经纬获取改地点详细信息,还有很多用法,给百度地图API打一波广告,用处很大。 2.提取关键字
阅读全文
摘要:今天完成了所有的任务,结束了练习三。 今天主要完成了对数据的爬取,需要注意的是,这次爬取第一次遇到了限制代码端,所以我通过伪装,才爬取到了数据,通过测试,也修改了前面程序的bug,接下来直接上代码: import requests import pymysql #导入requests包 from l
阅读全文
摘要:今天试这次练习的第二天,对昨天的做了一些完善浪费了一些时间,然后计划的今天的第二部分差了一点没有完成。明天尽量补上,但是明天一天课,估计又得加班了。 今天主要做了第二部分的完善行业分类和行业代码信息,在网上搜了好久没有找到可以像百度地图API这样的接口,也没有找到可以直接识别是什么行业的网站,没办法
阅读全文
摘要:今天对这次练习的第一部分进行了完成,主要目标为完成对地域名和地域码的完善。 开始的时候想着区百度地图爬取,顾及到可能会被限制访问,毕竟数据较多,所以就放弃了这个方法。 第二个想到了调用百度地图API,并通过这个完成了第一部分。 首先 第一步,我们申请百度地图API所用ak, https://jing
阅读全文
摘要:本周主要对质量战术进行了学习,一个软件功能和质量同样重要,可能现在编程自己用体会不到,但当我们毕业,去了公司肯定会明白的。 那时候会显得尤为重要。 那如何提高软件质量,我们有六个方面可以下手,也叫六个战术,分为: 1、可用性战术2、可修改性战术3、性能战术4、安全性战术5、可测试性战术6、易用性战术
阅读全文
摘要:可测试性战术 可测试性战术的目标是允许在完成软件开发的一个增量后,轻松地对软件进行测试 定义 软件可测试性是指通过测试(通常是基于运行的测试)揭示软件缺陷的容易程度。在开发设计良好的系统的成本中,至少有40%是用在了测试上。如果软件设计师能够降低此成本,则将会收到巨大的回报。 要想对系统进行正确的测
阅读全文
摘要:本周是在家里上网课的第二周,感觉还好,老师依据海量作业,不会让你闲着,你也不会拉下,依据在进步着。 本周主要学习了datax和kettle等的使用,还有操作系统和软件测试等方面的知识,刚开始感觉还不是很难,可以接受,后面就不知道了。 总之,继续努力吧。
阅读全文

浙公网安备 33010602011771号