会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
birdmmxx
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
16
下一页
2020年3月12日
第四周--数据清洗(添加省市区)
摘要: 利用python为地名匹配省市区, 设计思想:利用百度api实现定位经纬度,然后再通过经纬度匹配省市区 1.从文本中读取地点名称 #提取地区 def diqu(): f = codecs.open('kjcg.txt', mode='r', encoding='utf-8') # 打开txt文件,以
阅读全文
posted @ 2020-03-12 23:53 birdmmxx
阅读(562)
评论(0)
推荐(0)
2020年3月7日
第三周--kettle简单的运用
摘要: 对kettle进行简单的综合运用, 本次效果是将三个表添加到同一个表中,然后后面两个表有信息不全(地点不全),还可能有重复数据现象 设计展示如上图; 最后能够完成实验要求把。因为数据的机密性,再次只是做个日记小结。 参考资料来自: http://113.31.104.47/portal/#/cour
阅读全文
posted @ 2020-03-07 10:06 birdmmxx
阅读(106)
评论(0)
推荐(0)
2020年3月2日
质量属性(可修改性)
摘要: 质量属性其一:可修改性 可修改性战术的目标是控制实现、测试和部署变更的时间和成本。 就我的理解其实就是在编写软件代码的时候需要为以后的维护,修改着想,其实就是在以后的检测以及修改的时候尽可能的节省时间以及成本。 在之前作业中,对于信息领域热词分析其实我就没有考虑到可修改性这一环节,在用mapredu
阅读全文
posted @ 2020-03-02 22:35 birdmmxx
阅读(478)
评论(0)
推荐(0)
2020年3月1日
第二周--初次使用datax(mysql中两表的数据迁移)
摘要: 在cmd里进行操作: CHCP 65001(解决乱码)最好输入,不然提示消息看不懂 1.两个表数据:(将person中的名字和年龄数据迁移到person2中) 2.查看mysql的读写的json格式(复制下来,在datax的job文件中新建一个json文件) python datax.py -r m
阅读全文
posted @ 2020-03-01 16:25 birdmmxx
阅读(1505)
评论(0)
推荐(0)
2020年2月27日
kettle文本文件写入数据库,简单进行数据清洗
摘要: 使用kettle7.0,java8.0,Navicat,实验数据使用全国肺炎2月24日的数据 1.建立关系 2.创建连接 如果是第一次连接,可能会出现连接不上的情况,这时候可能情况是没有将Mysql的运行jar包放到lib文件夹下 3.设置sql连接 4.文本转换参考连接 https://blog.
阅读全文
posted @ 2020-02-27 16:37 birdmmxx
阅读(1513)
评论(0)
推荐(0)
2020年2月22日
淘宝网质量属性场景
摘要: 一、可用性 可用性是指系统正常运行时间的比例,是通过两次故障之间的时间长度或在系统崩溃情况下能够恢复正常运行的速度来衡量的。 论淘宝网的可用性我们肯定不知道他背后的修复时间,但是从老师那儿曾经听说过,就是双十一的时候有专门的负责人,双十一从策划到完全结束,这几个月结束之后就可以休息了。可见这背后的工
阅读全文
posted @ 2020-02-22 16:25 birdmmxx
阅读(106)
评论(0)
推荐(0)
第一周
摘要: 常见质量属性分类 常见的软件质量属性有6个,分别为可用性、可修改性、性能、安全性、可测试性、易用性。这几个属性能够贯彻一个软件的所有过程,并且能够评价软件优劣。这几个质量属性相辅相成,不能分离。 质量属性分析 2.1可用性战术 可用性是对一个软件运行程度的评估。一个软件的(正常运行时间/(正常运行时
阅读全文
posted @ 2020-02-22 15:00 birdmmxx
阅读(92)
评论(0)
推荐(0)
2020年2月20日
架构漫谈1(读书笔记)
摘要: 今天阅读了架构漫谈这篇博文,让架构师以及架构工作一无所知的我有了很深刻的印象。这篇博文很简短,但是他对架构的讲解非常到位,让我收获很多。 首先,我一无所知,在开篇王先生就阐述什么是架构,我正是带着这个疑问来到这个博文的,所以开篇题目直击我的疑惑,原来架构如同哈利波特,每个人心中的架构都是不同理解的,
阅读全文
posted @ 2020-02-20 23:11 birdmmxx
阅读(104)
评论(0)
推荐(0)
2020年2月15日
寒假第十五天
摘要: 寒假第十五天 针对RDD编程 import java.util.Properties import org.apache.spark.sql.types._ import org.apache.spark.sql.Row import org.apache.spark.sql.SparkSessio
阅读全文
posted @ 2020-02-15 21:18 birdmmxx
阅读(113)
评论(0)
推荐(0)
2020年2月14日
寒假第十四天
摘要: 寒假第十四天 今天将前几次遇到的问题都全部解决了,发现安装出现问题很多都是版本不匹配。所以我严格按照教程spark用2.1.0,scala用2.11.8,问题全部都没有了 以下截图: 使用sbt打包: 设置sbreclipse全局变量: 只要根据教程,版本兼容,基本都没有问题。
阅读全文
posted @ 2020-02-14 21:03 birdmmxx
阅读(108)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
16
下一页
公告