10 2021 档案
摘要:今天继续分享读人件的想法,《人件》提到了软件管理中的七个不真实期望,我觉得总结的很到位,举其中几个来说。 1、“有使你的生产力剧增的新诀窍,你已经错过了”,没有什么是错过的其实是他不存在的,是一种营销的手段说法罢了; 2、“其他经理的成效是正100%、200%或者更多”,就想我们经常自己恐吓自己别人
阅读全文
摘要:今天想做修改字段的功能, sql语句修改字段信息是这样的: alter table 表名称 change 字段原名称 字段新名称 字段类型 [是否允许非空] 要实现这个功能需要将旧字段名称也传递过来,于是我需要在js中额外申明一个变量来存储这个旧的字段名称 var oldname=data.zdna
阅读全文
摘要:今天我有一个很低级的小错误却困扰了我很久,data data =null 后面直接给data.setxxx(),然后发现程序运行到这里 不响应,然后我调试了好久发现没有初始化,data =new data(); 然后获取字段列表后很难在做分页,按照我之前的方法实现不了,我不知道该怎么办了
阅读全文
摘要:我想的导入csv是 需要输入表名,字段所在行,文件所在位置。在这样的构想下,我去写了javaapi读取本地的csv文件,测试成功之后我开始写web,在写上传表单和servlet获取文件的路径的时候,我发现获取到的只是文件的名字,并没有路径,于是我就去查,发现一个非常致命的错误,serlvet是服务器
阅读全文
摘要:今天我在想我用layui展示数据,然后点击查看详情怎么跳转到下一个界面呢,试了很久,用window.open打开一个新的界面。 但是我不知道怎么去展示深层次的表格数据呢,我就想传个参数给servlet然后新的界面再获取参数来进行ajax的请求,然后我发现不行。html并不容易获取servlet的数据
阅读全文
摘要:安装oracle,去官网下载13c版本,最近就看到这个版本,然后去找一个教程跟着安装,配置真的好麻烦,他这个oracle也类似于一个普通软件 下一步的安装,但是需要注意一些配置 然后把各种用户的密码都是root。安装了将近俩个小时,安装配置太折磨了。
阅读全文
摘要:今天想做一个从后台获取到的值的json字符串中取到想要的值,然后就去找相应的方法,通过键值的方式获取json中对应值,大致就是这样的方法。
阅读全文
摘要:今天学习Mongo的api操作,用相关操作来完成实验报告 import com.alibaba.fastjson.JSON; import com.alibaba.fastjson.JSONObject; import com.google.gson.Gson; import com.mongodb
阅读全文
摘要:今天安装mongo,我不知道安装在哪,然后看了教程大多是安装windows,然乎我就安装在本地。我对于这些配置真的捏把汗,总会出各种各样的问题。 去官网下载他的版本,跟着新一点的教程一点点安装即可,他就像一个普通的软件可以点击下一步进行安装,然后去官网下载一个mongopass,可视化使用mongo
阅读全文
摘要:今天做了两份软考的前三道大题,很难写,不熟悉,写了很久,就没有那种敏感性,看图看半天,找不到关键。尤其是分析数据流,找半天找不到。对那个用例图类图感到很难分析。
阅读全文
摘要:通过hive和mysql 通过判断条件将数据整合,然后将带有结果的(即明确表明改行数据是异常的)数据放到python中来构建决策树,然后将测试数据放入进行比对。首先需要确定明确有问题的数据,增加一个字段作为标记,有问题添1。 我的python代码 import csv from sklearn.fe
阅读全文
摘要:今天继续分享人件有感,《人件》提到:软工本质上其工作的主要问题,与其说是技术问题,不如说是社会学问题。记得上老师也提过三分技术,七分管理,我想道理应该是一样的。但是下面又提到很少有经理人用这样的思想指导管理工作,在我做项目的时候我也是这种情况。我和我同组的同学更倾向于集中精力做技术方面,而几乎不怎么
阅读全文
摘要:今天继续看决策树,他好像是制定好了一个结果的标准就是具有什么样的特征必定会发生什么结果,所以要先找出结果,再将数据根据特征进行判断。
阅读全文
摘要:今天了解到可以通过泰坦尼克幸存者分析来学习决策树,我就去看,我学习完简单总结 导入数据后,选取特征值 选取性别、年龄、几等舱所谓特征。 将相应特征值活下来的人标记值记为1,相应特征没活下来的标记为0 然后做成一个结果集,然后输入其他数据,根据这个结果集进行比对,输出那些人可以活下来。 看完还是有些启
阅读全文
摘要:今天去看决策树,很懵,不知道该怎么实现,看了一些算法的介绍和分析,但是我不知道怎么把这个算法和我的数据分析联系起来。
阅读全文
摘要:今天听了同学的分享,然后我继续我的想法,将时间不配和金额数量不配统一进行筛选, 将金额数量差和日期有问题表进行联合查询 结果是289,这是最接近的结果,不过这个结果跑出来课真不容易,非常耗时间。
阅读全文
摘要:今天在同学的告知下,做时间的筛选,选出那些发票明细中时间在发票时间之前的发票编号 create table mxtmp(fp_nid string,je double) Row format delimited fields terminated by ','; insert into table
阅读全文
摘要:今天我就想到了为什么不把金额差,数量差作为两个条件共同查询,然后我发现数量反倒增加了很多,然后就调两个值的取值,到最接近328的结果 select xgnc.xf_id,xgnc.cnum,xc.profit from xgnc join xc on xc.xf_id=xgnc.xf_id wher
阅读全文
摘要:今天我偶然又想既然做了进出金额的差值,还可以做一个进出数量的差值,然后就是这样 Create table xgnc(xf_id string, cnum int ) Row format delimited fields terminated by ','; insert into table xg
阅读全文
摘要:今天继续分析异常企业,我想了很久,没有想到该怎么做分辨,然后突然想到选出进出金额差很大的,然后就往这边做 Create table xf(xf_id string, je double,xnum int) Row format delimited fields terminated by ',';
阅读全文
摘要:今天做企业异常发票分析,增值税发票详细那个数据文件特别大一个多g,一般方式根本打不开,放在一个编译器才,勉强打开,但是操作特别卡。 做这个异常分析是没有什么思路,就先按要求步骤进行。先进行数据清洗和数据导入。 先创建三个表,分别将三分数据进行导入 增值税发票表 Create table zzsfp(
阅读全文
摘要:今天继续做测试清洗,我不知道如何用hive去清洗,我就用了kettle手动一个个将编号输入,将对应的字段值替换。
阅读全文
摘要:测试题目: 1、数据导入: 要求将样表文件中的(AA_GXJSQYDC2019)数据导入HIVE数据仓库中。 分别将四个标准维度表导入数据仓库中。 2、数据清洗: 根据标准维度将国民经济行业维度、地域维度、高新技术领域维度、企业所属领域维度四个维度字段清洗完成。 3、数据可视化展示: 尝试按照某一维
阅读全文
摘要:看《人件》这本书,发现书中基本没有涉及到任何软件技术,但作者精辟的探讨了专业软件团队管理这一非常专业的话题。怎么把团队做好,这是一个大问题。只有做好团队,才能做好软件。我看书上说大多数管理者坦承,他们对于人的担心,更甚于对技术的担心。在这方面作出努力,只是总是以关注技术为主。从事新技术的人,总是以为
阅读全文
摘要:今天我继续学习kettle,我在测试使用过程中经常清洗数据出问题,在前一步流程中数据处理失败,我发现他跟字段的类型有关系,还有字段的长度。我在试着用kettle做复杂的字段值替换,比如一行数字,我根据数字转换成对应的日期,我尝试写了正则表达式,可是结果并没有成功还是原样输出了。希望明天的测试能用上。
阅读全文
摘要:我花了一晚上把kettle下载下来,然后我按照视频学习了一下使用的方法,感觉还是很不错的,他是通过组件将数据文件读取进来,然后将数据文件的字段都分好,可以进行字段中值的替换。目前看起来很有用。 学习时间:19:43到22:02
阅读全文
摘要:今天去学习了钉钉群的大数据视频,看了大数据交通事故处理系统,我有的内容已经掌握,还看到了很多新的东西,比如说用kettle软件来清洗数据,我眼前一亮。 学习时间:18:39到22:13
阅读全文
摘要:今天做极限测试后续内容 统计每天各个机场的销售数量和销售金额。 通过查询贩卖编号具有C开头的数据并按日期和贩卖编号排序放入存储机场数据的表 create table jc row format delimited fields terminated by ',' as select day_id,s
阅读全文
摘要:今天来对极限测试的三个表继续做清洗 需要将数字改成对应的时间 我毫无想法,学习了同学的方法 // 清洗insert overwrite table sales_sample_info_clean select date_add('2021-09-00',cast(day_id as int)) as
阅读全文
浙公网安备 33010602011771号