随笔分类 - 大三下学习
摘要:软件测试期末考试复习题(一) 三、简答题1、软件缺陷 答案:1).软件未达到产品说明书的功能2).软件出现了产品说明书指明不会出现的错误3).软件功能超出产品说明书指明范围4).软件未达到产品说明书虽未指出但应达到的目标5).软件测试员认为难以理解、不易使用、运行速度缓慢、或者最终用户认为不好 3、
阅读全文
摘要:条件函数和表函数 HIVE的指令一定要有分号! 一.条件函数 1.if函数 (1)查询票房,大于50的电影名称,标记为good,小50的标记为not well,最多返回10条。 解析:就是会返回至多十条记录,且返回电影名,以及评级(按票房和50比较,大于50为good否则为not well) sel
阅读全文
摘要:HQL多表连接 通左连接(左边表中的数据优先全部显示)、右连接(右边表中的数据优先全部显示)、内连接(只显示符合条件的数据)、全连接(显示左右表中全部数据)等方式实现多个表的数据查询。 默认从左到右先写的是左表,左连接保证左表完全显示。 左连接:保证左表完全显示 右连接:保证右表完全显示 内连接:只
阅读全文
摘要:HQL查询结果存储 1.将查询结果存到新的表里! 将从表film中查询到的结果存到表film_2014 create table film_2014as select * from film where dates like'2014%'; 2.将查询结果存到本地目录 分析:overridewrit
阅读全文
摘要:HQL聚合查询 其实是考察的聚合函数 1.count函数(统计数量) select count(name) from film where dates like'2014%'; 2.平均 select avg(prince) from film where dates like'2015%'; 平均
阅读全文
摘要:一.内部表和外部表 未被external修饰的是受管理表,也叫做内部表(managed table),被external修饰的为外部表(external table); 内部表数据由Hive自身管理,外部表数据由HDFS管理; 内部表数据存储的位置是hive.metastore.warehouse.
阅读全文
摘要:选A 在项目管理中,风险分为可预测风险(Known Risks)和不可预测风险(Unknown Risks),判断依据如下: 可预测风险(Known Risks) 特点: 可通过历史数据、经验或项目分析提前识别。 通常有明确的预警信号或规律性。 可制定具体的应对计划(如规避、减轻)。 常见例子: 不
阅读全文
摘要:Rest-Assured 专门用于测试restful api 结构是given-when-then 导入的hamcrest与then有关-->跟匹配相关就和junit里断言很像 示例 import io.restassured.RestAssured; import org.junit.jupite
阅读全文
摘要:集成学习 1.随机森林 from sklearn.ensemble import RandomForestClassifier # 定义一个随机森林分类器对象rf = RandomForestClassifier(random_state=0)rf.fit(x_train,y_train)score
阅读全文
摘要:第1~3章过程性测试 第九题有问题,题错误,应该是4个有效等价类,1个无效等价类 有效等价类:专科、本科、硕士、博士 共四个-->因为他们处理方式不一样 无效等价类:这四种以外 10.B 在场景测试里:测试用例个数=基本流个数+备选流个数 每一个备选流都会搭配一个基本流,所以不只有一个场景包含基本流
阅读全文
摘要:JaCoCo测试代码覆盖率 Jacoco_jacoco是什么-CSDN博客 用2024版最新的idea内置JaCoCo 只需要在setting里选择覆盖率使用JaCoCo即可 右键测试类选择更多运行/调试 然后选覆盖率运行 结果: 右侧选择导出结果 打开导出的html
阅读全文
摘要:MapReduce编程:实现并使用自定义InputFormat 目的就是先将输入文本处理在本例子是先将输入的日志文本处理成日志对象(自定义InputFormat)就不需要在map里面再处理提取日志对象! 再进行map函数、reduce函数实现每个城市总响应量统计(这个和前面几个例子一样类似于word
阅读全文
摘要:多类型输出 多类型输出指的是在mapreduce里输出的不在是单一类型 本案例意思: 对于日志进行mapreduce处理得到每个城市访问的所有url和响应内容总量 (1)日志对象 LogWritable package com.simple; import java.io.DataInput; im
阅读全文
摘要:分布式缓存 hdfs+mapreduce 本案例: 就是已知一个日志文件信息和每个城市对应的ip 现在需要利用mapreduce实现对日志文件进行信息提取得到每个城市名和他对应的总响应内容大小 所以ip2locale.txt放入缓存的目的是方便在map的时候取出来将ip换为城市名称 思路: 首先利用
阅读全文
摘要:多路输出 这个案例的意思是输出结果不是都放在同一个文件里 本案例要求同一个id的 所有商品在同一个目录下,不同id在不同目录下,这些目录都在KeySpilt下 除此之外还需要将所有商品的信息都备份一份放在AllPart目录下 (1)mapper类 package com.simple; import
阅读全文
摘要:数据分析 本例:求同一个小时内的用户数量 其实就是通过mapreduce将同一小时数的用户进行合并 (1)mapper类 import java.io.IOException; import java.net.URI; import java.util.HashMap; import org.apa
阅读全文
摘要:数据转换 就是将原数据整理成想要的格式,和数据清洗有点像! 比如:本案例 数据转换前: 每一列对应的含义:ip、时间、url 数据转换后: 详细代码如下: 代码思路和数据清洗一样 package com.simple.mr; import java.io.IOException; import ja
阅读全文
摘要:数据清洗 目的:就是从海量信息中筛选获取想要的信息 (1)多获取信息进行解析 LogParser package com.simple.mr; import java.text.ParseException; import java.text.SimpleDateFormat; import jav
阅读全文
摘要:文本合并与去重 就是在同一个目录下的不同文件进行合并,并去重输出到一个文件里。 本案例: import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path
阅读全文
摘要:数据分区 MapReduce如果不设置分区数量默认只有1个reducer所有任务都交给这个reducer 如果不设置分区方法默认用哈希方法:hash(key)%R 就是对键的哈希值取模reducer数量(R)来将任务分配给reducer 设置分区数量的方法: job.setNumReduceTask
阅读全文