大三下学习 - 随笔分类 - Annaprincess

卷一

摘要：软件测试期末考试复习题（一）三、简答题1、软件缺陷答案：１）．软件未达到产品说明书的功能２）．软件出现了产品说明书指明不会出现的错误３）．软件功能超出产品说明书指明范围４）．软件未达到产品说明书虽未指出但应达到的目标５）．软件测试员认为难以理解、不易使用、运行速度缓慢、或者最终用户认为不好 3、阅读全文

posted @ 2025-06-19 09:45 Annaprincess 阅读(8) 评论(0) 推荐(0)

条件函数和表函数

摘要：条件函数和表函数 HIVE的指令一定要有分号！一.条件函数 1.if函数（1）查询票房，大于50的电影名称，标记为good，小50的标记为not well,最多返回10条。解析：就是会返回至多十条记录，且返回电影名，以及评级（按票房和50比较，大于50为good否则为not well） sel 阅读全文

posted @ 2025-06-18 17:22 Annaprincess 阅读(11) 评论(0) 推荐(0)

HQL多表连接

摘要：HQL多表连接通左连接（左边表中的数据优先全部显示）、右连接（右边表中的数据优先全部显示）、内连接（只显示符合条件的数据）、全连接（显示左右表中全部数据）等方式实现多个表的数据查询。默认从左到右先写的是左表，左连接保证左表完全显示。左连接：保证左表完全显示右连接：保证右表完全显示内连接：只阅读全文

posted @ 2025-06-18 17:22 Annaprincess 阅读(6) 评论(0) 推荐(0)

HQL查询结果存储

摘要：HQL查询结果存储 1.将查询结果存到新的表里！将从表film中查询到的结果存到表film_2014 create table film_2014as select * from film where dates like'2014%'; 2.将查询结果存到本地目录分析：overridewrit 阅读全文

posted @ 2025-06-18 17:22 Annaprincess 阅读(6) 评论(0) 推荐(0)

HQL聚合查询

摘要：HQL聚合查询其实是考察的聚合函数 1.count函数（统计数量） select count(name) from film where dates like'2014%'; 2.平均 select avg(prince) from film where dates like'2015%'; 平均阅读全文

posted @ 2025-06-18 17:10 Annaprincess 阅读(8) 评论(0) 推荐(0)

HIVE数据仓库

摘要：一.内部表和外部表未被external修饰的是受管理表，也叫做内部表（managed table），被external修饰的为外部表（external table）；内部表数据由Hive自身管理，外部表数据由HDFS管理；内部表数据存储的位置是hive.metastore.warehouse. 阅读全文

posted @ 2025-05-30 10:15 Annaprincess 阅读(9) 评论(0) 推荐(0)

可预测风险和不可预测风险

摘要：选A 在项目管理中，风险分为可预测风险（Known Risks）和不可预测风险（Unknown Risks），判断依据如下：可预测风险（Known Risks）特点：可通过历史数据、经验或项目分析提前识别。通常有明确的预警信号或规律性。可制定具体的应对计划（如规避、减轻）。常见例子：不阅读全文

posted @ 2025-05-19 18:37 Annaprincess 阅读(106) 评论(0) 推荐(0)

Rest-Assured

摘要：Rest-Assured 专门用于测试restful api 结构是given-when-then 导入的hamcrest与then有关-->跟匹配相关就和junit里断言很像示例 import io.restassured.RestAssured; import org.junit.jupite 阅读全文

posted @ 2025-05-17 15:23 Annaprincess 阅读(11) 评论(0) 推荐(0)

集成学习

摘要：集成学习 1.随机森林 from sklearn.ensemble import RandomForestClassifier # 定义一个随机森林分类器对象rf = RandomForestClassifier(random_state=0)rf.fit(x_train,y_train)score 阅读全文

posted @ 2025-05-02 23:02 Annaprincess 阅读(13) 评论(0) 推荐(0)

1~3章测试

摘要：第1~3章过程性测试第九题有问题，题错误，应该是4个有效等价类，1个无效等价类有效等价类：专科、本科、硕士、博士共四个-->因为他们处理方式不一样无效等价类：这四种以外 10.B 在场景测试里：测试用例个数=基本流个数+备选流个数每一个备选流都会搭配一个基本流，所以不只有一个场景包含基本流阅读全文

posted @ 2025-04-28 22:56 Annaprincess 阅读(4) 评论(0) 推荐(0)

JaCoCo测试代码覆盖率

摘要：JaCoCo测试代码覆盖率 Jacoco_jacoco是什么-CSDN博客用2024版最新的idea内置JaCoCo 只需要在setting里选择覆盖率使用JaCoCo即可右键测试类选择更多运行/调试然后选覆盖率运行结果：右侧选择导出结果打开导出的html 阅读全文

posted @ 2025-04-20 20:37 Annaprincess 阅读(34) 评论(0) 推荐(0)

MapReduce编程:实现并使用自定义InputFormat

摘要：MapReduce编程:实现并使用自定义InputFormat 目的就是先将输入文本处理在本例子是先将输入的日志文本处理成日志对象（自定义InputFormat）就不需要在map里面再处理提取日志对象！再进行map函数、reduce函数实现每个城市总响应量统计（这个和前面几个例子一样类似于word 阅读全文

posted @ 2025-04-07 18:54 Annaprincess 阅读(9) 评论(0) 推荐(0)

处理map端多类型输出

摘要：多类型输出多类型输出指的是在mapreduce里输出的不在是单一类型本案例意思：对于日志进行mapreduce处理得到每个城市访问的所有url和响应内容总量（1）日志对象 LogWritable package com.simple; import java.io.DataInput; im 阅读全文

posted @ 2025-04-07 18:31 Annaprincess 阅读(10) 评论(0) 推荐(0)

分布式缓存

摘要：分布式缓存 hdfs+mapreduce 本案例：就是已知一个日志文件信息和每个城市对应的ip 现在需要利用mapreduce实现对日志文件进行信息提取得到每个城市名和他对应的总响应内容大小所以ip2locale.txt放入缓存的目的是方便在map的时候取出来将ip换为城市名称思路：首先利用阅读全文

posted @ 2025-04-07 18:08 Annaprincess 阅读(6) 评论(0) 推荐(0)

多路输出

摘要：多路输出这个案例的意思是输出结果不是都放在同一个文件里本案例要求同一个id的所有商品在同一个目录下，不同id在不同目录下，这些目录都在KeySpilt下除此之外还需要将所有商品的信息都备份一份放在AllPart目录下（1）mapper类 package com.simple; import 阅读全文

posted @ 2025-04-07 00:45 Annaprincess 阅读(19) 评论(0) 推荐(0)

数据分析

摘要：数据分析本例：求同一个小时内的用户数量其实就是通过mapreduce将同一小时数的用户进行合并（1）mapper类 import java.io.IOException; import java.net.URI; import java.util.HashMap; import org.apa 阅读全文

posted @ 2025-04-07 00:21 Annaprincess 阅读(10) 评论(0) 推荐(0)

数据转换

摘要：数据转换就是将原数据整理成想要的格式，和数据清洗有点像！比如：本案例数据转换前：每一列对应的含义：ip、时间、url 数据转换后：详细代码如下：代码思路和数据清洗一样 package com.simple.mr; import java.io.IOException; import ja 阅读全文

posted @ 2025-04-07 00:08 Annaprincess 阅读(20) 评论(0) 推荐(0)

数据清洗

摘要：数据清洗目的：就是从海量信息中筛选获取想要的信息（1）多获取信息进行解析 LogParser package com.simple.mr; import java.text.ParseException; import java.text.SimpleDateFormat; import jav 阅读全文

posted @ 2025-04-06 23:58 Annaprincess 阅读(26) 评论(0) 推荐(0)

文本合并与去重

摘要：文本合并与去重就是在同一个目录下的不同文件进行合并，并去重输出到一个文件里。本案例： import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path 阅读全文

posted @ 2025-04-06 23:29 Annaprincess 阅读(33) 评论(0) 推荐(0)

数据分区

摘要：数据分区 MapReduce如果不设置分区数量默认只有1个reducer所有任务都交给这个reducer 如果不设置分区方法默认用哈希方法：hash(key)%R 就是对键的哈希值取模reducer数量（R）来将任务分配给reducer 设置分区数量的方法： job.setNumReduceTask 阅读全文

posted @ 2025-04-06 23:18 Annaprincess 阅读(17) 评论(0) 推荐(0)

luckyyaoyao

随笔分类 - 大三下学习

公告