【考试认证】Apache Doris 和 SelectDB 初级认证考试

下列关于 Apache Doris 的特性描述中，哪一项是不正确的：
◦ Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库
◦ Apache Doris 数据库具有存算一体和存算分离的两种架构模式
◦ Apache Doris 数据库不是一个具备行列混合存能力的数据
◦ Apache Doris 能够兼容标准的 MySQL 协议
在集群管控工具 Manager 页面上，哪一项是看不到的：
◦ 集群中所有的用户及其权限
◦ 集群中 FE 和 BE 的节点数
◦ Catalog 数量以及 Internal 库的数量
◦ 当前集群数据的存储使用量
下列关于使用 Manager 集群告警的相关说法，哪一项是正确的：
◦ 无法选择告警等级
◦ 无法导入已有的告警策略
◦ 告警触发条件的触发逻辑来自监控页面
◦ 告警触发条件可以是多个条件的“或”逻辑
关于分区桶下面哪一项是正确的：
◦ 分桶是第一级，分区是第二级
◦ 目前支持 HASH 分桶和 RANDOM 分桶
◦ 分桶数必须手动指定
◦ 分桶键必须是表的 KEY 列
下面哪个数据类型是 Apache Doris 不支持的：
◦ BOOLEAN
◦ STRING
◦ BINARY
◦ VARIANT
Doris 中执行聚合分析时，GROUP BY 子句支持以下哪类表达式：
◦ 函数调用
◦ 列别名
◦ 子查询
◦ 临时表变量
下列关于巡检的说法，哪一项是不正确的：
◦ Manager 工具支持定期对集群做巡检
◦ 巡检结果可以发送到企业微信、飞书群、钉钉群等
◦ 可以查看巡检内容的详细说明
◦ 巡检时发现不正确的结果，可以一键修复
关于 Apache Doris 索引的描述哪一项是错误的：
◦ 支持点查询和跳数索引
◦ 支持全局索引和局部索引
◦ 内置前缀索引和 ZoneMap 索引
◦ 支持倒排索引和 Ngram 索引
下列关于 Manager 工具扩容操作的说法，哪一项是正确的：
◦ 针对 BE，无法扩容计算节点
◦ 可以批量扩容 FE 和 BE 节点
◦ 针对 FE，扩容时无法选择 Observer 角色
◦ Manager 不会检查待扩容机器的环境
通过 Doris Manager 部署集群是，“接管”模式适用于以下哪种场景：
◦ 全新安装 Doris 集群
◦ 仅部署 FE 节点
◦ 集群已部署，用 Manager 管理现有集群
◦ 仅部署 BE 节点
关于 Apache Doris 的 Routine Load 消费 Kafka 数据时的 offset 处理，以下说法正确的是：
◦ 仅支持从 Kafka 分区的最新 offset 开始消费
◦ 若导入任务失败，重启后会自动从上次成功的 offset 继续消费
◦ 必须手动指定每个 Kafka 分区的起始 offset
◦ 创建后无法再调整 Kafka 分区的 offset，必须要重建创建任务
Iceberg Catalog 支持快照查询（Snapshot Query），其主要用途是：
◦ 加快表速度
◦ 降低元数据大小
◦ 精确回溯数据历史状态
◦ 增加行级权限
以下哪项命令可以检查机器的 CPU 指令集是不是支持 avx2：
◦ cat /proc/cpuinfo | grep avx2
◦ cat /etc/security/limits.conf | grep avx2
◦ cat /etc/sysctl.conf | grep avx2
◦ cat /proc/version | grep avx2
下列关于监控看板的说法，哪一项是不正确的：
◦ 可以详细查看某一个看板的数据
◦ 可以根据监控看板找到提交大查询的用户
◦ 可以制作自己所需的看板
◦ 可以编辑当前看板的展示逻辑
在 Apache Doris 中，多表的物化视图自动更新的机制是：
◦ 必须手动刷新
◦ 实时同步更新
◦ 异步增量更新，由系统自动完成
◦ 每天凌晨自动刷新一次
以下哪项是使用 Hive Catalog 时可以有效提升查询性能的做法：
◦ 开启 BE 层缓存
◦ 修改 FE 的内存上限
◦ 使用 Internal Catalog
◦ 禁用 SQL Cache
下面哪一种分区是 Apache Doris 不支持的：
◦ RANGE 分区
◦ LIST 分区
◦ NULL 分区
◦ HASH 分区
在 Stream Load 导入中，关于 max_batch_rows 参数的作用，正确的是：
◦ 限制单次导入的最大文件大小
◦ 控制导入数据时每个批次处理的最大行数
◦ 设定导入任务的超时时间（单位：秒）
◦ 规定导入数据中允许的最大错误行数
Apache Doris 中进行多维分析 ROLLUP 时，正确的语法是：
◦ GROUP BY ROLLUP(column1, column2)
◦ GROUP BY GROUPING SETS(column1, column2)
◦ ROLLUP BY column1, column2
◦ GROUPING((column1), (column2))
以下关于 Apache Doris 的部署方式，哪一项是不正确的：
◦ 通过手动部署的方式部署
◦ 通过 Yum 源的方式来部署
◦ 通过 Doris Manager 可视化工具的方式来部署
◦ 通过 Kubernetes 容器化的方式部署
手动部署 Apache Doris 时，启动第二个 FE 时首次需指定下列哪个参数：
◦ --daemon
◦ --priority_networks
◦ --meta_dir
◦ --helper
在聚合模型（Aggregate Key）中，若某列同时配置了 SUM 和 MAX 聚合函数，会发生什么情况：
◦ 创建表失败，因一列只能指定一个聚合函数
◦ 优先执行 SUM 函数，忽略 MAX 函数
◦ 系统自动选择更适合的聚合函数（数值型选 SUM，字符型选 MAX）
◦ 按建表时定义的第一个聚合函数执行，其余函数失效
下列关于监控的说法，哪一项是正确的：
◦ 查看 Manager 的监控看板时无法调整时间范围
◦ 如果有 Insert 操作，则可以看到各 Insert 操作的详细资源使用信息
◦ 如果有查询操作，则可以看到各查询操作的详细资源使用信息
◦ 集群的监控信息是由 Prometheus 采集，在 Grafana 上展示的
下列关于 S3 Load 导入权限配置的描述，错误的是：
◦ 支持 S3 协议的服务（如 AWS S3、阿里云 OSS）可直接使用 S3 Load 导入
◦ 若 S3 存储桶开启了版本控制，S3 Load 会自动导入所有版本的的文件
◦ 需确保 Apache Doris 集群节点网络可访问 S3 服务的 endpoint
◦ 可通过 s3.access_key 和 s3.secret_key 参数在导入语句中指定密钥
以下关于 Apache Doris 数据导出时压缩格式的支持，正确的是：
◦ Export 作业导出 Parquet 格式时，仅支持 Gzip 压缩
◦ SELECT ... INTO OUTFILE 不支持指定压缩算法
◦ 导出 CSV 格式时，不支持导出带列名的文件格式
◦ Export 作业可通过 compress_type 参数指定 Parquet/ORC 的压缩方式
关于聚合模型（Aggregate Key Model）描述错误的是：
◦ 通过预聚合提前算好聚合结果提升查询性能
◦ 用户建表时定义好聚合字段和聚合类型，自动进行预聚合计算，无需用户手动触发
◦ 支持任意聚合函数
◦ 支持部分列更新
Doris 中用户自定义函数（UDF）部署完成后，需通过哪条语句进行注册：
◦ INSTALL FUNCTION
◦ LOAD FUNCTION
◦ CREATE FUNCTION
◦ REGISTER FUNCTION
以下哪项关于 Apache Doris 的 Broadcast Join 是正确的：
◦ 默认对所有表执行 Broadcast Join
◦ 仅当一张表足够小时，系统自动选择 Broadcast Join
◦ Broadcast Join 仅适用于分布式表之间的连接
◦ Doris 不支持 Broadcast Join
Iceberg Catalog 支持哪种表历史回溯查询：
◦ Snapshot History
◦ 用户操作日志
◦ 元数据同步
◦ 列级权限
倒排索引不支持下面哪种能力：
◦ 文本字段分词和全文检索
◦ 加速数值和日期时间类型的等值、范围查询
◦ 短语查询 MATCH_PHRASE 支持指定词距 slop
◦ 全文检索关键词高亮
下列关于升级前置准备，哪一项是不正确的：
◦ 明确待升级版本及其功能特性
◦ 评估升级必要性
◦ 预先在测试环境验证升级并观察
◦ 选择任意时间点进行升级
下列关于集群管控工具 Manager 的说法，哪一项是不正确的：
◦ 可以进行升级和扩缩容
◦ 可以监控集群运行时的状态
◦ 可以下载指定的日志文件到本地
◦ 可以发送集群异常的告警
关于明细模型（Duplicate Key）中批量删除数据的操作，以下说法正确的是：
◦ 支持按任意条件执行 DELETE 语句，且删除后立即释放磁盘空间
◦ 需通过删除整个分区实现，无法删除分区内的部分数据
◦ 执行 DELETE 语句后，数据会被标记为删除，物理清理在后台进行
◦ 必须先暂停所有导入任务才能执行删除操作
创建 Iceberg Catalog 时，必须指定操作属性的是哪一个：
◦ type、warehouse 和 uri
◦ fs.defaultFS 和 hive.version
◦ trino.connector.name
◦ lakesoul.pg.url
Doris 访问 Hive Catalog 中的数据时，默认使用哪种方式进行文件读取：
◦ 使用 HiveServer2
◦ 使用 Doris BE 原生读取
◦ 使用 HDFS 命令行工具
◦ 使用 Spark 作为中间层
关于 Apache Doris Export 作业的 timeout 参数，以下描述正确的是：
◦ 用于设置导出文件的保存时长，超时后自动删除
◦ 控制作业的最大执行时间，超时时未完成则任务失败
◦ 仅对导出到 HDFS 的作业有效，对本地导出无效
◦ 默认值为 24 小时，且不可自定义修改
下面哪一个不是 Apache Doris 支持的表模型：
◦ 明细模型（Duplicate Key Model）
◦ 主键模型（Unique Key Model）
◦ 外键模型（Foreign Key Model）
◦ 聚合模型（Aggregate Key Model）
关于 Apache Doris 的 Stream Load 导入 JSON 格式数据，以下说法正确的是：
◦ Stream Load 不支持 JSON 格式，仅支持 CSV 格式
◦ 导入 JSON 数据时，需通过 format = "json" 指定格式，并通过 jsonpaths 配置字段映射
◦ JSON 数据必须与表结构字段顺序完全一致，否则导入失败
◦ 导入 JSON 数组格式数据时，无需任何额外配置即可自动解析
关于 Doris 的子查询支持，以下说法正确的是：
◦ 仅支持在 WHERE 子句中嵌套子查询
◦ 子查询不能嵌套聚合函数
◦ 支持关联子查询
◦ 不支持任何子查询
使用 Compute Nodes 处理外部表查询时，应将 FE 中的哪个配置设置为 true：
◦ prefer_compute_node_for_external_table
◦ min_backend_num_for_external_table
◦ be_node_role=computation
◦ external_table_compute
使用 SELECT ... INTO OUTFILE 导出数据时，若需指定导出文件的编码为 GBK，正确的配置方式是：
◦ 在语句中添加 ENCODING = 'GBK' 子句
◦ 通过 set character_set_results = gbk 会话参数设置
◦ 该语句不支持指定编码，默认只能导出 UTF-8 格式
◦ 在 fe.conf 中配置 default_export_encoding = gbk
下列关于升级检测的说法，哪一项是不正确的：
◦ 警告类型的检测项不影响继续升级
◦ 可以跳过此步骤，不做检测而继续升级
◦ 可以获取到警告类型检测项的详细信息
◦ 有错误类型的检测项则无法继续升级
以下哪种情况最适合使用物化视图：
◦ 频繁更新的明细表
◦ 查询只涉及单表无聚合
◦ 多维度聚合且查询模式固定
◦ 数据量较小、查询次数极少的表
Apache Doris 中的 UDF 需满足什么条件：
◦ 必须以 Python 实现
◦ 只能部署在 FE 节点
◦ 必须打包为 Jar 并注册后使用
◦ 仅在 LOAD 数据过程中使用
以下哪项不是 File Cache 在使用 Hive/Iceberg 查询时的优化效果：
◦ 避免频繁拉取远端文件
◦ 降低 I/O 等待时间
◦ 减少 FE 的线程数
◦ 提高重复查询性能
在 Apache Doris 中，对于主键模型（Unique Key），若需从 Merge on Read (MOR) 模式切换为 Merge on Write (MOW) 模式，正确的操作是：
◦ 直接通过 ALTER TABLE 语句修改表属性（如 PROPERTIES ("merge_on_write" = "true")）
◦ 必须重建表并指定 MOW 模式，无法直接切换
◦ 导入数据时通过参数指定模式，无需修改表结构
◦ 升级到 2.1 版本后，就会自动变成 MOW 模式
在集群管控工具 Manager 页面上，哪一项是可以直接看到的：
◦ 集群中各节点占用最多 CPU 资源的进程
◦ 集群中各节点的硬盘使用率
◦ 集群中各表的模型
◦ 集群中各节点占用最多内存资源的进程
以下哪项不是 Apache Doris 的集群连接方式：
◦ 通过 MySQL Client 的方式连接
◦ 通过 MySQL 客户端工具（Navicat、DBeaver）的方式连接
◦ 通过 SSH 隧道直接访问 BE 的方式连接
◦ 通过 JDBC/ODBC 的方式连接
当 Catalog 中的 include_database_list 与 exclude_database_list 冲突时，哪个优先：
◦ include_database_list
◦ exclude_database_list
◦ 按字母排序优先
◦ 随机选择
关于主键模型（Unique Key Model）描述错误的是：
◦ 支持主键去重和 UPSERT 语义
◦ 只支持整行更新，不支持部分列更新
◦ 支持两种模式：写时合并（Merge-on-Write）和读时合并（Merge-on-Read）
◦ 支持高频更新操作

posted @ 2025-08-28 03:27 PRdE 阅读(99) 评论(0) 收藏举报

刷新页面返回顶部

PHub

随手记

【考试认证】Apache Doris 和 SelectDB 初级认证考试

公告