【考试认证】Apache Doris 和 SelectDB 初级认证考试

  1. 下列关于 Apache Doris 的特性描述中,哪一项是不正确的:
    ◦ Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库
    ◦ Apache Doris 数据库具有存算一体和存算分离的两种架构模式
    ◦ Apache Doris 数据库不是一个具备行列混合存能力的数据
    ◦ Apache Doris 能够兼容标准的 MySQL 协议
  2. 在集群管控工具 Manager 页面上,哪一项是看不到的:
    ◦ 集群中所有的用户及其权限
    ◦ 集群中 FE 和 BE 的节点数
    ◦ Catalog 数量以及 Internal 库的数量
    ◦ 当前集群数据的存储使用量
  3. 下列关于使用 Manager 集群告警的相关说法,哪一项是正确的:
    ◦ 无法选择告警等级
    ◦ 无法导入已有的告警策略
    ◦ 告警触发条件的触发逻辑来自监控页面
    ◦ 告警触发条件可以是多个条件的“或”逻辑
  4. 关于分区桶下面哪一项是正确的:
    ◦ 分桶是第一级,分区是第二级
    ◦ 目前支持 HASH 分桶和 RANDOM 分桶
    ◦ 分桶数必须手动指定
    ◦ 分桶键必须是表的 KEY 列
  5. 下面哪个数据类型是 Apache Doris 不支持的:
    ◦ BOOLEAN
    ◦ STRING
    ◦ BINARY
    ◦ VARIANT
  6. Doris 中执行聚合分析时,GROUP BY 子句支持以下哪类表达式:
    ◦ 函数调用
    ◦ 列别名
    ◦ 子查询
    ◦ 临时表变量
  7. 下列关于巡检的说法,哪一项是不正确的:
    ◦ Manager 工具支持定期对集群做巡检
    ◦ 巡检结果可以发送到企业微信、飞书群、钉钉群等
    ◦ 可以查看巡检内容的详细说明
    ◦ 巡检时发现不正确的结果,可以一键修复
  8. 关于 Apache Doris 索引的描述哪一项是错误的:
    ◦ 支持点查询和跳数索引
    ◦ 支持全局索引和局部索引
    ◦ 内置前缀索引和 ZoneMap 索引
    ◦ 支持倒排索引和 Ngram 索引
  9. 下列关于 Manager 工具扩容操作的说法,哪一项是正确的:
    ◦ 针对 BE,无法扩容计算节点
    ◦ 可以批量扩容 FE 和 BE 节点
    ◦ 针对 FE,扩容时无法选择 Observer 角色
    ◦ Manager 不会检查待扩容机器的环境
  10. 通过 Doris Manager 部署集群是,“接管”模式适用于以下哪种场景:
    ◦ 全新安装 Doris 集群
    ◦ 仅部署 FE 节点
    ◦ 集群已部署,用 Manager 管理现有集群
    ◦ 仅部署 BE 节点
  11. 关于 Apache Doris 的 Routine Load 消费 Kafka 数据时的 offset 处理,以下说法正确的是:
    ◦ 仅支持从 Kafka 分区的最新 offset 开始消费
    ◦ 若导入任务失败,重启后会自动从上次成功的 offset 继续消费
    ◦ 必须手动指定每个 Kafka 分区的起始 offset
    ◦ 创建后无法再调整 Kafka 分区的 offset,必须要重建创建任务
  12. Iceberg Catalog 支持快照查询(Snapshot Query),其主要用途是:
    ◦ 加快表速度
    ◦ 降低元数据大小
    ◦ 精确回溯数据历史状态
    ◦ 增加行级权限
  13. 以下哪项命令可以检查机器的 CPU 指令集是不是支持 avx2:
    cat /proc/cpuinfo | grep avx2
    cat /etc/security/limits.conf | grep avx2
    cat /etc/sysctl.conf | grep avx2
    cat /proc/version | grep avx2
  14. 下列关于监控看板的说法,哪一项是不正确的:
    ◦ 可以详细查看某一个看板的数据
    ◦ 可以根据监控看板找到提交大查询的用户
    ◦ 可以制作自己所需的看板
    ◦ 可以编辑当前看板的展示逻辑
  15. 在 Apache Doris 中,多表的物化视图自动更新的机制是:
    ◦ 必须手动刷新
    ◦ 实时同步更新
    ◦ 异步增量更新,由系统自动完成
    ◦ 每天凌晨自动刷新一次
  16. 以下哪项是使用 Hive Catalog 时可以有效提升查询性能的做法:
    ◦ 开启 BE 层缓存
    ◦ 修改 FE 的内存上限
    ◦ 使用 Internal Catalog
    ◦ 禁用 SQL Cache
  17. 下面哪一种分区是 Apache Doris 不支持的:
    ◦ RANGE 分区
    ◦ LIST 分区
    ◦ NULL 分区
    ◦ HASH 分区
  18. 在 Stream Load 导入中,关于 max_batch_rows 参数的作用,正确的是:
    ◦ 限制单次导入的最大文件大小
    ◦ 控制导入数据时每个批次处理的最大行数
    ◦ 设定导入任务的超时时间(单位:秒)
    ◦ 规定导入数据中允许的最大错误行数
  19. Apache Doris 中进行多维分析 ROLLUP 时,正确的语法是:
    GROUP BY ROLLUP(column1, column2)
    GROUP BY GROUPING SETS(column1, column2)
    ROLLUP BY column1, column2
    GROUPING((column1), (column2))
  20. 以下关于 Apache Doris 的部署方式,哪一项是不正确的:
    ◦ 通过手动部署的方式部署
    ◦ 通过 Yum 源的方式来部署
    ◦ 通过 Doris Manager 可视化工具的方式来部署
    ◦ 通过 Kubernetes 容器化的方式部署
  21. 手动部署 Apache Doris 时,启动第二个 FE 时首次需指定下列哪个参数:
    --daemon
    --priority_networks
    --meta_dir
    --helper
  22. 在聚合模型(Aggregate Key)中,若某列同时配置了 SUM 和 MAX 聚合函数,会发生什么情况:
    ◦ 创建表失败,因一列只能指定一个聚合函数
    ◦ 优先执行 SUM 函数,忽略 MAX 函数
    ◦ 系统自动选择更适合的聚合函数(数值型选 SUM,字符型选 MAX)
    ◦ 按建表时定义的第一个聚合函数执行,其余函数失效
  23. 下列关于监控的说法,哪一项是正确的:
    ◦ 查看 Manager 的监控看板时无法调整时间范围
    ◦ 如果有 Insert 操作,则可以看到各 Insert 操作的详细资源使用信息
    ◦ 如果有查询操作,则可以看到各查询操作的详细资源使用信息
    ◦ 集群的监控信息是由 Prometheus 采集,在 Grafana 上展示的
  24. 下列关于 S3 Load 导入权限配置的描述,错误的是:
    ◦ 支持 S3 协议的服务(如 AWS S3、阿里云 OSS)可直接使用 S3 Load 导入
    ◦ 若 S3 存储桶开启了版本控制,S3 Load 会自动导入所有版本的的文件
    ◦ 需确保 Apache Doris 集群节点网络可访问 S3 服务的 endpoint
    ◦ 可通过 s3.access_keys3.secret_key 参数在导入语句中指定密钥
  25. 以下关于 Apache Doris 数据导出时压缩格式的支持,正确的是:
    ◦ Export 作业导出 Parquet 格式时,仅支持 Gzip 压缩
    SELECT ... INTO OUTFILE 不支持指定压缩算法
    ◦ 导出 CSV 格式时,不支持导出带列名的文件格式
    ◦ Export 作业可通过 compress_type 参数指定 Parquet/ORC 的压缩方式
  26. 关于聚合模型(Aggregate Key Model)描述错误的是:
    ◦ 通过预聚合提前算好聚合结果提升查询性能
    ◦ 用户建表时定义好聚合字段和聚合类型,自动进行预聚合计算,无需用户手动触发
    ◦ 支持任意聚合函数
    ◦ 支持部分列更新
  27. Doris 中用户自定义函数(UDF)部署完成后,需通过哪条语句进行注册:
    INSTALL FUNCTION
    LOAD FUNCTION
    CREATE FUNCTION
    REGISTER FUNCTION
  28. 以下哪项关于 Apache Doris 的 Broadcast Join 是正确的:
    ◦ 默认对所有表执行 Broadcast Join
    ◦ 仅当一张表足够小时,系统自动选择 Broadcast Join
    ◦ Broadcast Join 仅适用于分布式表之间的连接
    ◦ Doris 不支持 Broadcast Join
  29. Iceberg Catalog 支持哪种表历史回溯查询:
    ◦ Snapshot History
    ◦ 用户操作日志
    ◦ 元数据同步
    ◦ 列级权限
  30. 倒排索引不支持下面哪种能力:
    ◦ 文本字段分词和全文检索
    ◦ 加速数值和日期时间类型的等值、范围查询
    ◦ 短语查询 MATCH_PHRASE 支持指定词距 slop
    ◦ 全文检索关键词高亮
  31. 下列关于升级前置准备,哪一项是不正确的:
    ◦ 明确待升级版本及其功能特性
    ◦ 评估升级必要性
    ◦ 预先在测试环境验证升级并观察
    ◦ 选择任意时间点进行升级
  32. 下列关于集群管控工具 Manager 的说法,哪一项是不正确的:
    ◦ 可以进行升级和扩缩容
    ◦ 可以监控集群运行时的状态
    ◦ 可以下载指定的日志文件到本地
    ◦ 可以发送集群异常的告警
  33. 关于明细模型(Duplicate Key)中批量删除数据的操作,以下说法正确的是:
    ◦ 支持按任意条件执行 DELETE 语句,且删除后立即释放磁盘空间
    ◦ 需通过删除整个分区实现,无法删除分区内的部分数据
    ◦ 执行 DELETE 语句后,数据会被标记为删除,物理清理在后台进行
    ◦ 必须先暂停所有导入任务才能执行删除操作
  34. 创建 Iceberg Catalog 时,必须指定操作属性的是哪一个:
    typewarehouseuri
    fs.defaultFShive.version
    trino.connector.name
    lakesoul.pg.url
  35. Doris 访问 Hive Catalog 中的数据时,默认使用哪种方式进行文件读取:
    ◦ 使用 HiveServer2
    ◦ 使用 Doris BE 原生读取
    ◦ 使用 HDFS 命令行工具
    ◦ 使用 Spark 作为中间层
  36. 关于 Apache Doris Export 作业的 timeout 参数,以下描述正确的是:
    ◦ 用于设置导出文件的保存时长,超时后自动删除
    ◦ 控制作业的最大执行时间,超时时未完成则任务失败
    ◦ 仅对导出到 HDFS 的作业有效,对本地导出无效
    ◦ 默认值为 24 小时,且不可自定义修改
  37. 下面哪一个不是 Apache Doris 支持的表模型:
    ◦ 明细模型(Duplicate Key Model)
    ◦ 主键模型(Unique Key Model)
    ◦ 外键模型(Foreign Key Model)
    ◦ 聚合模型(Aggregate Key Model)
  38. 关于 Apache Doris 的 Stream Load 导入 JSON 格式数据,以下说法正确的是:
    ◦ Stream Load 不支持 JSON 格式,仅支持 CSV 格式
    ◦ 导入 JSON 数据时,需通过 format = "json" 指定格式,并通过 jsonpaths 配置字段映射
    ◦ JSON 数据必须与表结构字段顺序完全一致,否则导入失败
    ◦ 导入 JSON 数组格式数据时,无需任何额外配置即可自动解析
  39. 关于 Doris 的子查询支持,以下说法正确的是:
    ◦ 仅支持在 WHERE 子句中嵌套子查询
    ◦ 子查询不能嵌套聚合函数
    ◦ 支持关联子查询
    ◦ 不支持任何子查询
  40. 使用 Compute Nodes 处理外部表查询时,应将 FE 中的哪个配置设置为 true
    prefer_compute_node_for_external_table
    min_backend_num_for_external_table
    be_node_role=computation
    external_table_compute
  41. 使用 SELECT ... INTO OUTFILE 导出数据时,若需指定导出文件的编码为 GBK,正确的配置方式是:
    ◦ 在语句中添加 ENCODING = 'GBK' 子句
    ◦ 通过 set character_set_results = gbk 会话参数设置
    ◦ 该语句不支持指定编码,默认只能导出 UTF-8 格式
    ◦ 在 fe.conf 中配置 default_export_encoding = gbk
  42. 下列关于升级检测的说法,哪一项是不正确的:
    ◦ 警告类型的检测项不影响继续升级
    ◦ 可以跳过此步骤,不做检测而继续升级
    ◦ 可以获取到警告类型检测项的详细信息
    ◦ 有错误类型的检测项则无法继续升级
  43. 以下哪种情况最适合使用物化视图:
    ◦ 频繁更新的明细表
    ◦ 查询只涉及单表无聚合
    ◦ 多维度聚合且查询模式固定
    ◦ 数据量较小、查询次数极少的表
  44. Apache Doris 中的 UDF 需满足什么条件:
    ◦ 必须以 Python 实现
    ◦ 只能部署在 FE 节点
    ◦ 必须打包为 Jar 并注册后使用
    ◦ 仅在 LOAD 数据过程中使用
  45. 以下哪项不是 File Cache 在使用 Hive/Iceberg 查询时的优化效果:
    ◦ 避免频繁拉取远端文件
    ◦ 降低 I/O 等待时间
    ◦ 减少 FE 的线程数
    ◦ 提高重复查询性能
  46. 在 Apache Doris 中,对于主键模型(Unique Key),若需从 Merge on Read (MOR) 模式切换为 Merge on Write (MOW) 模式,正确的操作是:
    ◦ 直接通过 ALTER TABLE 语句修改表属性(如 PROPERTIES ("merge_on_write" = "true")
    ◦ 必须重建表并指定 MOW 模式,无法直接切换
    ◦ 导入数据时通过参数指定模式,无需修改表结构
    ◦ 升级到 2.1 版本后,就会自动变成 MOW 模式
  47. 在集群管控工具 Manager 页面上,哪一项是可以直接看到的:
    ◦ 集群中各节点占用最多 CPU 资源的进程
    ◦ 集群中各节点的硬盘使用率
    ◦ 集群中各表的模型
    ◦ 集群中各节点占用最多内存资源的进程
  48. 以下哪项不是 Apache Doris 的集群连接方式:
    ◦ 通过 MySQL Client 的方式连接
    ◦ 通过 MySQL 客户端工具(Navicat、DBeaver)的方式连接
    ◦ 通过 SSH 隧道直接访问 BE 的方式连接
    ◦ 通过 JDBC/ODBC 的方式连接
  49. 当 Catalog 中的 include_database_listexclude_database_list 冲突时,哪个优先:
    include_database_list
    exclude_database_list
    ◦ 按字母排序优先
    ◦ 随机选择
  50. 关于主键模型(Unique Key Model)描述错误的是:
    ◦ 支持主键去重和 UPSERT 语义
    ◦ 只支持整行更新,不支持部分列更新
    ◦ 支持两种模式:写时合并(Merge-on-Write)和读时合并(Merge-on-Read)
    ◦ 支持高频更新操作

img

posted @ 2025-08-28 03:27  PRdE  阅读(31)  评论(0)    收藏  举报