帆软FineBI 接入 Cloudera CDH、CMP、CDP技术条件和配置步骤(Cloud Data AI Platform,类Cloudera CDP,如华为鲲鹏 ARM 版)

 

FineBI 可以接入 Cloudera CDH(Cloudera’s Distribution Including Apache Hadoop,但需要满足一定的技术条件和配置步骤。以下是详细说明:


一、支持的 CDH 组件

FineBI 主要通过 JDBC/ODBC 接口连接 CDH 中的以下计算引擎:

CDH 组件

是否支持

连接方式

推荐度

Apache Impala

✅ 完全支持

JDBC(推荐)

⭐⭐⭐⭐⭐(高性能,低延迟)

Apache Hive

✅ 支持

JDBC(HiveServer2)

⭐⭐⭐(适合批量查询)

HDFS(直接)

❌ 不支持

需通过 Hive/Impala 查询

HBase

⚠️ 间接支持

需通过 Phoenix 或自定义 API

📌 强烈建议使用 Impala:因其 MPP 架构,查询速度远快于 Hive,更适合 BI 工具的交互式分析场景。


二、连接前提条件

  • CDH 集群已启用 HiveServer2 或 Impala Daemon
    • 确保服务端口开放(默认:Hive 10000,Impala 21050)
  • 获取对应 JDBC 驱动
    • Impala:使用 Cloudera 官方 Impala JDBC Driver
    • Hive:使用 hive-jdbc-<version>.jar(通常随 CDH 自带)
  • 网络连通性
    • FineBI 服务器能访问 CDH 集群的 Hive/Impala 节点
  • 认证方式
    • 若 CDH 未启用 Kerberos:可直接用户名/密码连接(如 user: hive, password: "")
    • 若 启用 Kerberos:需额外配置(见下文)

三、配置步骤(以 Impala 为例)

步骤 1:下载并放置 JDBC 驱动

  • 从 Cloudera 官网下载 Impala JDBC Driver(含 ImpalaJDBC42.jar 等)
  • 将驱动 JAR 文件放入 FineBI 的驱动目录:

Text

编辑

1{FineBI安装目录}/webapps/webroot/WEB-INF/lib/

  • 重启 FineBI 服务

步骤 2:在 FineBI 中新建数据连接

  • 登录 FineBI →「数据准备」→「新建数据连接」
  • 选择数据库类型:其他” → “通用 JDBC”
  • 填写连接信息:
    • 驱动类名:com.cloudera.impala.jdbc42.Driver
    • JDBC URL

Text

编辑

1jdbc:impala://<impala-coordinator-host>:21050/default;AuthMech=3;UID=hive;PWD=

注:AuthMech=3 表示无 Kerberos 的简单认证;若用 Kerberos 则不同。

    • 用户名/密码:根据 CDH 配置填写(如 hive / 空)
  • 点击「测试连接」→ 成功后保存

步骤 3:同步表结构 & 创建仪表板

  • 选择所需数据库和表
  • 拖入自助数据集进行建模
  • 制作可视化图表

🔐 四、Kerberos 认证支持(关键!)

如果 CDH 启用了 Kerberos 安全认证,FineBI 6.0.2 及以上版本原生支持 Kerberos,操作如下:

  • 在 FineBI 数据连接界面:
    • 选择 “Hive” 或 “Impala” 类型(非“通用 JDBC”)
    • 认证方式切换为 “Kerberos”
  • 上传两个文件:
    • krb5.conf:Kerberos 客户端配置
    • xxx.keytab:服务账号密钥文件(如 finebi.keytab)
  • 填写 Principal(如 finebi@YOUR-REALM.COM)
  • 测试连接

⚠️ 注意事项:

  • FineBI 服务器时间必须与 KDC 时间差 < 5 分钟
  • hosts 文件需正确解析 CDH 节点主机名
  • JDK 需安装 JCE 无限强度策略(否则可能报错 Unable to obtain Principal Name)

五、实际应用案例

  • 某大型制造企业:通过 FineBI 连接 CDH 6.3 的 Impala,实现生产日志实时分析,报表生成从 1 天缩短至 10 分钟。
  • 金融机构:在 Kerberos 安全环境下,FineBI 7.0 接入 Hive,融合 CRM 与风控数据,满足等保审计要求。

常见问题排查

问题

解决方案

ClassNotFoundException

驱动 JAR 未放对位置或版本不匹配

Could not open client transport

网络不通 / 端口未开放 / 主机名无法解析

Kerberos 连接失败

检查 keytab、principal、时间同步、hosts 配置

查询慢

改用 Impala;避免 SELECT *;优化 Hive 表分区


总结

FineBI 完全支持接入 Cloudera CDH,推荐通过 Impala JDBC 方式连接。

  • 无 Kerberos:配置简单,10 分钟内可完成
  • 有 Kerberos:FineBI 6.0.2+ 提供前端文件上传支持,无需改 JVM 参数

 

posted on 2025-12-04 18:56  肥仔鱼Liam  阅读(22)  评论(0)    收藏  举报