经验 - 随笔分类(第4页) - 匠人先生

大叔经验分享（65）spark读取不到hive表

摘要：spark 2.4.3 spark读取hive表，步骤： 1）hive-site.xml hive-site.xml放到$SPARK_HOME/conf下 2）enableHiveSupport SparkSession.builder.enableHiveSupport().getOrCreate 阅读全文

posted @ 2019-06-01 14:05 匠人先生阅读(5347) 评论(3) 推荐(1)

大叔经验分享（64）cloudera manager agent启动组件进程过程

摘要：概述 The Agent is started by init.d at start-up. It, in turn, contacts the Cloudera Manager Server and determines which processes should be running. The 阅读全文

posted @ 2019-05-28 22:51 匠人先生阅读(1915) 评论(0) 推荐(0)

大叔经验分享（63）kudu vs parquet

摘要：一对比存储空间对比：查询性能对比：二设计方案将数据拆分为：历史数据（hdfs+parquet+snappy）+ 近期数据（kudu），可以兼具各种优点： 1）整体低于10%的磁盘占用； 2）更少的查询耗时； 3）近期数据实时更新； 4）近期数据可修改； 5）kudu集群重启时间降低90% 阅读全文

posted @ 2019-05-27 17:45 匠人先生阅读(1834) 评论(0) 推荐(0)

大叔经验分享（62）kudu副本数量

posted @ 2019-05-27 15:16 匠人先生阅读(2814) 评论(0) 推荐(0)

大叔经验分享（60）hive和spark读取kudu表

摘要：从impala中创建kudu表之后，如果想从hive或spark sql直接读取，会报错： Caused by: java.lang.ClassNotFoundException: com.cloudera.kudu.hive.KuduStorageHandler at java.net.URLCl 阅读全文

posted @ 2019-05-22 18:06 匠人先生阅读(5419) 评论(0) 推荐(1)

大叔经验分享（59）kudu查看table size

摘要：kudu并没有命令可以直接查看每个table占用的空间，可以从cloudera manager上间接查看 CM is scrapping and aggregating the /metrics pages from the tablet server instances for each tabl 阅读全文

posted @ 2019-05-21 20:11 匠人先生阅读(3193) 评论(0) 推荐(0)

大叔经验分享（58）kudu写入压力大时报错

摘要：kudu写入压力大时报错 19/05/18 16:53:12 INFO AsyncKuduClient: Invalidating location fd52e4f930bc45458a8f29ed118785e3(server002:7050) for tablet 4259921cdcca477 阅读全文

posted @ 2019-05-20 20:11 匠人先生阅读(3890) 评论(0) 推荐(0)

大叔经验分享（57）hue启动coordinator时报错

摘要：hue启动coordinator时报错，页面返回undefinied错误框：后台日志报错： runcpserver.log [13/May/2019 04:34:55 -0700] middleware INFO Processing exception: 'NoneType' object ha 阅读全文

posted @ 2019-05-13 19:57 匠人先生阅读(938) 评论(0) 推荐(0)

大叔经验分享（56）hue导出行数限制

摘要：/opt/cloudera/parcels/CDH/lib/hue/apps/beeswax/src/beeswax/conf.py # Deprecated DOWNLOAD_CELL_LIMIT = Config( key='download_cell_limit', default=10000 阅读全文

posted @ 2019-05-13 10:23 匠人先生阅读(1429) 评论(0) 推荐(0)

大叔经验分享（54）flume kudu sink运行一段时间kudu client报错

摘要：flume kudu sink运行一段时间报错： 19/05/05 10:15:56 WARN client.ConnectToCluster: Error receiving a response from: master:7051 org.apache.kudu.client.Recoverab 阅读全文

posted @ 2019-05-06 12:33 匠人先生阅读(1182) 评论(0) 推荐(0)

大叔经验分享（53）kudu报错unable to find SASL plugin: PLAIN

摘要：kudu安装后运行不正常，master中找不到任何tserver，查看tserver日志发现有很多报错： Failed to heartbeat to master:7051: Invalid argument: Failed to ping master at master:7051: Clien 阅读全文

posted @ 2019-04-30 00:21 匠人先生阅读(1503) 评论(0) 推荐(1)

大叔经验分享（52）ClouderaManager修改配置报错

摘要：Cloudera Manager中修改配置可能报错： Incorrect string value: '\xE7\xA8\x8B\xE5\xBA\x8F...' for column 'MESSAGE' at row 1 这是一个mysql的字符集问题，极有可能创建scm数据库时使用默认的latin 阅读全文

posted @ 2019-04-30 00:17 匠人先生阅读(406) 评论(0) 推荐(0)

大叔经验分享（51）docker报错Exited (137)

摘要：docker container启动失败，报错：Exited (137) *** ago，比如 Exited (137) 16 seconds ago 这时通过docker logs查不到任何日志，从mesos上看stderr相关的只有一句 I0409 16:56:26.408077 8583 ex 阅读全文

posted @ 2019-04-09 17:18 匠人先生阅读(25608) 评论(2) 推荐(3)

大叔经验分享（47）yarn开启日志归集

摘要：yarn开启日志归集功能，除了配置之外 yarn.log-aggregation-enable=true 还要检查/tmp/logs目录是否存在以及权限，尤其是在开启kerberos之后，有些目录可能不能自动创建成功，需要手工创建： $ hdfs dfs -mkdir /tmp$ hdfs dfs 阅读全文

posted @ 2019-04-01 11:02 匠人先生阅读(659) 评论(0) 推荐(0)

大叔经验分享（46）用户提交任务到yarn报错

摘要：用户提交任务到yarn时有可能遇到下面的错误： 1） Requested user anything is not whitelisted and has id 980,which is below the minimum allowed 1000 这是因为yarn中配置min.user.id=10 阅读全文

posted @ 2019-03-30 17:12 匠人先生阅读(3415) 评论(0) 推荐(0)

大叔经验分享（44）hdfs副本数量

摘要：当hdfs空间不足时，除了删除临时数据或垃圾数据之外，还可以适当调整部分大目录的副本数量，多管齐下； 1 查看 $ hdfs dfs -ls /user/hive/warehouse/temp.db/test_ext_o-rwxr-xr-x 3 hadoop supergroup 44324200 阅读全文

posted @ 2019-03-25 11:20 匠人先生阅读(1113) 评论(0) 推荐(0)

大叔经验分享（43）logstash设置jdbc_default_timezone后报错

摘要：logstash6.6.0-6.6.2版本使用jdbc input plugin时如果设置了jdbc_default_timezone，会报错： { 2012 rufus-scheduler intercepted an error: 2012 job: 2012 Rufus::Scheduler: 阅读全文

posted @ 2019-03-22 14:53 匠人先生阅读(2134) 评论(0) 推荐(0)

大叔经验分享（42）云主机挖矿病毒现象

摘要：云主机cpu使用率突然很高查看服务器发现异常 1 crontab # crontab -l* * * * * /tmp/.dns/y2kupdate >/dev/null 2>&1 2 iptables # iptables -nLChain INPUT (policy DROP)target p 阅读全文

posted @ 2019-03-16 11:40 匠人先生阅读(790) 评论(0) 推荐(0)

大叔经验分享（40）hdfs关闭kerberos

摘要：hadoop.security.authentication: Kerberos -> Simple hadoop.security.authorization: true -> false dfs.datanode.address: -> from 1004 (for Kerberos) to 5 阅读全文

posted @ 2019-03-15 22:39 匠人先生阅读(718) 评论(0) 推荐(0)

大叔经验分享（41）hdfs开启kerberos之后报错Encryption type AES256 CTS mode with HMAC SHA1-96 is not supported/enabled

摘要：hdfs开启kerberos之后，namenode报错，连不上journalnode 2019-03-15 18:54:46,504 WARN org.apache.hadoop.security.UserGroupInformation: PriviledgedActionException as 阅读全文

posted @ 2019-03-15 22:38 匠人先生阅读(3080) 评论(0) 推荐(0)

Thinking in BigData

匠人先生

随笔分类 - 经验

公告