摘要: 1、Hadoop | 目录 | Hadoop3.x | | | | | 访问HDFS端口 | 50070 | | 访问MR执行情况端口 | 8088 | | 历史服务器 | 19888 | | 客户端访问集群端口 | 9000 | 2、Hive 10002 : hiveservice2服务默认监听端 阅读全文
posted @ 2023-02-04 00:08 半个程序猿Cohen_Lee 阅读(71) 评论(0) 推荐(1) 编辑
摘要: 制定编码: utf_8 --》utf_8_sig 修改后代码code: df.to_csv('data3.csv',index=False,encoding='utf_8_sig') 阅读全文
posted @ 2023-01-26 21:25 半个程序猿Cohen_Lee 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 分享学习一个技术的经验,Java的大体路线是 JavaSE -> Java Web -> Spring -> SSM 整合(Spring+SpringMVC+myBatis) -> SpringBoot -> Spring Cloud. 要想到达最终的Spring boot Spring Cloud 阅读全文
posted @ 2022-11-25 10:50 半个程序猿Cohen_Lee 阅读(23) 评论(0) 推荐(0) 编辑
摘要: ###启动 net start mysql ###连接 mysql -h localhost -u root -p #查看进程命令 ps -aux|grep XXXX #切换用户 su user #本地复制到远程: scp -r localFolderOrFile remoteUser@remote 阅读全文
posted @ 2022-11-12 22:55 半个程序猿Cohen_Lee 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 1.检查http服务是否开启 systemctl status httpd.service 本次没有开启是因为删了Log日志 通过查看http状态发现里面有个引用问题 重新建一个空的Log文件夹重启服务即可 2.启动CDHserver service cloudera-scm-server star 阅读全文
posted @ 2022-10-24 15:07 半个程序猿Cohen_Lee 阅读(157) 评论(0) 推荐(0) 编辑
摘要: ##微软网站 https://community.powerbi.com/t5/Themes-Gallery/bd-p/ThemesGallery ##中国区powerbi比赛网站 http://www.chinapowerbi.com/Index.html 阅读全文
posted @ 2022-10-21 10:33 半个程序猿Cohen_Lee 阅读(211) 评论(0) 推荐(0) 编辑
摘要: note: zepplin BI : 帆软(国产)市场越来越广 superset(开源框架) 阅读全文
posted @ 2022-10-19 11:03 半个程序猿Cohen_Lee 阅读(11) 评论(0) 推荐(0) 编辑
摘要: DolphinScheduler:国产调度平台 airflow: 调度平台 阅读全文
posted @ 2022-09-29 14:40 半个程序猿Cohen_Lee 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 高可用(HA):直白来说就是系统不会因为某台机器,或某个实例挂了,就不能提供服务了。高可用需要做到分布式、负载均衡、自动侦查、自动切换、自动恢复等。 高吞吐: 单位时间内,能传输的数据量,对应指标就是TPS 阅读全文
posted @ 2022-09-26 17:40 半个程序猿Cohen_Lee 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 1)数据倾斜根本原因:由于数据分布不均匀,导致map端读取的数据分布不均匀(数据长尾分布),从而使得map处理的数据量差异过大。 (2)解决思路:Hive是分阶段执行的,map处理数据量的差异取决于上一个stage的reduce输出,所以解决的根本方法就是如何将数据均匀的分布到各个reduce中 ( 阅读全文
posted @ 2022-09-19 22:35 半个程序猿Cohen_Lee 阅读(848) 评论(0) 推荐(0) 编辑