摘要:
Hive表导出成csv文件 hive -e " set hive.cli.print.header=true; #将表头输出 select * from data_table where some_query_conditions " | sed 's/[\t]/,/g' > hhd.csv set
阅读全文
posted @ 2021-11-09 10:32
架构艺术
阅读(791)
推荐(0)
摘要:
按照sklearn库 C:\Users\jason> pip install sklearn
阅读全文
posted @ 2021-11-05 17:00
架构艺术
阅读(28)
推荐(0)
摘要:
%matplotlib inline 是一个魔法函数(Magic Functions)。 官方给出的定义是:IPython有一组预先定义好的所谓的魔法函数(Magic Functions),你可以通过命令行的语法形式来访问它们。可见“%matplotlib inline”就是模仿命令行来访问magi
阅读全文
posted @ 2021-10-30 16:12
架构艺术
阅读(811)
推荐(0)
摘要:
#!/bin/bash master="yarn-cluster" current=`cd $(dirname $0)/../;pwd` yarn application -kill `yarn application -list | grep HwSwOneMinJob | awk '{print
阅读全文
posted @ 2021-10-27 16:38
架构艺术
阅读(306)
推荐(0)
摘要:
在idea上测试有效: pom.xml打包 <build> <sourceDirectory>src/main/scala</sourceDirectory> <testSourceDirectory>src/test/scala</testSourceDirectory> <resources>
阅读全文
posted @ 2021-10-27 16:33
架构艺术
阅读(285)
推荐(0)
摘要:
Ctrl 快捷键 介绍 Ctrl + F 在当前文件进行文本查找 (必备) Ctrl + R 在当前文件进行文本替换 (必备) Ctrl + Z 撤销 (必备) Ctrl + Y 删除光标所在行 或 删除选中的行 (必备) Ctrl + X 剪切光标所在行 或 剪切选择内容 Ctrl + C 复制光
阅读全文
posted @ 2021-10-26 18:34
架构艺术
阅读(35)
推荐(0)
摘要:
一、环境准备 ps:必须注意版本:python3.5.x 和spark1.6、spark2.2才兼容。 1、python下载 https://www.python.org/downloads/windows/ 下载windows的执行安装包python3.5,按提示安装好,打开python3.5的目
阅读全文
posted @ 2021-10-23 17:36
架构艺术
阅读(348)
推荐(0)
摘要:
-- 1、Doris建表 use dim;CREATE TABLE IF NOT EXISTS `dim_tab_name` ( `inc_day` date NULL COMMENT "日期(分区)" ,`dept_code` varchar(100) NULL COMMENT "网点代码" ,`
阅读全文
posted @ 2021-10-20 11:06
架构艺术
阅读(2531)
推荐(0)
摘要:
matplotlib可视化库 接口文档 https://matplotlib.org/stable/api/pyplot_summary.html 1、失业率数据 import pandas as pd unrate = pd.read_csv('unrate.csv')# pd.to_dateti
阅读全文
posted @ 2021-10-08 20:15
架构艺术
阅读(174)
推荐(0)
摘要:
1、从csv读取数据,生成DataFrame import pandas as pd from pandas import Series import numpy as np #从csv文件中读取数据,生成DataFrame fandango = pd.read_csv('G:\\python\\库
阅读全文
posted @ 2021-10-08 16:24
架构艺术
阅读(936)
推荐(0)