oss使用

1.使用OSS作为文件服务器,保存一些常用的资料

开通方法就不说了,主要是linux系统上传和下载相关内容

首先,需要安装客户端

https://help.aliyun.com/document_detail/50452.html?spm=a2c4g.11186623.6.841.82037f85BWlPVt

wget http://gosspublic.alicdn.com/ossutil/1.6.19/ossutil64 

需要进行配置:
./ossutil64 config

endpoint=oss-cn-beijing.aliyuncs.com
accessKeyID=
accessKeySecret=

接着就通过命令操作就行,和linux文件基本操作一样

[hadoop@hadoop-001 test]$ sudo ./ossutil64  ls oss://eric-doc/
LastModifiedTime                   Size(B)  StorageClass   ETAG                                  ObjectName
2020-10-14 14:41:02 +0800 CST    197657687      Standard   F6BEE933AEE535CD6F80422A2D7FCF6D-78   oss://eric-doc/hadoop
-2.7.2.tar.gzObject Number is: 1

0.032499(s) elapsed
[hadoop@hadoop-001 test]$ sudo ./ossutil64 cp oss://eric-doc/hadoop-2.7.2.tar.gz /opt/test/
Succeed: Total num: 1, size: 197,657,687. OK num: 1(download 1 objects).                                     

average speed 13658000(byte/s)

14.472077(s) elapsed
[hadoop@hadoop-001 test]$ 

  

2.数据保存在OSS上,Maxcompute使用外部表的方式进行访问

外表表

create external table [if not exists] <mc_oss_extable_name>
(
<col_name> <data_type>,
...
)
[partitioned by (<col_name> <data_type>, ...)]
--指定内置的Extractor。
stored by '<StorageHandler>' 
--指定外部表相关参数。
with serdeproperties (
 'odps.properties.rolearn'='<ram_arn>'
--OSS文件为GZIP压缩格式时需要配置。
 [,'odps.text.option.gzip.input.enabled'='true']
--其他OSS外部表相关属性,根据实际需要配置。
 [,'<property_name>'='<property_value>'[,'<property_name>'='<property_value>'...]]
) 
location '<oss_location>';

  

其中serdeproperties,指序列化/反序列化的属性

SerDe是序列化/反序列化的简写形式,其作用是将一条非结构化字节转化成Hive/MaxCompute可以使用的一条记录。

我们举例介绍一下常见SerDe:
RegexSerDe
CSVSerde/TSVSerde
JsonSerde
AvroSerDe
LazySimpleSerDe
......

posted @ 2020-10-14 15:31  酸奶加绿茶  阅读(329)  评论(0编辑  收藏  举报