摘要: 1Hive简介 Hive对我来说就是一个基于HDFS的数据仓库,它提供了一个种类SQL语言(和SQL标准基本一样又有一些特殊的地方不一样),能让不精通Java语言而熟悉SQL语言的工程师,快速的对HDFS或其他存储文件系统如Amazon,S3,上的数据进行数据分析,是Hadoop生态系统中非常重要的 阅读全文
posted @ 2019-05-03 10:20 才千5贝 阅读(2208) 评论(0) 推荐(0) 编辑
摘要: 1用python做数据分析,数据来源一般会有多种格式,而我喜欢以CSV的方式进行存储分析,如果数据本身就是CSV格式的那我可以直接用pandas库自带的方法进行读取即可,但是有时候各种来源的数据不方便用pandas进行直接分析处理,所以就有了一个通用的读写CSV文件的方法。 2.有时候文件是txt或 阅读全文
posted @ 2019-05-02 20:49 才千5贝 阅读(1208) 评论(0) 推荐(0) 编辑
摘要: python时间模块小结 阅读全文
posted @ 2019-04-28 21:35 才千5贝 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 权游八第二集里SAM说了一段话:一个人的死去是从最后一个怀有他记忆的人的死去开始的。不错,此时你与世间的所有羁绊都被斩断,再也没有人们把你记起,此时才是你真的死亡。除了记忆我们也可以选择留下一些什么,来记录自己的足迹。 经朋友推荐,决定将博客从CSDN转战到博客园。主要经营一下内容: 1.pytho 阅读全文
posted @ 2019-04-27 13:13 才千5贝 阅读(193) 评论(0) 推荐(0) 编辑