会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
夕阳如火
博客园
首页
新随笔
联系
订阅
管理
[置顶]
python 科比投篮数据可视化及简单分析
摘要: 数据来源:https://www.kaggle.com/c/kobe-bryant-shot-selection/data 参考:https://blog.csdn.net/qq_41888542/article/details/80390900 1.导包 2.读取文件 #设置字体 mpl.rcPa
阅读全文
posted @ 2018-07-21 15:44 夕阳如火
阅读(6664)
评论(0)
推荐(0)
2019年5月17日
spark 插入数据到mysql时遇到的问题 org.apache.spark.SparkException: Task not serializable
摘要: 使用的时候用rdd调用就可以
阅读全文
posted @ 2019-05-17 12:39 夕阳如火
阅读(674)
评论(0)
推荐(0)
2019年4月19日
Linux编译安装python3
摘要: 到python官网下载python3.5.7 https://www.python.org/downloads/release/python-357/ 将文件传到linux上,通过tar指令解压,重命名为python3,这样安装的话,压缩文件在哪里,解压后的文件就会在哪里。可以在python3前面加
阅读全文
posted @ 2019-04-19 14:23 夕阳如火
阅读(2357)
评论(0)
推荐(0)
爬取基于Flex技术的网站数据
摘要: 参考:https://github.com/LouisYZK/ShiXi_inWuhan/tree/master/1.23 Flex技术是网站运用flash方法与客户端进行数据通信,数据的格式可以是txt,json或amf等。 AMF是一种二进制编码方式,其在flash传输效率高,以农业信息网数据为
阅读全文
posted @ 2019-04-19 10:10 夕阳如火
阅读(2229)
评论(0)
推荐(0)
2019年4月17日
转:MySQL到Greenplum迁移分析
摘要: greenplum
阅读全文
posted @ 2019-04-17 11:14 夕阳如火
阅读(2702)
评论(0)
推荐(0)
2019年4月2日
Greenplum基本介绍
摘要: greenplum简介 GreenPlum是面向数据仓库应用的关系型数据库,基于PostgreSQL开发,跟PostgreSQL的兼容性非常好,大部分PostgreSQL客户端工具及PostgreSQL应用都能运行在GreenPlum平台上。想要学习GreenPlum,可以先看一看PostgreSQ
阅读全文
posted @ 2019-04-02 16:16 夕阳如火
阅读(40990)
评论(1)
推荐(4)
2018年10月26日
Hive on Spark
摘要: 一、版本如下 注意:Hive on Spark对版本有着严格的要求,下面的版本是经过验证的版本 a) apache-hive-2.3.2-bin.tar.gz b) hadoop-2.7.2.tar.gz c) jdk-8u144-linux-x64.tar.gz d) mysql-5.7.19-1
阅读全文
posted @ 2018-10-26 11:15 夕阳如火
阅读(3495)
评论(1)
推荐(0)
Flume可分布式日志收集系统
摘要: Flume 1. 前言 flume是由cloudera软件公司产出的可分布式日志收集系统,后与2009年被捐赠了apache软件基金会,为hadoop相关组件之一。尤其近几年随着flume的不断被完善以及升级版本的逐一推出,特别是flume-ng;同时flume内部的各种组件不断丰富,用户在开发的过
阅读全文
posted @ 2018-10-26 11:05 夕阳如火
阅读(405)
评论(0)
推荐(0)
Redis高性能内存数据库
摘要: (一)什么是Redis? Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。与Memcached一样,为了保证效
阅读全文
posted @ 2018-10-26 10:00 夕阳如火
阅读(9011)
评论(0)
推荐(0)
2018年10月25日
Kafka 分布式发布-订阅消息系统
摘要: 1. Kafka 概述 1.1什么是 Kafka Apache Kafka 是分布式发布-订阅消息系统(消息中间件)。它最初由 LinkedIn 公司开发,之后成为 Apache 项目的一部分。Kafka 是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。 简单说明什么是Ka
阅读全文
posted @ 2018-10-25 15:23 夕阳如火
阅读(3684)
评论(0)
推荐(0)
Spark学习之Spark Streaming
摘要: Spark Streaming实时数据流处理 一、Spark Streaming基础 1、Spark Streaming简介http://spark.apache.org/docs/latest/streaming-programming-guide.html Spark Streaming是核心S
阅读全文
posted @ 2018-10-25 14:23 夕阳如火
阅读(980)
评论(0)
推荐(1)
下一页
公告