上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 49 下一页
摘要: 1.1 例子,美国 1880 - 2014 年新生婴儿数据统计 目标:用美国 1880 - 2014 年新生婴儿的数据来做做简单的统计 数据源: https://catalog.data.gov 数据格式: 每年的新生婴儿数据在一个文件里面 每个文件的每一条数据格式:姓名,性别,新生人数 每年的新生 阅读全文
posted @ 2018-01-05 14:40 daniel456 阅读(13289) 评论(2) 推荐(4)
摘要: 0.spark简介 Spark是整个BDAS的核心组件,是一个大数据分布式编程框架,不仅实现了MapReduce的算子map 函数和reduce函数及计算模型,还提供更为丰富的算子,如filter、join、groupByKey等。是一个用来实现快速而同用的集群计算的平台。Spark将分布式数据抽象 阅读全文
posted @ 2018-01-05 14:38 daniel456 阅读(4105) 评论(0) 推荐(0)
摘要: 这里需要注意的是,以下两种写法实现的是完全不一样的功能: Example showing why foo(_) and foo _ are different: In the first case, process _ represents a method; Scala takes the pol 阅读全文
posted @ 2018-01-05 14:35 daniel456 阅读(975) 评论(0) 推荐(0)
摘要: 作为windows下的spark开发环境 1.应用安装 首先安装好idea2017 java8 scalaJDK spark hadoop(注意scala和spark的版本要匹配) 2.打开idea,创建建maven项目,如图所示 项目创建好后,记得勾选maven auto upate选项,这个动作 阅读全文
posted @ 2018-01-05 14:26 daniel456 阅读(2345) 评论(0) 推荐(1)
摘要: Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络,抛砖引玉,引出读者对这个话题的深入探讨。本文中阐述的原理基于 Spar 阅读全文
posted @ 2018-01-05 14:23 daniel456 阅读(10414) 评论(4) 推荐(4)
摘要: 一、 关于Apache Spark Apache Spark是个开源和兼容Hadoop的集群计算平台。由加州大学伯克利分校的AMPLabs开发,作为Berkeley Data Analytics Stack(BDAS)的一部分,当下由大数据公司Databricks保驾护航,更是Apache旗下的顶级 阅读全文
posted @ 2018-01-05 14:18 daniel456 阅读(290) 评论(0) 推荐(0)
摘要: http://www.runoob.com/scala/scala-tutorial.html 阅读全文
posted @ 2018-01-05 10:20 daniel456 阅读(118) 评论(0) 推荐(0)
摘要: 分布式锁的一点理解 什么是锁 在单进程的系统中,当存在多个线程可以同时改变某个变量(可变共享变量)时,就需要对变量或代码块做同步,使其在修改这种变量时能够线性执行消除并发修改变量。 而同步的本质是通过锁来实现的。为了实现多个线程在一个时刻同一个代码块只能有一个线程可执行,那么需要在某个地方做个标记, 阅读全文
posted @ 2018-01-04 16:27 daniel456 阅读(263) 评论(0) 推荐(0)
摘要: Redis为单进程单线程模式,采用队列模式将并发访问变为串行访问。Redis本身没有锁的概念,Redis对于多个客户端连接并不存在竞争,但是在Jedis客户端对Redis进行并发访问时会发生连接超时、数据转换错误、阻塞、客户端关闭连接等问题,这些问题均是由于客户端连接混乱造成。对此有2种解决方法:1 阅读全文
posted @ 2018-01-04 16:22 daniel456 阅读(7152) 评论(1) 推荐(0)
摘要: redis是单线程,但是一般的作为缓存使用的话,redis足够了,因为它的读写速度太快了。 官方的一个简单测试: 测试完成了50个并发执行100000个请求。 设置和获取的值是一个256字节字符串。 结果:读的速度是110000次/s,写的速度是81000次/s 在这么快的读写速度下,对于一般程序来 阅读全文
posted @ 2018-01-04 15:45 daniel456 阅读(362) 评论(0) 推荐(0)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 49 下一页