gyhuminyan

2017年11月14日

摘要： 1. 编写一段代码，将a设置为一个n个随机整数的数组，要求随机数介于0(包含)和n(不包含)之间阅读全文

posted @ 2017-11-14 20:02 gyhuminyan 阅读(113) 评论(0) 推荐(0)

2017年11月7日

摘要： streaming 应用程序必须 24/7 运行, 因此必须对应用逻辑无关的故障（例如, 系统故障, JVM 崩溃等）具有弹性. 为了可以这样做, Spark Streaming 需要 checkpoint 足够的信息到容错存储系统, 以便可以从故障中恢复.checkpoint 有两种类型的数据. 阅读全文

posted @ 2017-11-07 16:56 gyhuminyan 阅读(207) 评论(0) 推荐(0)

Spark Performance Tuning （性能调优）

摘要：在集群上的 Spark Streaming application 中获得最佳性能需要一些调整.本节介绍了可调整的多个 parameters （参数）和 configurations （配置）提高你的应用程序性能.在高层次上, 你需要考虑两件事情: 通过有效利用集群资源, Reducing the 阅读全文

posted @ 2017-11-07 15:56 gyhuminyan 阅读(799) 评论(0) 推荐(0)

Spark Memory Tuning （内存调优）

摘要：调整 Spark 应用程序的内存使用情况和 GC behavior 已经有很多的讨论在 Tuning Guide 中.我们强烈建议您阅读一下.在本节中, 我们将在 Spark Streaming applications 的上下文中讨论一些 tuning parameters （调优参数）. Spa 阅读全文

posted @ 2017-11-07 15:33 gyhuminyan 阅读(455) 评论(0) 推荐(0)

Sparkstreaming and Kafka

摘要：简介 Kafka 0.10的Spark Streaming集成设计与0.8 Direct Stream方法类似。它提供了简单的并行性，Kafka分区和Spark分区之间的1：1对应关系，以及对偏移量和元数据的访问。但是，由于较新的集成使用新的Kafka消费者API而不是简单的API，所以在使用上阅读全文

posted @ 2017-11-07 15:25 gyhuminyan 阅读(1958) 评论(3) 推荐(1)

使用SparkStreaming实现将数据写到MySQL中

摘要：（1）在pom.xml中加入如下依赖包（2）在MySql中创建数据库和表，命令操作如下（3）使用Java编写一个数据库连接池类（5）打开netcat发送数据（6）提交阅读全文

posted @ 2017-11-07 14:24 gyhuminyan 阅读(7363) 评论(0) 推荐(0)

2017年9月27日

linux通过wget直接下载jdk，避免用户验证

摘要：下载JDK的时候，会出现用户验证的问题，下载下来的文件是一个HTML的文件，所以要加上几个字段表示去除验证。下载语句：注：经验证，现在此方法不能成功。阅读全文

posted @ 2017-09-27 15:23 gyhuminyan 阅读(739) 评论(0) 推荐(0)

2017年7月12日

Flume内容简介

摘要： Hadoop用于处理非常大的数据集，通常假设数据是已经在HDFS中，或者可以批量复制。然而，有很多系统不符合这个假设，他们产生了我们想要的数据流，使用Hadoop进行收集，存储和分析，Apache Flume系统是处理这些问题理想的方案。 Flume是设计用于将大容量基于事件的数据存储到Hadoo 阅读全文

posted @ 2017-07-12 22:27 gyhuminyan 阅读(476) 评论(0) 推荐(0)

2017年3月18日

训练神经网络解决而分类问题

摘要： #导入库import tensorflow as tffrom numpy.random import RandomState#定义训练数据batch的大小batch_size = 8#定义神经网络的参数w1 = tf.Variable(tf.random_normal([2,3],stddev=1 阅读全文

posted @ 2017-03-18 13:49 gyhuminyan 阅读(283) 评论(0) 推荐(0)

2017年3月15日

深度学习的57个术语

摘要：激活函数（Activation Function）为了让神经网络能够学习复杂的决策边界（decision boundary），我们在其一些层应用一个非线性激活函数。最常用的函数包括 sigmoid、tanh、ReLU（Rectified Linear Unit 线性修正单元）以及这些函数的变体。阅读全文

posted @ 2017-03-15 19:27 gyhuminyan 阅读(14005) 评论(0) 推荐(4)

公告