2017年10月6日

optimization & error -01

摘要: 调优都是在场景限制之下。大部分选择并非一定。做测试来寻找瓶颈。(shuffle操作数量、RDD持久化操作数量以及gc) 开发调优、资源调优、数据倾斜调优、shuffle调优几个部分。 (涉及代码质量(api及数据结构),参数,数据质量,考虑内存与网络而选择的模式(广播、序列化),官网建议) RDD( 阅读全文

posted @ 2017-10-06 01:43 satyrs 阅读(175) 评论(0) 推荐(0)

2017年10月1日

SequenceFile & SequenceFileInputFormat<K,V>

摘要: org.apache.hadoop.mapred.SequenceFileInputFormat<K,V> org.apache.hadoop.io.SequenceFile 阅读全文

posted @ 2017-10-01 02:46 satyrs 阅读(347) 评论(0) 推荐(0)

2017年9月30日

notes for official-website(hadoop always to be continue..)

摘要: 1 Other services (such as Web App Proxy Server and MapReduce Job History server) are usually run either on dedicated hardware or on shared infrastrucu 阅读全文

posted @ 2017-09-30 07:03 satyrs 阅读(133) 评论(0) 推荐(0)

2017年9月29日

code snippet-02(scala always to be continue...)

摘要: 1() 有无问题 2extends同样可接表达式 3样本类的模型/类成员匹配 4面向表达式的异常 5元组 6Option中get/getOrElse 7PartialFunction 8 阅读全文

posted @ 2017-09-29 20:34 satyrs 阅读(147) 评论(0) 推荐(0)

JVM 01(essential)

摘要: JVM JRE JDK class loader + runtime data areas + excution engine class loader{load + link + initialize} 加载.class文件(从哪里加载、classpath的设置),编译,内存分配(有默认值的变量及 阅读全文

posted @ 2017-09-29 19:15 satyrs 阅读(142) 评论(0) 推荐(0)

2017年9月28日

schema inference(parsing)

摘要: So, how to infer? in JAVA Platform using xsd-gen-0.2.0-jar-with-dependencies.jar or xbean-2.2.0.jar. input output can be used to get the response SOAP 阅读全文

posted @ 2017-09-28 18:02 satyrs 阅读(148) 评论(0) 推荐(0)

Dataset.scala(sql)

摘要: 1 object Dataset private to sql leveltest & errors: :后为解释source code内容; //为插入分析1 spark.read.textFile("...")textFile: org.apache.spark.sql.Dataset[Stri 阅读全文

posted @ 2017-09-28 16:46 satyrs 阅读(248) 评论(0) 推荐(0)

method visibility

摘要: method access modifier 1 most restrictive access is to mark a method as “object-private.” 只对current instance available,Other instances of the same cla 阅读全文

posted @ 2017-09-28 14:48 satyrs 阅读(144) 评论(0) 推荐(0)

tips(java always to be continue...)

摘要: auto-boxing and cache problem http://blog.csdn.net/xad707348125/article/details/47017633 自动装箱时调用valueof使一定范围int值在cache中,而若要修改真实值需要reflect里的set,必须要获得ac 阅读全文

posted @ 2017-09-28 07:35 satyrs 阅读(94) 评论(0) 推荐(0)

maps in java(java)

摘要: 1 hashmap(abstractmap clonable serializable) 2 java.util.HashTable collection未有之前的array implementation,drooped,但是 thread safe,overhead thread写map即call 阅读全文

posted @ 2017-09-28 06:55 satyrs 阅读(97) 评论(0) 推荐(0)

导航