澄轶(程毅) - 博客园

2018年10月30日

摘要：大量推送本地文件到hdfs如下 hadoop fs -put ${local_path} ${hdfs_path}报错。在hadoop命令下发现：查找JAVA_HEAP_MAX 发现继续查找HADOOP_HEAPSIZE 发现以及调整JVM堆的最大值：阅读全文

posted @ 2018-10-30 18:26 澄轶(程毅) 阅读(474) 评论(0) 推荐(0)

hdfs 路径不支持‘：’

摘要： hdfs 路径不支持‘：’，但Linux支持。可以查看此文件： /Users/suanec/ksp/yarn/hadoop-2.7.3-src/hadoop-hdfs-project/hadoop-hdfs-client/src/main/java/org/apache/hadoop/hdfs/D 阅读全文

posted @ 2018-10-30 17:55 澄轶(程毅) 阅读(2010) 评论(0) 推荐(0)

2018年10月26日

java.io.UTFDataFormatException: encoded string too long:

摘要：按如下修改可避开此问题。阅读全文

posted @ 2018-10-26 16:52 澄轶(程毅) 阅读(3305) 评论(0) 推荐(0)

2018年10月18日

scala-maven-plugin excludes

摘要： Hello, every one. I have a problem to add excludes to scala-maven-plugin. There are two scala files:Spark_1.6.1.scala and Spark_2.0.1.scala in src/mai 阅读全文

posted @ 2018-10-18 22:09 澄轶(程毅) 阅读(2731) 评论(0) 推荐(1)

2018年10月8日

无网络使用pip安装mxnet

摘要：完成后，在python中import mxnet即可。如果python为自行编译，可能会出现bz2 导入失败。找不到模块。可以参考： missing python bz2 module 按操作解决。阅读全文

posted @ 2018-10-08 14:10 澄轶(程毅) 阅读(2615) 评论(0) 推荐(0)

2018年9月5日

git 回滚指定行

摘要： Stage the parts you want with git add -p, then discard (git checkout -- filename) the unstaged changes. Update for Git 1.6.5+ In version 1.6.5, Git le 阅读全文

posted @ 2018-09-05 20:33 澄轶(程毅) 阅读(321) 评论(0) 推荐(0)

2018年8月29日

Yarn Node Labels

摘要： Yarn Node Labels + Capacity-Scheduler 在yarn-site.xml中开启capacity-schedule 配置capacity-scheduler.xml文件添加Yarn Node Labels yarn rmadmin -addToClusterNodeL 阅读全文

posted @ 2018-08-29 15:47 澄轶(程毅) 阅读(1096) 评论(0) 推荐(0)

JVM调优总结 -Xms -Xmx -Xmn -Xss

摘要：原：JVM调优总结 -Xms -Xmx -Xmn -Xss java -Xmx3550m -Xms3550m -Xmn2g-Xss128k-Xmx3550m：设置JVM最大可用内存为3550M。-Xms3550m：设置JVM促使内存为3550m。此值可以设置与-Xmx相同，以避免每次垃圾回收完成后J 阅读全文

posted @ 2018-08-29 14:36 澄轶(程毅) 阅读(258) 评论(0) 推荐(0)

[转] - Weiflow——微博机器学习框架

摘要： "Weiflow——微博机器学习框架" 本文从开发效率（易用性）、可扩展性、执行效率三个方面，介绍了微博机器学习框架Weiflow在微博的应用和最佳实践。在上期《基于Spark的大规模机器学习在微博的应用》一文中我们提到，在机器学习流中，模型训练只是其中耗时最短的一环。如果把机器学习流比作烹饪，那阅读全文

posted @ 2018-08-29 14:15 澄轶(程毅) 阅读(168) 评论(0) 推荐(0)

2018年8月11日

方差+标准差+四分位数+z-score公式

摘要：一、方差公式其中公式中μ为平均数，N为这组数据的个数，x1、x2、x3……xN为这组数据具体数值。二、标准差公式其中公式中数值X1，X2，X3，......XN(皆为实数)，其平均值(算术平均值)为μ，标准差为σ。三、四分位数四分位数Qi所在的位置公式为：即 Q1的位置= (n+1) × 阅读全文

posted @ 2018-08-11 13:51 澄轶(程毅) 阅读(805) 评论(0) 推荐(0)

苏轶然-澄轶(程毅)

抱你于怀，寄你于心。跃然屏上，付我青春韶华，换你真情相待。

公告