2014年6月24日
摘要: 在之前的项目需要用到以自定义类型作为HashMap的key,遇到一个问题:如果修改了已经存储在HashMap中的实例,会发生什么情况呢?用一段代码来试验:import java.util.HashMap;import java.util.Map;public class TestHashMap { ... 阅读全文
posted @ 2014-06-24 18:19 nanoix9 阅读(4692) 评论(7) 推荐(3) 编辑
  2014年6月16日
摘要: 关于Java的HashMap.entrySet(),文档是这样描述的:这个方法返回一个Set,这个Set是HashMap的视图,对Map的操作会在Set上反映出来,反过来也是。原文是Returns a Set view of the mappings contained in this map. T... 阅读全文
posted @ 2014-06-16 13:37 nanoix9 阅读(6124) 评论(0) 推荐(1) 编辑
  2014年6月13日
摘要: Hive的TRANSFORM关键字提供了在SQL中调用自写脚本的功能,适合实现Hive中没有的功能又不想写UDF的情况。例如,按日期统计每天出现的uid数,通常用如下的SQLSELECT date, count(uid)FROM xxxGROUP BY date但是,如果我想在reduce阶段对每天... 阅读全文
posted @ 2014-06-13 14:03 nanoix9 阅读(11761) 评论(0) 推荐(1) 编辑
  2014年6月4日
摘要: 随机分类器,也就是对于一个分类问题,随机猜测答案。理论上,随机分类器的性能是所有分类器的下界。对随机分类器的理解,可以帮助更好的理解分类器的性能指标。随机分类器的性能也可以作为评价分类器的一个基础。所以简单写了几行代码来研究一下随机分类器的性能。用的是scikit-learn包。这里产生了一个正负样... 阅读全文
posted @ 2014-06-04 16:58 nanoix9 阅读(10556) 评论(0) 推荐(0) 编辑
  2014年3月15日
摘要: 开始找不到无线网卡,后来不知道怎么就出来了,但是速度很慢。用下面的方法解决的(我也不知道哪条命令起的作用,反正现在正常了):sudo apt-get remove --purge bcmwl-kernel-sourcemodprobe brcmsmacrfkill unblock all然后sudo... 阅读全文
posted @ 2014-03-15 11:26 nanoix9 阅读(381) 评论(0) 推荐(0) 编辑
  2014年2月19日
摘要: 今天安装XLConnect包,安装后无法library(XLConnect)载入,看报错问题应该出在rJava上,找到了下面的解决办法:if (Sys.getenv("JAVA_HOME")!="") Sys.setenv(JAVA_HOME="")library(rJava)作者解释说:若使用64bit版本,不能设置JAVA_HOME变量,否则rJava因为未知原因不能工作。参考:http://stackoverflow.com/questions/7019912/using-the-rjava-package-on-win7-64 阅读全文
posted @ 2014-02-19 12:43 nanoix9 阅读(528) 评论(0) 推荐(0) 编辑
  2014年2月18日
摘要: 最近使用Storm开发,发现log4j死活打不出debug级别的日志,网上搜到的关于log4j配置的方法都试过了,均无效。 最终发现问题是这样的:最新的storm使用的日志系统已经从log4j切换到了slf4j+logback。那么使用log4j的旧代码怎么办呢?为了避免对这些代码作任何修改,slf4j提供了桥接工具:log4j-over-slf4j,提供与log4j完全相同的类名和接口,但是底层是slf4j的实现。这样,在依赖了storm的工程中使用log4j,比如org.apache.log4j.Logger,实际找到的是log4j-over-slf4j中的完全同名的类。难怪对log... 阅读全文
posted @ 2014-02-18 17:43 nanoix9 阅读(5160) 评论(0) 推荐(0) 编辑
  2012年10月19日
摘要: 1. 问题描述连续抛一枚硬币,连续出现若干次正面即停止,求所抛总次数的期望。2. 求解期望记硬币出现正面的概率为$p$,停止条件中连续出现正面的次数为$n$,所抛总次数的期望为$\mu_n$。考虑如下情形:首次出现连续$n-1$次正面,此时所抛总次数的期望为$\mu_{n-1}$。再抛一次,结果有且只有一下两种:A. 出现正面,则满足停止条件,所抛总次数的期望为$\mu_{n-1}+1$B. 出现反面,则立即回到初始状态,相当于从0开始再抛出$n$次连续正面,因此总次数的期望为$\mu_{n-1}+1+\mu_n$。A、B两种情况的概率分别为$p,1-p$。因此有$$\begin{equati 阅读全文
posted @ 2012-10-19 17:29 nanoix9 阅读(3945) 评论(3) 推荐(0) 编辑
  2012年10月17日
摘要: 1. 问题描述有绳子若干,随机选取两个绳头系在一起,直到所有的绳头都被系起来,这时将形成若干个环。问环的个数的期望是多少。2. 一般解法记绳子数为$N$时,环的个数为随机变量$X_N$,期望为$\mu_N=E\{X_N\}$。显然,$X_N$可能的取值为$1, 2, \dots, N$。直接的想法是计算$X_N$的概率分布$P\{X_N=m\}$然后再求期望,但显然过于复杂。考虑如下的思路:先随机选取两个绳头系在一起,有且只有两种结果:a. 这两个绳头属于一根绳子,于是形成了一个环,而剩下的$N-1$根绳子归结为规模为$N-1$的问题;b. 这两个绳头属于不同的绳子,于是这两根绳子形成了一根绳 阅读全文
posted @ 2012-10-17 00:04 nanoix9 阅读(3846) 评论(1) 推荐(1) 编辑
  2012年9月22日
摘要: 1 基本公式EMA(Exponential Moving Average)是常用的技术指标之一,也称为指数平滑(Exponential Smoothing),计算公式为$$S(n) = ux(n)+(1-u)S(n-1)$$其中$S(n)$表示$x(n)$在时刻$n$的EMA值,而$x(n)$使用如下的信号模型$$x(n) = a(n)+e(n)$$其中$a(n)$和$e(n)$分别表示信号项和噪声项。现在EMA的这一常用形式由Robert Goodell Brown提出。2 EMA的前提注意,Brown在分析EMA的时候,使用如下的前提$$a(n) = \mathrm{Constant}$$ 阅读全文
posted @ 2012-09-22 21:43 nanoix9 阅读(1362) 评论(0) 推荐(0) 编辑