2016年11月29日

摘要: 目标函数 优化目标函数 利用坐标下降法,依次更新u和v的值。u和v的先后顺序无所谓,只要保证两者是交替更新的就好。这种方法又称为alternating least squares(ALS)。 增加偏置项 在行和列都增加一个常数项,去除每个用户的个体影响。 更新的公式修正为 增加正则项 实现代码阅读全文
posted @ 2016-11-29 15:20 zhyhooo 阅读(244) 评论(0) 编辑

2016年11月4日

摘要: 打开eclipse的时候回遇到这种情况 解决方案: 进入eclipse.exe所在的目录,在eclipse.ini文件中加入以下两行: vm /bin/javaw.exe 注意 :以上内容必须分别放在两行,并且 vm的位置需在openFile之后, vmargs之前。阅读全文
posted @ 2016-11-04 14:49 zhyhooo 阅读(68) 评论(0) 编辑

2016年8月28日

摘要: 布隆过滤器 布隆过滤器是一种概率空间高效的数据结构。它与hashmap非常相似,用于检索一个元素是否在一个集合中。它在检索元素是否存在时,能很好地取舍空间使用率与误报比例。正是由于这个特性,它被称作概率性数据结构(probabilistic data structure)。 空间效率 我们来仔细地看阅读全文
posted @ 2016-08-28 17:15 zhyhooo 阅读(4288) 评论(0) 编辑

2016年7月11日

摘要: $ git remote -v #查看远程主机的网址$ git fetch <远程主机名> # 将某个远程主机的更新,全部取回本地$ git fetch <远程主机名> <分支名> # 取回origin主机的master分支$ git branch -r # 查看远程分支$ git branch -阅读全文
posted @ 2016-07-11 18:05 zhyhooo 阅读(66) 评论(0) 编辑

2016年6月14日

摘要: scan函数是theano中的循环函数,相当于for loop。在读别人的代码时第一次看到,有点迷糊,不知道输入、输出怎么定义,网上也很少有example,大多数都是相互转载同一篇。所以,还是要看官方文档。 函数定义如下 fn就是被执行循环的函数,它接收。sequences是一个变量或者若干个变量组阅读全文
posted @ 2016-06-14 16:30 zhyhooo 阅读(787) 评论(0) 编辑

2016年5月29日

摘要: 1 #include<iostream> 2 #include<stack> 3 #include<deque> 4 using namespace std; 5 6 7 int main() 8 { 9 stack<int> first;10 cout << "size of first: " &阅读全文
posted @ 2016-05-29 17:37 zhyhooo 阅读(688) 评论(0) 编辑
 
摘要: 1 #include<iostream> 2 #include<vector> 3 using namespace std; 4 5 void print( vector<int> &vec ) 6 { 7 for ( vector<int>::iterator it = vec.begin(); 阅读全文
posted @ 2016-05-29 17:12 zhyhooo 阅读(67) 评论(0) 编辑

2016年3月5日

摘要: 用户在访问网页时,每打开一次网页相当于是浏览器向网站后端的服务器发送一次http请求。借助chrome浏览器,我们能看到每个请求的header,其中包含了Cookie/Referer/User-agent等,还有用户的IP地址。后台的日志收集系统会记录这些请求日志,根据这些日志我们已经能够简单地统计阅读全文
posted @ 2016-03-05 16:02 zhyhooo 阅读(14073) 评论(0) 编辑

2015年12月28日

摘要: 18,一个属于青春的数字,一个人生的新起点。依稀记得2013年的夏天,你们刚踏入二中的样子,你们的朝气和活力让百十年的二中充满勃勃生机。作为校长,非常有幸见证了你们的青春,也非常高兴分享了你们的活力。你们用诗歌向青春举杯,你们用话剧向艺术致敬,你们在运动跑道上刷新纪录,你们在...阅读全文
posted @ 2015-12-28 22:10 zhyhooo 阅读(124) 评论(0) 编辑
 
摘要: 最近遇到了这个问题,这里想到了几种方法。第一种,用均值、中位数、众数等数值补充。如果数据近似于normal distribution,可以用mean来代替,如果数据是skewed distribution的,则用median来替代。不过,这相当于是人为给数据增加了噪音,最终的效果是正向还是负向也不得...阅读全文
posted @ 2015-12-28 22:08 zhyhooo 阅读(140) 评论(0) 编辑