2015年2月15日

摘要: 研究生二年级实习(2010年5月)开始,一直跟着王益(yiwang)和靳志辉(rickjin)学习LDA,包括对算法的理解、并行化和应用等等。毕业后进入了腾讯公司,也一直在从事相关工作,后边还在yiwang带领下,与孙振龙、严浩等一起实现了一套大规模并行的LDA训练系统——Peacock。受rick... 阅读全文
posted @ 2015-02-15 16:58 虚若怀谷 阅读(1098) 评论(0) 推荐(0) 编辑

2014年8月28日

摘要: 推荐算法主要分为基于内容的算法和协同过滤. 协同过滤的两种基本方法是基于邻居的方法(基于内容/物品的协同过滤)和隐语义模型. 矩阵分解乃是实现隐语义模型的基石.矩阵分解根据用户对物品的评分, 推断出用户和物品的隐语义向量, 然后根据用户和物品的隐语义向量来进行推荐.推荐系统用到的数据可以有显式评分和... 阅读全文
posted @ 2014-08-28 14:53 虚若怀谷 阅读(1899) 评论(0) 推荐(0) 编辑

2014年8月23日

摘要: 本文纯转载; 主要是想系统的跟tornadomeet的顺序走一遍deeplearning;前言: 最近打算稍微系统的学习下deep learing的一些理论知识,打算采用Andrew Ng的网页教程UFLDL Tutorial,据说这个教程写得浅显易懂,也不太长。不过在这这之前还是复习下machi... 阅读全文
posted @ 2014-08-23 15:26 虚若怀谷 阅读(238) 评论(0) 推荐(0) 编辑

2014年8月13日

摘要: hiredis是redis数据库的C接口,目前只能在linux下使用,几个基本的函数就可以操作redis数据库了。函数原型:redisContext *redisConnect(const char *ip, int port)说明:该函数用来连接redis数据库,参数为数据库的ip地址和端口,一般... 阅读全文
posted @ 2014-08-13 12:04 虚若怀谷 阅读(934) 评论(0) 推荐(0) 编辑
摘要: 大约一年多前,公司同事开始使用Redis,不清楚是配置,还是版本的问题,当时的Redis经常在使用一段时间后,连接爆满且不释放。印象中,Redis 2.4.8以下的版本由于设计上的主从库同步问题,就会导致整个问题,不知是否确为这个Bug所致。但从那以后,我就很少敢去尝试使用Redis。曾想转投Mon... 阅读全文
posted @ 2014-08-13 11:54 虚若怀谷 阅读(263) 评论(0) 推荐(0) 编辑

2014年7月28日

摘要: 尊重原创,注重版权,转贴请注明原文地址:http://www.cnblogs.com/vincent-hv/p/3322966.html1、配置程序使用资源:System.setProperty("spark.executor.memary", "512m")2、创建自己的SparkContext对... 阅读全文
posted @ 2014-07-28 17:02 虚若怀谷 阅读(295) 评论(0) 推荐(0) 编辑

2014年7月18日

摘要: 目录(?)[-]目标编译源码编译链接是否使用SSLautoconf宏跨平台的可移植的代码全局初始化CURL_GLOBAL_WIN32CURL_GLOBAL_SSLlibcurl提供的功能使用easy interface多线程问题什么时候libcurl无法正常工作上传数据到远程站点关于密码HTTP验证... 阅读全文
posted @ 2014-07-18 15:09 虚若怀谷 阅读(364) 评论(0) 推荐(0) 编辑

2014年7月15日

摘要: Git 基础读完本章你就能上手使用 Git 了。本章将介绍几个最基本的,也是最常用的 Git 命令,以后绝大多数时间里用到的也就是这几个命令。读完本章,你就能初始化一个新的代码仓库,做一些适当配置;开始或停止跟踪某些文件;暂存或提交某些更 新。我们还会展示如何让 Git 忽略某些文件,或是名称符合特... 阅读全文
posted @ 2014-07-15 17:13 虚若怀谷 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 起步本章介绍开始使用 Git 前的相关知识。我们会先了解一些版本控制工具的历史背景,然后试着让 Git 在你的系统上跑起来,直到最后配置好,可以正常开始开发工作。读完本章,你就会明白为什么 Git 会如此流行,为什么你应该立即开始使用它。1.1 关于版本控制什么是版本控制?我真的需要吗?版本控制是一... 阅读全文
posted @ 2014-07-15 17:04 虚若怀谷 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 新博客地址:http://gorthon.sinaapp.com/持久性就是指保持对象,甚至在多次执行同一程序之间也保持对象。通过本文,您会对 Python对象的各种持久性机制(从关系数据库到 Python 的 pickle以及其它机制)有一个总体认识。另外,还会让您更深一步地了解Python 的对... 阅读全文
posted @ 2014-07-15 15:16 虚若怀谷 阅读(373) 评论(0) 推荐(0) 编辑

导航