上一页 1 2 3 4 5 6 7 8 9 10 ··· 16 下一页
摘要: 目标是优化几何边距, 通过函数边距来表示需要限制||w|| = 1 还是优化几何边距,St去掉||w||=1限制转为普通函数边距 更进一步的,可以固定函数边距为1,调节||w||即可 阅读全文
posted @ 2014-11-07 16:07 阁子 阅读(986) 评论(0) 推荐(0) 编辑
摘要: 这个特性很赞,直接给例子吧,假如我要设计一个类,CachedFetcher内部可能使用std::map也可能使用std::unordered_map,也可能是其它的map,怎么设计呢?没有C++11变长模板之前这很费劲。。 因为map的模板参数可不是只有key,value两个啊,还有一些有默认参数的template参数。。。 template class _Map = std::unorde... 阅读全文
posted @ 2014-11-07 14:40 阁子 阅读(1290) 评论(0) 推荐(0) 编辑
摘要: http://videolectures.net/icml09_dasgupta_langford_actl/ 主动学习目的: 尽可能少的标注,获取尽可能好的训练结果 一般来说我们希望我们训练的模型能够对于natural distribution也就是说truly underlying distribution表现最好 对于数据集合的随机抽取标注能够做到这一点,但是... 阅读全文
posted @ 2014-11-01 18:32 阁子 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 超赞的线程安全的初始化 static plsa::PLSAModel& model() { static plsa::PLSAModel _model = ([&]() { plsa::PLSAModel _model; string modelPath = "./data/plsa.model/pzw.idx"; PSCONF(modelPath, "PlsaTopic"); _model.L... 阅读全文
posted @ 2014-10-10 19:18 阁子 阅读(548) 评论(0) 推荐(1) 编辑
摘要: 测试环境gcc4.8.2 iterator find ( const key_type& k ); const_iterator find ( const key_type& k ) const; Unordered_map有两个对应的find函数 我推断第二个是安全的,第一个经过实测不是线程安全 auto iter = _map.find(key) 在openmp多线程环境... 阅读全文
posted @ 2014-10-10 19:00 阁子 阅读(5676) 评论(0) 推荐(0) 编辑
摘要: gbdt的最大优点,和决策树一样,高度可解释,最喜欢的分类模型:) #!/usr/bin/env python #coding=gbk # ============================================================================== # \file print-fastreank-tree.py # ... 阅读全文
posted @ 2014-10-04 23:04 阁子 阅读(4988) 评论(0) 推荐(0) 编辑
摘要: 暂时使用boost 序列化, 目前我的测试基本都ok 只是对于c++11 shared ptr 没有测试成功,只能手工写下shared ptr 部分的序列化,也就是目前我对指针都不直接序列化,自己管理,例如下面样子 Load_(modelFile); //model直接序列化 string normalizerName = read_file(OBJ_NAME_PATH(_normalizer)... 阅读全文
posted @ 2014-10-01 16:52 阁子 阅读(6039) 评论(0) 推荐(0) 编辑
摘要: SVM NG课件1 2014年9月28日 16:39 一个二维空间点的示例 已使用 Microsoft OneNote 2013 创建。 阅读全文
posted @ 2014-09-29 09:38 阁子 阅读(278) 评论(0) 推荐(0) 编辑
摘要: 回到随机变量传输问题,假设传输中我们不知道具体 分布情况(unknown),我们用一个已知的分布 ,来模拟它,那么在这种情况下如果我们利用 尽可能高效的编码,那么我们平均需要多少额外的信息量来描述x呢。这称为相对熵,或者kl divergence。 利用凸函数的不等式性质(也利用了离散求和推广到连续... 阅读全文
posted @ 2013-10-03 17:52 阁子 阅读(1371) 评论(0) 推荐(0) 编辑
摘要: 点互信息 Pointwise mutual information(PMI), orpoint mutual information, is a measure of association used ininformation theoryandstatistics. The PMI of a p... 阅读全文
posted @ 2013-10-03 17:49 阁子 阅读(5077) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 16 下一页