2016 年 11月 4 日随笔档案 - 未雨愁眸

公告

2016年11月4日

摘要：随机森林算法是机器学习、计算机视觉等领域内应用较为广泛的一个算法、它不仅可以用来做分类（包括二分类和多分类），也可用来做回归预测，也可以作为一种数据降维的手段。在随机森林中，将生成很多的决策树，并不像在决策树那样只生成唯一的树。随机森林在变量（列）的使用和数据（行）的... 阅读全文

posted @ 2016-11-04 23:43 未雨愁眸阅读(661) 评论(0) 推荐(0)

AdaBoost算法原理及OpenCV实例

摘要：备注：OpenCV版本 2.4.10在数据的挖掘和分析中，最基本和首要的任务是对数据进行分类，解决这个问题的常用方法是机器学习技术。通过使用已知实例集合中所有样本的属性值作为机器学习算法的训练集，导出一个分类机制后，再使用这个分类机制判别一个新实例的属性，并且可以通过... 阅读全文

posted @ 2016-11-04 23:23 未雨愁眸阅读(441) 评论(0) 推荐(0)

matlab 矢量化编程（一）—— 计算 AUC

摘要： AUC = sum( (Y(2:end)+Y(1:end-1))/2 .* (X(2:end) - X(1:end-1))X 和 Y 均是向量；Y(2:end) - Y(1:end-1)，是 Y(2) - Y(1), Y(3) - Y(2), Y(4) - Y(3) ... 阅读全文

posted @ 2016-11-04 23:21 未雨愁眸阅读(188) 评论(0) 推荐(0)

matlab 矢量化编程（一）—— 计算 AUC

摘要： AUC = sum( (Y(2:end)+Y(1:end-1))/2 .* (X(2:end) - X(1:end-1))X 和 Y 均是向量；Y(2:end) - Y(1:end-1)，是 Y(2) - Y(1), Y(3) - Y(2), Y(4) - Y(3) ... 阅读全文

posted @ 2016-11-04 23:21 未雨愁眸阅读(539) 评论(0) 推荐(0)

matlab 高级函数

摘要： 2*randn(sz)：0 均值，方差为 4（variance）， standard deviation：标准差为 2；numel()：returns the # of elements； numel(randn(2, 3, 4)) ⇒ 24fieldnames()：... 阅读全文

posted @ 2016-11-04 22:42 未雨愁眸阅读(218) 评论(0) 推荐(0)

matlab 高级函数

posted @ 2016-11-04 22:42 未雨愁眸阅读(227) 评论(0) 推荐(0)

分位数（quantiles）、Z-score 与 F-score

摘要： 0. 分位数（quantiles）因为累计分布函数（cdf，F−1）是单调增函数，因此其有反函数，不妨记为 F−1。其真实的含义在于，如果 F 是 X 的 cdf，则 F−1(α) 的函数值为：P(X≤xα)=α这称为 α-分位；F−1 的自变量是概率，1. Z-sc... 阅读全文

posted @ 2016-11-04 20:00 未雨愁眸阅读(689) 评论(0) 推荐(0)

分位数（quantiles）、Z-score 与 F-score

posted @ 2016-11-04 20:00 未雨愁眸阅读(1189) 评论(0) 推荐(0)

学术研究中的 NLP

摘要： 1. baseline流程化的处理方式，用 BoW 将 sentences 从 text 表示成 vector，LR 或者 SVM 做回归；LIBLINEAR – A Library for Large Linear Classification对于多分类问题，工业上... 阅读全文

posted @ 2016-11-04 18:42 未雨愁眸阅读(121) 评论(0) 推荐(0)

学术研究中的 NLP

posted @ 2016-11-04 18:42 未雨愁眸阅读(136) 评论(0) 推荐(0)

国内外免费电子书（数学、算法、图像、深度学习、机器学习）

摘要： 0. 数学prob.pdf（概率论基础）Probabilistic-Programming-and-Bayesian-Methods-for-Hackers（Github）All The Mathematics You Missed（but need to know ... 阅读全文

posted @ 2016-11-04 16:37 未雨愁眸阅读(272) 评论(0) 推荐(0)

国内外免费电子书（数学、算法、图像、深度学习、机器学习）

摘要： 0. 数学prob.pdf（概率论基础）Probabilistic-Programming-and-Bayesian-Methods-for-Hackers（Github）All The Mathematics You Missed（but need to know ... 阅读全文

posted @ 2016-11-04 16:37 未雨愁眸阅读(417) 评论(0) 推荐(0)

中英文对照 —— 缩略词

摘要：美国人爱用缩略词指代一些大家都心知肚明的事或者对象，DOA：Dead On Arrival，E：Ecstasy，摇头丸；根据发音： c u：see youaka：also known as，也被称为wrt：with respect to，关于 req：requir... 阅读全文

posted @ 2016-11-04 16:19 未雨愁眸阅读(347) 评论(0) 推荐(0)

中英文对照 —— 缩略词

posted @ 2016-11-04 16:19 未雨愁眸阅读(541) 评论(0) 推荐(0)

NLP（paper + code）

摘要： 0. 开源的库genismkeras wrapper of theano/TensorFlow1. CNN for NLPConvolutional Neural Networks for Sentence ClassificationYoon KimSentence... 阅读全文

posted @ 2016-11-04 15:50 未雨愁眸阅读(124) 评论(0) 推荐(0)

NLP（paper + code）

摘要： 0. 开源的库genismkeras wrapper of theano/TensorFlow1. CNN for NLPConvolutional Neural Networks for Sentence ClassificationYoon KimSentence... 阅读全文

posted @ 2016-11-04 15:50 未雨愁眸阅读(199) 评论(0) 推荐(0)

优化与凸优化初始

摘要： optimization：优化， convex optimizationoptimal：最佳的；0. 分类最优化问题似乎自然地分成两类：一类是连续变量的问题，另一类是离散变量的问题。具有离散变量的问题，我们称它为组合的。1. KKT 条件KKT 条件是一个非线性规划... 阅读全文

posted @ 2016-11-04 13:03 未雨愁眸阅读(268) 评论(0) 推荐(0)

优化与凸优化初始

posted @ 2016-11-04 13:03 未雨愁眸阅读(301) 评论(0) 推荐(0)

工具类与工具函数 —— 素数相关

摘要： 1. 素因子分解Pollard Rho Brent Integer Factorization2. 前 n 个素数def primes(kmax):"""标准Python语法下的素数计算""" p= range(1000) result = [] i... 阅读全文

posted @ 2016-11-04 11:56 未雨愁眸阅读(135) 评论(0) 推荐(0)

工具类与工具函数 —— 素数相关

摘要： 1. 素因子分解Pollard Rho Brent Integer Factorization2. 前 n 个素数def primes(kmax):"""标准Python语法下的素数计算""" p= range(1000) result = [] i... 阅读全文

posted @ 2016-11-04 11:56 未雨愁眸阅读(154) 评论(0) 推荐(0)

柯西序列与完备空间

摘要： cauchy sequence；1. 柯西序列的定义设 xn 是距离空间 X 中的点列，如果对于任意的 ε>0，存在自然数N，当 m,n>N 时，|xn−xm|<ε，称 xn 是一个 Cauchy 列。在数学中，一个柯西列是指一个这样一个序列，它的元素随着序数的增... 阅读全文

posted @ 2016-11-04 10:51 未雨愁眸阅读(784) 评论(0) 推荐(0)

柯西序列与完备空间

posted @ 2016-11-04 10:51 未雨愁眸阅读(1397) 评论(0) 推荐(0)

希尔伯特空间（Hilbert Space）

摘要：欧氏空间 → 线性空间 + 内积 ⇒ 内积空间（元素的长度，元素的夹角和正交）内积空间 + 完备性 ⇒ 希尔伯特空间0. 欧几里得空间欧氏空间是一个特别的度量空间，它使得我们能够对其的拓扑性质，在包含了欧氏几何和非欧几何的流形的定义上发挥了作用。约在公元前300年，古... 阅读全文

posted @ 2016-11-04 10:00 未雨愁眸阅读(1441) 评论(0) 推荐(0)

希尔伯特空间（Hilbert Space）

posted @ 2016-11-04 10:00 未雨愁眸阅读(724) 评论(0) 推荐(0)

深度神经网络：特点、问题及解决

摘要： CNN：具有强大的提取局部特征的能力dropout：防止过拟合（drop 层内的一些 neurons）； residual learning，是跳过某一些 layer加快模型的训练速度；softmax（全连接）：多分类任务0. deep learninghigh-le... 阅读全文

posted @ 2016-11-04 09:47 未雨愁眸阅读(260) 评论(0) 推荐(0)

深度神经网络：特点、问题及解决

posted @ 2016-11-04 09:47 未雨愁眸阅读(739) 评论(0) 推荐(0)

中英文对照 —— 手机 App/PC 端软件（系统）、互联网

摘要： 0. 经典 & 缩略词SMS：short message service，短信息服务，SMS code，短信验证码；swipe：vt. 猛击；偷窃；刷…卡Swipe up/down/right to 向上/下/右滑动1. 支付宝top up：充值，top up 的含义... 阅读全文

posted @ 2016-11-04 09:34 未雨愁眸阅读(700) 评论(0) 推荐(0)

中英文对照 —— 手机 App/PC 端软件（系统）、互联网

posted @ 2016-11-04 09:34 未雨愁眸阅读(317) 评论(0) 推荐(0)

Opencv决策树分类器应用

摘要：机器学习在数据挖掘、计算机视觉、搜索引擎、医学诊断、证券市场分析、语言与手写识别等领域有着十分广泛的应用，特别是在数据分析挥着越来越重要的作用。在机器学习中，决策树是最基础且应用最广泛的归纳推理算法之一，基于决策树算法，衍生出很多出色的集成算法，如random for... 阅读全文

posted @ 2016-11-04 00:04 未雨愁眸阅读(472) 评论(0) 推荐(0)