摘要: 随机森林算法是机器学习、计算机视觉等领域内应用较为广泛的一个算法、它不仅可以用来做分类(包括二分类和多分类),也可用来做回归预测,也可以作为一种数据降维的手段。在随机森林中,将生成很多的决策树,并不像在决策树那样只生成唯一的树。随机森林在变量(列)的使用和数据(行)的... 阅读全文
posted @ 2016-11-04 23:43 未雨愁眸 阅读(650) 评论(0) 推荐(0)
摘要: 备注:OpenCV版本 2.4.10在数据的挖掘和分析中,最基本和首要的任务是对数据进行分类,解决这个问题的常用方法是机器学习技术。通过使用已知实例集合中所有样本的属性值作为机器学习算法的训练集,导出一个分类机制后,再使用这个分类机制判别一个新实例的属性,并且可以通过... 阅读全文
posted @ 2016-11-04 23:23 未雨愁眸 阅读(439) 评论(0) 推荐(0)
摘要: AUC = sum( (Y(2:end)+Y(1:end-1))/2 .* (X(2:end) - X(1:end-1))X 和 Y 均是向量;Y(2:end) - Y(1:end-1),是 Y(2) - Y(1), Y(3) - Y(2), Y(4) - Y(3) ... 阅读全文
posted @ 2016-11-04 23:21 未雨愁眸 阅读(186) 评论(0) 推荐(0)
摘要: AUC = sum( (Y(2:end)+Y(1:end-1))/2 .* (X(2:end) - X(1:end-1))X 和 Y 均是向量;Y(2:end) - Y(1:end-1),是 Y(2) - Y(1), Y(3) - Y(2), Y(4) - Y(3) ... 阅读全文
posted @ 2016-11-04 23:21 未雨愁眸 阅读(537) 评论(0) 推荐(0)
摘要: 2*randn(sz):0 均值,方差为 4(variance), standard deviation:标准差为 2;numel():returns the # of elements; numel(randn(2, 3, 4)) ⇒ 24fieldnames():... 阅读全文
posted @ 2016-11-04 22:42 未雨愁眸 阅读(215) 评论(0) 推荐(0)
摘要: 2*randn(sz):0 均值,方差为 4(variance), standard deviation:标准差为 2;numel():returns the # of elements; numel(randn(2, 3, 4)) ⇒ 24fieldnames():... 阅读全文
posted @ 2016-11-04 22:42 未雨愁眸 阅读(225) 评论(0) 推荐(0)
摘要: 0. 分位数(quantiles)因为累计分布函数(cdf,F−1)是单调增函数,因此其有反函数,不妨记为 F−1。其真实的含义在于,如果 F 是 X 的 cdf,则 F−1(α) 的函数值为:P(X≤xα)=α这称为 α-分位;F−1 的自变量是概率,1. Z-sc... 阅读全文
posted @ 2016-11-04 20:00 未雨愁眸 阅读(680) 评论(0) 推荐(0)
摘要: 0. 分位数(quantiles)因为累计分布函数(cdf,F−1)是单调增函数,因此其有反函数,不妨记为 F−1。其真实的含义在于,如果 F 是 X 的 cdf,则 F−1(α) 的函数值为:P(X≤xα)=α这称为 α-分位;F−1 的自变量是概率,1. Z-sc... 阅读全文
posted @ 2016-11-04 20:00 未雨愁眸 阅读(1184) 评论(0) 推荐(0)
摘要: 1. baseline流程化的处理方式,用 BoW 将 sentences 从 text 表示成 vector,LR 或者 SVM 做回归;LIBLINEAR – A Library for Large Linear Classification对于多分类问题,工业上... 阅读全文
posted @ 2016-11-04 18:42 未雨愁眸 阅读(120) 评论(0) 推荐(0)
摘要: 1. baseline流程化的处理方式,用 BoW 将 sentences 从 text 表示成 vector,LR 或者 SVM 做回归;LIBLINEAR – A Library for Large Linear Classification对于多分类问题,工业上... 阅读全文
posted @ 2016-11-04 18:42 未雨愁眸 阅读(134) 评论(0) 推荐(0)
摘要: 0. 数学prob.pdf(概率论基础)Probabilistic-Programming-and-Bayesian-Methods-for-Hackers(Github)All The Mathematics You Missed(but need to know ... 阅读全文
posted @ 2016-11-04 16:37 未雨愁眸 阅读(270) 评论(0) 推荐(0)
摘要: 0. 数学prob.pdf(概率论基础)Probabilistic-Programming-and-Bayesian-Methods-for-Hackers(Github)All The Mathematics You Missed(but need to know ... 阅读全文
posted @ 2016-11-04 16:37 未雨愁眸 阅读(416) 评论(0) 推荐(0)
摘要: 美国人爱用缩略词指代一些大家都心知肚明的事或者对象,DOA:Dead On Arrival,E:Ecstasy,摇头丸;根据发音: c u:see youaka:also known as,也被称为wrt:with respect to,关于 req:requir... 阅读全文
posted @ 2016-11-04 16:19 未雨愁眸 阅读(340) 评论(0) 推荐(0)
摘要: 美国人爱用缩略词指代一些大家都心知肚明的事或者对象,DOA:Dead On Arrival,E:Ecstasy,摇头丸;根据发音: c u:see youaka:also known as,也被称为wrt:with respect to,关于 req:requir... 阅读全文
posted @ 2016-11-04 16:19 未雨愁眸 阅读(536) 评论(0) 推荐(0)
摘要: 0. 开源的库genismkeras wrapper of theano/TensorFlow1. CNN for NLPConvolutional Neural Networks for Sentence ClassificationYoon KimSentence... 阅读全文
posted @ 2016-11-04 15:50 未雨愁眸 阅读(121) 评论(0) 推荐(0)
摘要: 0. 开源的库genismkeras wrapper of theano/TensorFlow1. CNN for NLPConvolutional Neural Networks for Sentence ClassificationYoon KimSentence... 阅读全文
posted @ 2016-11-04 15:50 未雨愁眸 阅读(195) 评论(0) 推荐(0)
摘要: optimization:优化, convex optimizationoptimal:最佳的;0. 分类最优化问题似乎自然地分成两类:一类是连续变量的问题,另一类是离散变量的问题。 具有离散变量的问题,我们称它为组合的。1. KKT 条件KKT 条件是一个非线性规划... 阅读全文
posted @ 2016-11-04 13:03 未雨愁眸 阅读(298) 评论(0) 推荐(0)
摘要: optimization:优化, convex optimizationoptimal:最佳的;0. 分类最优化问题似乎自然地分成两类:一类是连续变量的问题,另一类是离散变量的问题。 具有离散变量的问题,我们称它为组合的。1. KKT 条件KKT 条件是一个非线性规划... 阅读全文
posted @ 2016-11-04 13:03 未雨愁眸 阅读(267) 评论(0) 推荐(0)
摘要: 1. 素因子分解Pollard Rho Brent Integer Factorization2. 前 n 个素数def primes(kmax):"""标准Python语法下的素数计算""" p= range(1000) result = [] i... 阅读全文
posted @ 2016-11-04 11:56 未雨愁眸 阅读(134) 评论(0) 推荐(0)
摘要: 1. 素因子分解Pollard Rho Brent Integer Factorization2. 前 n 个素数def primes(kmax):"""标准Python语法下的素数计算""" p= range(1000) result = [] i... 阅读全文
posted @ 2016-11-04 11:56 未雨愁眸 阅读(153) 评论(0) 推荐(0)