叮当小说网 找小说网 无限小说网 红尘小说网 幻想小说网 酷文学 深夜书屋

2013年7月26日

基于协同过滤的推荐引擎

摘要: 探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的... 阅读全文

posted @ 2013-07-26 19:16 麦哲思科技 阅读(284) 评论(0) 推荐(0)

机器学习中的决策树算法

摘要: 一.简介 决策树学习是一种逼近离散值目标函数的方法,在这种方法中学习到的函数被表示为一棵决策树。 二.决策树的表示法 决策树通过把实例从艮节点排列到某个叶子结点来分类实例,叶子结点即为实例所属的分类。树上的每一个结点指定了对实例的某个属性的测试,并且该结点的每一个后继分支对应于该... 阅读全文

posted @ 2013-07-26 18:02 麦哲思科技 阅读(167) 评论(0) 推荐(0)

增强学习 (reinforcement learning)

摘要: 在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让机器人自动找到合适的前进方向。 ... 阅读全文

posted @ 2013-07-26 18:00 麦哲思科技 阅读(322) 评论(0) 推荐(0)

主成分分析(PCA)

摘要: 主成分分析(Principal components analysis)-最大方差解释 在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至... 阅读全文

posted @ 2013-07-26 17:58 麦哲思科技 阅读(273) 评论(0) 推荐(0)

线性判别分析算法(LDA)

摘要: 1. 问题 之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。 比如回到上次提出的文档中含有“lear... 阅读全文

posted @ 2013-07-26 17:55 麦哲思科技 阅读(652) 评论(0) 推荐(0)

机器学习中规则化和模型选择知识

摘要: 1 问题 模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)? 还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w公式里的参数? ... 阅读全文

posted @ 2013-07-26 17:51 麦哲思科技 阅读(1054) 评论(0) 推荐(1)

线性回归,logistic回归和一般回归

摘要: 1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识。前四节主要讲述了回归问题,回归属于有监督学习中的一种方法。该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数学模型用于预测或者分类。该方法处理的数据可以是多维的。 讲义最初介绍... 阅读全文

posted @ 2013-07-26 17:48 麦哲思科技 阅读(298) 评论(0) 推荐(0)

android服务Service(上)- IntentService

摘要: Android学习笔记(五一):服务Service(上)- IntentService 对于需要长期运行,例如播放音乐、长期和服务器的连接,即使已不是屏幕当前的activity仍需要运行的情况,采用服务方式。服务将通过API触发启动或者通过IPC(Interprocess Co... 阅读全文

posted @ 2013-07-26 17:27 麦哲思科技 阅读(214) 评论(0) 推荐(0)

Android之条码扫描二维码扫描

摘要: Android之条码扫描二维码扫描 二维码条形码扫描,参考技术网址: 1.Apache License 2.0 开源的 ZXing项目的简化版 http://xinlanzero.iteye.com/blog/1114826 (作者的项目中的缺少core.jar,需自... 阅读全文

posted @ 2013-07-26 16:58 麦哲思科技 阅读(181) 评论(0) 推荐(0)

Android之Service与IntentService的比较

摘要: Android之Service与IntentService的比较 不知道大家有没有和我一样,以前做项目或者练习的时候一直都是用Service来处理后台耗时操作,却很少注意到还有个IntentService,前段时间准备面试的时候看到了一篇关于IntentService的解释,... 阅读全文

posted @ 2013-07-26 16:56 麦哲思科技 阅读(178) 评论(0) 推荐(0)

判别模型、生成模型与朴素贝叶斯方法

摘要: 1判别模型与生成模型 上篇报告中提到的回归模型是判别模型,也就是根据特征值来求结果的概率。形式化表示为,在参数确定的情况下,求解条件概率。通俗的解释为在给定特征后预测结果出现的概率。 比如说要确定一只羊是山羊还是绵羊,用判别模型的方法是先从历史数据中学习到模型,然后通过提取这只羊的特征来预测... 阅读全文

posted @ 2013-07-26 16:14 麦哲思科技 阅读(205) 评论(0) 推荐(0)

混合高斯模型和EM算法

摘要: 这篇讨论使用期望最大化算法(Expectation-Maximization)来进行密度估计(density estimation)。 与k-means一样,给定的训练样本是,我们将隐含类别标签用表示。与k-means的硬指定不同,我们首先认为是满足一定的概率分布的,这里我们认为... 阅读全文

posted @ 2013-07-26 16:11 麦哲思科技 阅读(162) 评论(0) 推荐(0)

EM算法

摘要: EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。 下面主要介绍EM的整个推导过程。 1. Jensen不等式 回顾优... 阅读全文

posted @ 2013-07-26 16:08 麦哲思科技 阅读(149) 评论(0) 推荐(0)

k-means聚类算法

摘要: K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SV... 阅读全文

posted @ 2013-07-26 16:06 麦哲思科技 阅读(182) 评论(0) 推荐(0)

Logistic Regression

摘要: 初步接触 谓LR分类器(Logistic Regression Classifier),并没有什么神秘的。在分类的情形下,经过学习之后的LR分类器其实就是一组权值w0,w1,...,wm. 当测试样本集中的测试数据来到时,这一组权值按照与测试数据线性加和的方式,求出一个z值: z = w... 阅读全文

posted @ 2013-07-26 15:45 麦哲思科技 阅读(350) 评论(0) 推荐(0)

奇异值分解

摘要: SVD分解 SVD分解是LSA的数学基础,本文是我的LSA学习笔记的一部分,之所以单独拿出来,是因为SVD可以说是LSA的基础,要理解LSA必须了解SVD,因此将LSA笔记的SVD一节单独作为一篇文章。本节讨论SVD分解相关数学问题,一个分为3个部分,第一部分讨论线性代数中的一些基础知识,第... 阅读全文

posted @ 2013-07-26 15:42 麦哲思科技 阅读(176) 评论(0) 推荐(0)

导航