12 2014 档案

摘要:#题目描述:##Excel Sheet Column TitleGiven a positive integer, return its corresponding column title as appear in an Excel sheet.For example: 1 -> A ... 阅读全文
posted @ 2014-12-30 00:38 mrbean 阅读(1439) 评论(0) 推荐(0)
摘要:#题目概要:Given a matrix of m x n elements (m rows, n columns), return all elements of the matrix in spiral order.For example,Given the following matrix: ... 阅读全文
posted @ 2014-12-29 23:54 mrbean 阅读(187) 评论(0) 推荐(0)
摘要:题目描述: Given a collection of numbers, return all possible permutations. For example, have the following permutations: , and . 解题思路: 这道题目由于是求所有的全排列,比较直观 阅读全文
posted @ 2014-12-22 17:10 mrbean 阅读(225) 评论(0) 推荐(0)
摘要:#题目描述:Given a sorted array and a target value, return the index if the target is found. If not, return the index where it would be if it were inserted... 阅读全文
posted @ 2014-12-20 01:01 mrbean 阅读(281) 评论(0) 推荐(0)
摘要:#题目描述:Given a sorted array of integers, find the starting and ending position of a given target value.Your algorithm's runtime complexity must be in t... 阅读全文
posted @ 2014-12-19 12:36 mrbean 阅读(280) 评论(0) 推荐(0)
摘要:##win7下复制文件的时候发生了这个问题搜索发现是因为win7支持的最长的文件名称260个字符,我这个目录搞的太深了。。。 阅读全文
posted @ 2014-12-14 13:33 mrbean 阅读(2320) 评论(0) 推荐(0)
摘要:协同过滤(collaborative filtering)推荐系统:百度百科的定义是:它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程主要有有以下几种推荐的方式:基于内容的推荐协同过滤关联推荐混合推荐协同过滤这里我们主要考虑的是协同过滤,这... 阅读全文
posted @ 2014-12-13 00:12 mrbean 阅读(3903) 评论(0) 推荐(1)
摘要:SVD(Singular Value Decomposition,奇异值分解)算法优缺点:优点:简化数据,去除噪声,提高算法结果缺点:数据的转换可能难于理解适用数据类型:数值型数据算法思想:很多情况下,数据的一小部分包含了数据的绝大部分信息,线性代数中有很多矩阵的分解技术可以将矩阵表示成新的易于处理... 阅读全文
posted @ 2014-12-12 00:06 mrbean 阅读(7664) 评论(0) 推荐(0)
摘要:Principal Component Analysis算法优缺点:优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想:降维的好处:使得数据集更易使用降低很多算法计算开销去除噪声使得结果易懂主成分分析(principal componen... 阅读全文
posted @ 2014-12-10 23:25 mrbean 阅读(2759) 评论(3) 推荐(0)
摘要:机器学习实战笔记索引 最近通过学习《机器学习实战》把书结合网上的一些博客都完整的看了下,感觉还是很有收获的,稍微总结了下,留着复习吧 "kNN算法python实现和简单数字识别" "决策树的python实现" "朴素贝叶斯算法的python实现" "Logistic回归 python实现" "Log 阅读全文
posted @ 2014-12-10 18:57 mrbean 阅读(2069) 评论(0) 推荐(2)
摘要:FP-growth算法优缺点:优点:一般快于Apriori缺点:实现比较困难,在某些数据上性能下降适用数据类型:标称型数据算法思想:FP-growth算法是用来解决频繁项集发现问题的,这个问题再前面我们可以通过Apriori算法来解决,但是虽然利用Apriori原理加快了速度,仍旧是效率比较低的。F... 阅读全文
posted @ 2014-12-09 23:55 mrbean 阅读(3514) 评论(0) 推荐(2)
摘要:Apriori算法优点:易编码实现缺点:在大数据集上可能较慢适用数据类型:数值型或者标称型算法过程:关联分析是一种在大规模数据集中寻找有意思的关系的任务,这里的有意思的关系有两种:频繁项集(frequent item sets)或关联规则(association rules)。支持度(support... 阅读全文
posted @ 2014-12-08 00:27 mrbean 阅读(4757) 评论(0) 推荐(3)
摘要:线性回归算法优缺点:优点:结果易于理解,计算不复杂缺点:对非线性数据拟合不好适用数据类型:数值型和标称型算法思想:这里是采用了最小二乘法计算(证明比较冗长略去)。这种方式的优点是计算简单,但是要求数据矩阵X满秩,并且当数据维数较高时计算很慢;这时候我们应该考虑使用梯度下降法或者是随机梯度下降(同Lo... 阅读全文
posted @ 2014-12-05 23:56 mrbean 阅读(11418) 评论(0) 推荐(1)
摘要:AdaBoost(自适应boosting,adaptive boosting)算法算法优缺点:优点:泛化错误率低,易编码,可用在绝大部分分类器上,无参数调整缺点:对离群点敏感适用数据类型:数值型和标称型元算法(meta algorithm)在分类问题中,我们可能不会只想用一个分类器,我们会考虑将分类... 阅读全文
posted @ 2014-12-04 00:26 mrbean 阅读(4776) 评论(1) 推荐(2)