04 2017 档案

摘要:一.背景 传统的线性回归算法用于拟合所有的数据,当数据量非常的大,特征之间的关联非常的复杂的时候,这个方法就不太现实。这个时候就可以采用对数据进行切片的方式,然后在对切片后的局部的数据进行线性回归,如果首次切片之后的数据还是不符合线性的要求,那么就继续执行切片。在这个过程中树结构和回归算法是非常有用 阅读全文
posted @ 2017-04-26 17:02 whatyouknow123 阅读(284) 评论(0) 推荐(0)
摘要:一.bagging 和 boosting 在介绍adaboost之前有必要先介绍一下,bagging和boosting算法。 bagging,即可以称之为自举汇聚算法也可以称之为基于数据随机重抽样算法。它的原理就是从原始数据集中,随机抽样出S个和原数据集大小相等的新数据集。因为是随机的抽样因此就要可 阅读全文
posted @ 2017-04-25 20:46 whatyouknow123 阅读(355) 评论(0) 推荐(0)
摘要:problem description: given a sorted aescend array,return the begining and ending position of the target num i.e: [1,2,3,8,8,9] return [3,4] of course, 阅读全文
posted @ 2017-04-24 22:25 whatyouknow123 阅读(176) 评论(0) 推荐(0)
摘要:descripte problem: there is an array,at the first it is sorted,but for som reason, it was rotated at some pivot unknown to you beforehand.then you sho 阅读全文
posted @ 2017-04-24 09:52 whatyouknow123 阅读(138) 评论(0) 推荐(0)
摘要:problem description: there is four number list named A,B,C,D; now you should out put the num of tuples which statisfy A[i] +B[j]+C[k]+D[l] =0 i.e: 以上的 阅读全文
posted @ 2017-04-23 22:04 whatyouknow123 阅读(169) 评论(0) 推荐(0)
摘要:一.基本概念 svm是现成的很好的分类器,因为它能够不加修改的,直接应用于训练集,并且效果也不错。svm从直观上来时是找到分割两类数据的最佳的gap,即最大的间隔(margin)。 那既然svm是在找最大间隔,那什么是间隔呢?间隔指的就是支持向量和分割超平面之间距离。那支持向量又是什么呢?支持向量指 阅读全文
posted @ 2017-04-20 20:48 whatyouknow123 阅读(218) 评论(0) 推荐(0)
摘要:The Manifold Tangent Classifier (MTC) Putting it all together, here is the high level summary of how we build and train a deep network: 1. Train (unsu 阅读全文
posted @ 2017-04-19 20:01 whatyouknow123 阅读(345) 评论(0) 推荐(0)
摘要:一.函数 1.numpy 模块中的nonzero函数 nonzero返回的数非零元素的下标。 如果输入是单维度的时候它的返回值只有一个;如果输入是多个维度的话,那么它的返回值也是多个维度的。并且的它的每个维度的值表示的是非零元素在当前维度中的下标。 i.ea = [true, flase, flas 阅读全文
posted @ 2017-04-19 10:26 whatyouknow123 阅读(127) 评论(0) 推荐(0)
摘要:problem description: remove the nth node from the end of the list for example: given: 1->2->3 n = 1 return: 1->2 thought: first:you should know the le 阅读全文
posted @ 2017-04-18 10:01 whatyouknow123 阅读(176) 评论(0) 推荐(0)
摘要:problem description: this is the addition about the 3sum,you can use the method of solve the 3sum. given a integer and the target,you should return th 阅读全文
posted @ 2017-04-18 09:55 whatyouknow123 阅读(130) 评论(0) 推荐(0)
摘要:之前在台式机win10的系统,python 2.7,用的pycharm执行nltk download(),很顺利。然而到了我的笔记本只是换个一个win8的系统,Python的配置都是一样的,但是这时候它就开始报错,报的错还是因为读取不了xml文档。 百度了网上的一些内容,说是xml文档的问题。可是又 阅读全文
posted @ 2017-04-15 10:14 whatyouknow123 阅读(4438) 评论(1) 推荐(1)
摘要:一.先到python的官网上下载压缩包 二.将压缩包解压 三.将打开cmd,进入到解压文件所在的位置 四.键入 python setup.py install 阅读全文
posted @ 2017-04-14 19:30 whatyouknow123 阅读(2330) 评论(0) 推荐(0)
摘要:problem description: you should change the given digits string into possible letter string according to the phone keyboards. i.e. input '23' output [' 阅读全文
posted @ 2017-04-13 10:37 whatyouknow123 阅读(399) 评论(0) 推荐(0)
摘要:problem describe: given a string , first find the first word which is not white space;then there will be an optional '+' or '-', but the given the tes 阅读全文
posted @ 2017-04-10 12:45 whatyouknow123 阅读(240) 评论(0) 推荐(0)
摘要:problem description: given a string s, you shou find the longest palindromic substring in there for example:input :"ssaass" ouput:"ssaass" one solutio 阅读全文
posted @ 2017-04-07 12:41 whatyouknow123 阅读(179) 评论(0) 推荐(0)
摘要:最长不重复子串 阅读全文
posted @ 2017-04-01 10:45 whatyouknow123 阅读(226) 评论(0) 推荐(0)