上一页 1 2 3 4 5 6 ··· 34 下一页
摘要: vivim简明教程(写的不错),vim使用Vim静态模板文件(自动生成固定格式)打造自己的vim界面ShellLinux Shell脚本教程:30分钟玩转Shell脚本编程Linux入门教程(正则表达式,shell脚本)Bash Shell字符串操作小结命令linux中grep命令的用法linux之... 阅读全文
posted @ 2014-05-22 17:46 七年之后 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 求一个字符串的最长重复子串:1.求字符串s的后缀数组suffix2.suffix排序3.求最长公共前缀#include#include#include#include#include#include#include#include#include#include#include#includeusi... 阅读全文
posted @ 2014-04-24 15:06 七年之后 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 一.面向程序设计中的static1.静态全局变量该变量在全局数据区分配内存;未经初始化的静态全局变量会被程序自动初始化为0;静态全局变量在声明它的整个文件都是可见的,而在文件之外是不可见的;2.静态局部变量该变量在全局数据区分配内存;静态局部变量在程序执行到该对象的声明处时被首次初始化,即以后的函数... 阅读全文
posted @ 2014-04-23 14:48 七年之后 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 终于把单击模式跟伪分布式模式搭建起来了,记录于此。1.SSH无密码验证配置因为伪分布模式下DataNode和NameNode均是本身,所以必须配置SSH localhost的无密码验证。第一步,安装并启动SSH:~$ sudo apt-get install openssh-server~$ sud... 阅读全文
posted @ 2014-04-21 20:31 七年之后 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 1.交叉验证将全部训练集S分成k个不相交的子集,{S1,S2,...,Sk},假设训练样本有m个,那么每个子集有m/k个训练样例对于模型集合M中的一个Mi,每次挑选k-1个子集{S1,S2,...,Sj-1,Sj+1,...,Sk}做训练,得到假设函数hij,用剩下一个子集Sj做训练,得到经验误差ε... 阅读全文
posted @ 2014-04-20 22:25 七年之后 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 一.半监督学习 在传统的有监督学习中,我们通过训练大量有标记数据得到一个强学习器,然后预测一个未知样例。而现实生活中,通常数据集中大量数据是无标记的,只有很少一部分是有标记的。比如在电子商务系统中,我们需要推荐用户感兴趣的商品,然而只有很少的用户会主动标记他们感兴趣的商品,系统中还存在着大量其他的商品,它们都可作为未标记示例来使用。我们的目标就是利用这些大量的、廉价的无标记数据帮助我们得到更好的训练模型。 贝叶斯公式P(Ci|x)=ΣP(x|Ci)P(Ci)/P(x),表明我们可以将先验概率P(Ci)转换为后验概率P(Ci|x)。P(Ci|x)代表在输入示例的特征向量x的条件下该示例类... 阅读全文
posted @ 2014-04-01 13:05 七年之后 阅读(3168) 评论(0) 推荐(0) 编辑
摘要: 关于线性回归,推荐几篇博文,讲得很好:JerryLead的对线性回归,logistic回归和一般回归的认识leftnoteasy的机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)苏冉旭的博客的Logistic regression (逻辑回归) 概述本文主要是我对线性回归的一些理解。一.线性回归 线性回归假设特征x和结果y满足线性关系。线性回归的目标函数为: 线性回归的损失函数为: 可以用梯度下降法或者最小二乘法调整θ来最小化这个J(θ)。 梯度下降法:J(θ)对θ求导得到: 那么θ的更新可以表示为: 最小二乘法:用no... 阅读全文
posted @ 2014-03-25 16:29 七年之后 阅读(826) 评论(0) 推荐(0) 编辑
摘要: K-近邻和最近邻(K=1)是模式识别中常用的分类方法,K-近邻算法思想是找到与当前样本相邻的K个有标签样本,然后通过投票决定此样本的类别。例如下图中如何分类未知的绿色圆圈呢? 例如我们可以取K=3个临近的样本时,通过投票(红色两个大于蓝色一个),从而将绿色圆圈归于红色三角一类。一.基于实例的学习 K-近邻和局部加权回归就是基于实例的学习。基于实例的学习过程只是简单的存储已知的训练数据,当遇到新的待分类样本时,将从训练数据中挑选出一系列相似的样本,并用来分类新的样本。 与常见的分类算法(如神经网络)不同的是,基于实例的方法可以为不同的待分类样本建立不同的函数逼近。只建立目标函数... 阅读全文
posted @ 2014-03-21 11:41 七年之后 阅读(1762) 评论(0) 推荐(0) 编辑
摘要: 一.inode 在Linux中,“一切皆文件”。唯一标识文件的是inode而非文件名,文件名仅是为了方便人们的记忆和使用,系统或程序通过 inode 寻找正确的文件数据块。 什么是数据块呢?文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存512字节(相当于0.5K... 阅读全文
posted @ 2014-03-13 21:48 七年之后 阅读(1646) 评论(0) 推荐(0) 编辑
摘要: Given two words (startandend), and a dictionary, find all shortest transformation sequence(s) fromstarttoend, such that:Only one letter can be changed at a timeEach intermediate word must exist in the dictionaryFor example,Given:start="hit"end="cog"dict=["hot","dot 阅读全文
posted @ 2014-03-13 13:35 七年之后 阅读(228) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 34 下一页