随笔列表第2页 - 七年之后

2014年5月22日

摘要： vivim简明教程（写的不错），vim使用Vim静态模板文件（自动生成固定格式）打造自己的vim界面ShellLinux Shell脚本教程：30分钟玩转Shell脚本编程Linux入门教程（正则表达式，shell脚本）Bash Shell字符串操作小结命令linux中grep命令的用法linux之... 阅读全文

posted @ 2014-05-22 17:46 七年之后阅读(245) 评论(0) 推荐(0) 编辑

2014年4月24日

后缀数组求字符串最长重复子串

摘要：求一个字符串的最长重复子串：1.求字符串s的后缀数组suffix2.suffix排序3.求最长公共前缀#include#include#include#include#include#include#include#include#include#include#include#includeusi... 阅读全文

posted @ 2014-04-24 15:06 七年之后阅读(626) 评论(0) 推荐(0) 编辑

2014年4月23日

static关键字

摘要：一.面向程序设计中的static1.静态全局变量该变量在全局数据区分配内存；未经初始化的静态全局变量会被程序自动初始化为0；静态全局变量在声明它的整个文件都是可见的，而在文件之外是不可见的；2.静态局部变量该变量在全局数据区分配内存；静态局部变量在程序执行到该对象的声明处时被首次初始化，即以后的函数... 阅读全文

posted @ 2014-04-23 14:48 七年之后阅读(213) 评论(0) 推荐(0) 编辑

2014年4月21日

ubuntu下搭建hadoop平台

摘要：终于把单击模式跟伪分布式模式搭建起来了，记录于此。1.SSH无密码验证配置因为伪分布模式下DataNode和NameNode均是本身，所以必须配置SSH localhost的无密码验证。第一步，安装并启动SSH：~$ sudo apt-get install openssh-server~$ sud... 阅读全文

posted @ 2014-04-21 20:31 七年之后阅读(252) 评论(0) 推荐(0) 编辑

2014年4月20日

机器学习中的一些概念

摘要： 1.交叉验证将全部训练集S分成k个不相交的子集，{S1，S2，...，Sk}，假设训练样本有m个，那么每个子集有m/k个训练样例对于模型集合M中的一个Mi，每次挑选k-1个子集{S1，S2，...，Sj-1，Sj+1，...，Sk}做训练，得到假设函数hij，用剩下一个子集Sj做训练，得到经验误差ε... 阅读全文

posted @ 2014-04-20 22:25 七年之后阅读(366) 评论(0) 推荐(0) 编辑

2014年4月1日

多视角学习-协同训练

摘要：一．半监督学习在传统的有监督学习中，我们通过训练大量有标记数据得到一个强学习器，然后预测一个未知样例。而现实生活中，通常数据集中大量数据是无标记的，只有很少一部分是有标记的。比如在电子商务系统中，我们需要推荐用户感兴趣的商品，然而只有很少的用户会主动标记他们感兴趣的商品，系统中还存在着大量其他的商品，它们都可作为未标记示例来使用。我们的目标就是利用这些大量的、廉价的无标记数据帮助我们得到更好的训练模型。贝叶斯公式P(Ci|x)=ΣP(x|Ci)P(Ci)/P(x)，表明我们可以将先验概率P(Ci)转换为后验概率P(Ci|x)。P(Ci|x)代表在输入示例的特征向量x的条件下该示例类... 阅读全文

posted @ 2014-04-01 13:05 七年之后阅读(3168) 评论(0) 推荐(0) 编辑

2014年3月25日

线性回归与逻辑回归

摘要：关于线性回归，推荐几篇博文，讲得很好：JerryLead的对线性回归，logistic回归和一般回归的认识leftnoteasy的机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)苏冉旭的博客的Logistic regression （逻辑回归）概述本文主要是我对线性回归的一些理解。一.线性回归线性回归假设特征x和结果y满足线性关系。线性回归的目标函数为：线性回归的损失函数为：可以用梯度下降法或者最小二乘法调整θ来最小化这个J(θ)。梯度下降法：J(θ)对θ求导得到：那么θ的更新可以表示为：最小二乘法：用no... 阅读全文

posted @ 2014-03-25 16:29 七年之后阅读(826) 评论(0) 推荐(0) 编辑

2014年3月21日

K-近邻算法

摘要： K-近邻和最近邻（K=1）是模式识别中常用的分类方法，K-近邻算法思想是找到与当前样本相邻的K个有标签样本，然后通过投票决定此样本的类别。例如下图中如何分类未知的绿色圆圈呢？例如我们可以取K=3个临近的样本时，通过投票（红色两个大于蓝色一个），从而将绿色圆圈归于红色三角一类。一.基于实例的学习 K-近邻和局部加权回归就是基于实例的学习。基于实例的学习过程只是简单的存储已知的训练数据，当遇到新的待分类样本时，将从训练数据中挑选出一系列相似的样本，并用来分类新的样本。与常见的分类算法（如神经网络）不同的是，基于实例的方法可以为不同的待分类样本建立不同的函数逼近。只建立目标函数... 阅读全文

posted @ 2014-03-21 11:41 七年之后阅读(1762) 评论(0) 推荐(0) 编辑

2014年3月13日

硬链接、软链接和inode

摘要：一.inode 在Linux中，“一切皆文件”。唯一标识文件的是inode而非文件名，文件名仅是为了方便人们的记忆和使用，系统或程序通过 inode 寻找正确的文件数据块。什么是数据块呢？文件储存在硬盘上，硬盘的最小存储单位叫做"扇区"（Sector）。每个扇区储存512字节（相当于0.5K... 阅读全文

posted @ 2014-03-13 21:48 七年之后阅读(1646) 评论(0) 推荐(0) 编辑

[LeetCode]Word Ladder II

摘要： Given two words (startandend), and a dictionary, find all shortest transformation sequence(s) fromstarttoend, such that:Only one letter can be changed at a timeEach intermediate word must exist in the dictionaryFor example,Given:start="hit"end="cog"dict=["hot","dot 阅读全文

posted @ 2014-03-13 13:35 七年之后阅读(228) 评论(0) 推荐(0) 编辑

七年之后

Nothing can replace hardwork!

公告