代码改变世界

Solr4.8.0源码分析(10)之Lucene的索引文件(3)

2014-09-20 22:14 by 追风的蓝宝, 1142 阅读, 0 推荐, 收藏,
摘要:Solr4.8.0源码分析(10)之Lucene的索引文件(3)1. .si文件 .si文件存储了段的元数据,主要涉及SegmentInfoFormat.java和Segmentinfo.java这两个文件。由于本文介绍的Solr4.8.0,所以对应的是SegmentInfoFormat的子类Lu... 阅读全文

Solr4.8.0源码分析(9)之Lucene的索引文件(2)

2014-09-18 00:05 by 追风的蓝宝, 1654 阅读, 0 推荐, 收藏,
摘要:Solr4.8.0源码分析(9)之Lucene的索引文件(2)一.Segments_N文件 一个索引对应一个目录,索引文件都存放在目录里面。Solr的索引文件存放在Solr/Home下的core/data/index目录中,一个core对应一个索引。 Segments_N例举了索引所有有效的s... 阅读全文

Solr4.8.0源码分析(8)之Lucene的索引文件(1)

2014-09-17 23:47 by 追风的蓝宝, 1494 阅读, 0 推荐, 收藏,
摘要:Solr4.8.0源码分析(8)之Lucene的索引文件(1)题记:最近有幸看到觉先大神的Lucene的博客,感觉自己之前学习的以及工作的太为肤浅,所以决定先跟随觉先大神的博客学习下Lucene的原理。由于觉先大神主要介绍的是Lucene3.X系的,那我就根据源码以及结合觉先大神的来学习下4.X系的... 阅读全文

机器学习(5)之牛顿算法

2014-09-14 22:58 by 追风的蓝宝, 1463 阅读, 0 推荐, 收藏,
摘要:机器学习(5)之牛顿算法1. 牛顿迭代算法简介 设r是的根,选取作为r的初始近似值,过点做曲线的切线L,L的方程为,求出L与x轴交点的横坐标,称x1为r的一次近似值。过点做曲线的切线,并求该切线与x轴交点的横坐标,称为r的二次近似值。重复以上过程,得r的近似值序列,其中,称为r的次近似值,上式称为... 阅读全文

机器学习(4)之Logistic回归

2014-09-11 23:17 by 追风的蓝宝, 1316 阅读, 0 推荐, 收藏,
摘要:机器学习(4)之Logistic回归1. 算法推导 与之前学过的梯度下降等不同,Logistic回归是一类分类问题,而前者是回归问题。回归问题中,尝试预测的变量y是连续的变量,而在分类问题中,y是一组离散的,比如y只能取{0,1}。 假设一组样本为这样如图所示,如果需要用线性回归来拟合这些样本... 阅读全文

机器学习(3)之最小二乘法的概率解释与局部加权回归

2014-09-10 23:47 by 追风的蓝宝, 1436 阅读, 0 推荐, 收藏,
摘要:机器学习(3)之最小二乘法的概率解释与局部加权回归1.最小二乘法的概率解释在前面梯度下降以及正规方程组求解最优解参数Θ时,为什么选择最小二乘作为计算参数的指标,使得假设预测出的值和真正y值之间面积的平方最小化?我们提供一组假设,证明在这组假设下最小二乘是有意义的,但是这组假设不唯一,还有其他很多方法... 阅读全文

机器学习(2)之正规方程组

2014-09-08 22:11 by 追风的蓝宝, 3019 阅读, 1 推荐, 收藏,
摘要:机器学习(2)之正规方程组上一章介绍了梯度下降算法的线性回归,本章将介绍另外一种线性回归,它是利用矩阵求导的方式来实现梯度下降算法一样的效果。1. 矩阵的求导首先定义表示m×n的矩阵,那么对该矩阵进行求导可以用下式表示,可以看出求导后的矩阵仍然为m×n这里要用到矩阵迹的特性,trace. 对于一个n... 阅读全文

机器学习(1)之梯度下降(gradient descent)

2014-09-06 00:42 by 追风的蓝宝, 24356 阅读, 0 推荐, 收藏,
摘要:机器学习(1)之梯度下降(gradient descent)题记:最近零碎的时间都在学习Andrew Ng的machine learning,因此就有了这些笔记。梯度下降是线性回归的一种(Linear Regression),首先给出一个关于房屋的经典例子,面积(feet2)房间个数价格(1000$... 阅读全文

自然语言处理(3)之条件频率分布

2014-09-02 22:14 by 追风的蓝宝, 621 阅读, 0 推荐, 收藏,
摘要:自然语言处理(3)之条件频率分布条件频率分布式频率分布的集合,每个频率分布有一个不同的条件。从下面的例子就可以看出,cfd就是两个条件(news,romance)的频率分布集合 1 >>> cfd=nltk.ConditionalFreqDist( 2 ... ... 阅读全文

自然语言处理(2)之文本资料库

2014-08-27 23:54 by 追风的蓝宝, 1522 阅读, 0 推荐, 收藏,
摘要:自然语言处理(2)之文本资料库1.获取文本资料库本章首先给出了一个文本资料库的实例:nltk.corpus.gutenberg,通过gutenberg实例来学习文本资料库。我们用help来查看它的类型 1 >>> import nltk 2 >>> help(nltk.corpus.gutenb... 阅读全文