随笔分类 - 算法
摘要:svmc4.5 十个维度,在某一分叉点 如何选择 哪一个维度 为指标http://blog.csdn.net/xuxurui007/article/details/18045943选择信息增益率最大的属性。
阅读全文
摘要:按是否涉及数据的内外存交换, 内部排序(记录个数不是很多的小文件) 外部排序(记录个数太多,不能一次将全部记录放入内存)按策略划分 内部排序:1、插入排序(直接插入排序、希尔排序)2、交换排序(冒泡排序、快速排序)3、选择排序(直接选择排序、堆排序)4、归并排序5、分配排序(桶排序,基数排序);这里...
阅读全文
摘要:部排序指的是大文件的排序,即待排序的记录存储在外存储器上,待排序的文件无法一次装入内存,需要在内存和外部存储器之间进行多次数据交换,以达到排序整个文件的目的。我们一般提到排序都是指内排序,比如快速排序,堆排序,归并排序等,所谓内排序就是可以在内存中完成的排序。RAM的访问速度大约是磁盘的25万倍,我...
阅读全文
摘要:来源:http://www.oschina.net/question/16_2639再学习了haffman算法之后发现压缩算法很有意思,上网查了点资料,这是做好的一篇(主要是我能理解)。前面几种都能看懂,关键是那个LZ77算法。这个是很强大的压缩算法,zip,rar用得都是这种算法,让我们来感叹下两...
阅读全文
摘要:http://www.cnblogs.com/waytofall/archive/2012/06/04/2534386.html散列表:是根据关键字(Key value)而直接访问在内存存储位置的数据结构。也就是说,它通过把键值通过一个函数的计算,映射到表中一个位置来访问记录,这加快了查找速度。这个...
阅读全文