摘要: 1.17搜索17搜索基本框架已经搭好,从博客园、CSDN、月光博客收录的博文也越来越多,功能涵盖了基本的重要网页优先抓取、多线程抓取、间隔抓取、中断抓取、url查重、博文抽取、标题分词、倒排索引、查询、网页排名、自动摘要、页面翻转等,但在具体算法效率和可扩展性都还存在很多问题进步解决,下一步的重点主要还是放在服务器端,待完成的任务主要有重要关键词cache、线程池、DNS自动解析、压缩存储等,路还很长继续加油。2.准备找工作目标单位:北京大中型互联网公司。2.1重点要读的书重点是算法思想、底层原理、基础和常见的笔面题。算法分析与设计、数据结构、深入理解计算机系统(内存管理、进程调度)、深度理解 阅读全文
posted @ 2013-06-13 09:40 路过你的苦 阅读(167) 评论(2) 推荐(0)
摘要: 1.一般模式1.1光标移动光标移动:上下左右键翻页:ctrl+f(pagedown)向下移动一页,ctrl+d向下移动半页;ctrl+b(pageup)向上移动一页,ctrl+u向上移动半页移动至该行最前面:0或home移动至该行最后面:$或end移动至该文件最后一行:G;nG移动这个文件的第n行;纯数字光标向下移动n行;gg相当于1G光标移动至该文件第一行1.2查找替换:n1,n2s/word1/word2/g:在第n1-n2行间查找word1并替换为word2:1$s/word1/word2/g:全文查找word1并替换为word2:1s/word1/word2/gc:全文查找word1并 阅读全文
posted @ 2013-06-13 07:29 路过你的苦 阅读(236) 评论(0) 推荐(0)