摘要: 转载自:http://www.cnblogs.com/thinksasa/p/3334492.html 评:一不小心就会掉坑里 PHP的引用(就是在变量或者函数、对象等前面加上&符号) //最重要就是 删除引用的变量 ,只是引用的变量访问不了,但是内容并没有销毁 在PHP 中引用的意思是:不同的名字 阅读全文
posted @ 2016-08-25 13:47 CN.SnailRun 阅读(224) 评论(0) 推荐(0) 编辑
摘要: 转载:http://www.csdn.net/article/2014-12-19/2823234?utm_source=tuicool&utm_medium=referral 【导读】徐汉彬曾在阿里巴巴和腾讯从事4年多的技术研发工作,负责过日请求量过亿的Web系统升级与重构,目前在小满科技创业,从 阅读全文
posted @ 2016-07-21 15:43 CN.SnailRun 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 作者:helloworlds 链接:https://zhuanlan.zhihu.com/p/21348220 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 引文 4月份的时候看到一道面试题,据说是腾讯校招面试官提的:在多线程和高并发环境下,如果有一个平均运行一百 阅读全文
posted @ 2016-06-24 10:31 CN.SnailRun 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 1 概述 1.1 产生背景 在传统的IP网络中,所有的报文都被无区别的等同对待,每个转发设备对所有的报文均采用先入先出(FIFO)的策略进行处理,它尽最大的努力(Best-Effort)将报文送到目的地,但对报文传送的可靠性、传送延迟等性能不提供任何保证。 网络发展日新月异,随着IP网络上新应用的不 阅读全文
posted @ 2016-06-14 13:21 CN.SnailRun 阅读(2409) 评论(0) 推荐(0) 编辑
摘要: 1、倒排索引相关概念: 文档、文档集合、文档编号(DocId)、单词编号 倒排索引、单词词典、倒排列表、倒排文件 2、带有单词频率、文档频率和出现位置信息的倒排索引实例(实现term->DocID的映射关系,并附加主要的结果排序特征) 3、单词词表存储形式:哈希加链表、B树或B+树 4、倒排列表 在 阅读全文
posted @ 2016-06-12 17:00 CN.SnailRun 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 详细的讲述进程间通信在这里绝对是不可能的事情,而且笔者很难有信心说自己对这一部分内容的认识达到了什么样的地步,所以在这一节的开头首先向大家推荐著 名作者Richard Stevens的著名作品:《Advanced Programming in the UNIX Environment》,它的中文译本 阅读全文
posted @ 2016-06-11 16:50 CN.SnailRun 阅读(989) 评论(0) 推荐(0) 编辑
摘要: 对于windows来说,进程和线程的概念都是有着明确定义的,进程的概念对应于一个程序的运行实例(instance),而线程则是程序代码执行的最小单元。也就是说windows对于进程和线程的定义是与经典OS课程中所教授的进程、线程概念相一致的。 提供API,CreateThread()用于建立一个新的 阅读全文
posted @ 2016-06-11 16:50 CN.SnailRun 阅读(4417) 评论(0) 推荐(1) 编辑
摘要: epoll - I/O event notification facility在linux的网络编程中,很长的时间都在使用select来做事件触发。在linux新的内核中,有了一种替换它的机制,就是epoll。相比于select,epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在 阅读全文
posted @ 2016-06-11 01:42 CN.SnailRun 阅读(2315) 评论(0) 推荐(0) 编辑
摘要: 今天调试一个程序, 用到了core dump, 于是写出来, 记于此.什么是Core Dump?Core的意思是内存, Dump的意思是扔出来, 堆出来.开发和使用Unix程序时, 有时程序莫名其妙的down了, 却没有任何的提示(有时候会提示core dumped). 这时候可以查看一下有没有形如 阅读全文
posted @ 2016-06-11 01:42 CN.SnailRun 阅读(1376) 评论(0) 推荐(0) 编辑
摘要: 1、通用爬虫框架: 选取种子URL-》放入待抓取URL队列-》下载网页形成网页库-》已抓取URL队列-》抽取URL放入待抓取URL队列末尾 已下载网页集合 == 已过期网页集合 == 待下载网页集合 == 可知网页集合 == 不可知网页集合 2、禁抓协议:爬虫禁抓协议(robot.txt) + 网页 阅读全文
posted @ 2016-06-08 16:38 CN.SnailRun 阅读(1226) 评论(0) 推荐(0) 编辑