07 2013 档案
摘要:一、搭建yii框架一、首先你得下个YII框架的源码 ;下载地址:http://www.yiiframework.com/download/二、把下载到的源码解压放到一个PHP可访问的位置;如我的 F:/site(已具备了php环境了哦!);与此同时,在site文件夹下会看到解压到的相关文件及文件夹有...
阅读全文
摘要:转自:http://www.cnblogs.com/cardon/archive/2009/12/13/1622935.html本例安装文件在这里下载 apache2.2.4 MySQL5.0.37 php5.2.1(zip)1.Apache的安装1点击apahce安装包 2接受协议 3下面3项随便填即可 apache监听80端口.如果iis用了80端口,修改iis端口或者apache端口,以免冲突 4这里默认的是typical,建议选custom,点击next. 5这里可用修改安装路径,注意安装路径不能含中文. 6点击install开始安装 7安装完成后在浏览器里打入http://loc..
阅读全文
摘要:转自:http://blog.sina.com.cn/s/blog_4b208fd90100v2pn.html网络爬虫爬取策略,注意爬虫爬取网站的频率网络爬虫(web crawler)又称为网络蜘蛛(web spider)是一段计算机程序,它从互联网上按照一定的逻辑和算法抓取和下载互联网的网页,是搜索引擎的一个重要组成部分。一般的爬虫从一部分 start url(种子url)开始,按照一定的策略开始爬取,爬取到的新的url在放入到爬取队列之中,然后进行新一轮的爬取,直到抓取完毕为止。我们看一下crawler一般会遇到什么样的问题吧:量大:抓取的网页量很大更新:网页更新量也很大,一般的网站,比如
阅读全文
摘要:1.STL hash_map2.socket3.网页抓取原理(http协议)4.linuxgrep/top/kill/vi/gdb5.推荐系统协同过滤算法6.数据挖掘关联规则/分类/聚类朴素贝叶斯特征提取信息熵TF-IDF7.项目一起搜索8.10亿个整数,内存1G,找出中位数9.5亿条查询,如何找出top-N
阅读全文
摘要:1.博文抽取2.多线程一个进程整型变量n=0,十个线程分别编号1-10,多线程实现分别+1,但是要求线程必须在变量为相应编号时+1。3.socket客户端+服务端4.socket阻塞非阻塞同步、异步、阻塞、非阻塞5.网页排名6.select()函数7.插入排序和冒泡排序的思想及区别
阅读全文
摘要:转自:http://wenku.baidu.com/view/15d18b4533687e21af45a9a4.html1.C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构操作。vector封装数组,list封装了链表,map和set封装了二叉树等。2.标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树:红黑树,也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般的平衡二叉树。3.
阅读全文
摘要:1.树的遍历深度、广度、前中后序2.linuxVIM:文本编辑器;AWK:awk '{pattern + action}' 或者 awk 'pattern {action}';一种编程语言,因其模式匹配语法而特别有用,通常用于数据检索和数据转换;一行分成数段操作。GREP:从结果中选取内容,cut;sed:sed[options]'command'file(s),sed[options]-fscriptfilefile(s) ;整行操作。3.项目(1)内容抽取(文章抽取[起止标签]、自动摘要[替换标签,取前500])(2)索引(中文二级hash+
阅读全文
摘要:1.快速排序2.堆排序3.归并排序[o(n);o(nlog);稳定排序]void MergeSort(int a[],int left,int right){if(left<right){ //至少有2个元素int mid=(left+right)/2; //取中点left+(right-left)/2MergeSort(a,left,mid);MergeSort(a,mid+1,right);Merge(a,b,left,mid,right); //合并到数组bCopy(a,b,left,right); //复制回数组a }}void Merge(int...
阅读全文
浙公网安备 33010602011771号