上一页 1 2 3 4 5 6 7 8 ··· 12 下一页

2011年10月7日

摘要: 昨天写了一篇关于提取网页主题内容的文章,其中用到了一个叫SgmlReader将html标准化成xhtml格式的东西。今天在查询其相关信息的时候,发现了NReadability这个东东,发现这个东西也是提取网页主题内容的,发现效果貌似比我写的那个简单的要好很多。获取代码请访问github。 该工具中还带SgmlReader的源代码,可以说是很给力的,其中还为Xml Dom写了一些关于html Dom... 阅读全文
posted @ 2011-10-07 10:30 小橋流水 阅读(237) 评论(0) 推荐(0) 编辑

2011年9月28日

摘要: 一篇文章,切完词之后放到一个vector中,一个查询切完词也放到一个vector中,写一个函数找出这篇文章中包含这个查询中所有词的最小区间的i和j。只要返回第一个即可。 当时很坑爹,直觉告诉我要建索引,而且建索引也对了,但是建完之后就不知道怎么搞了,后台他提示一句,有些是不需要比较的,才得到灵感,想出了解决办法,但是写起代码来,又掉链子了,可能是在纸上写代码没有什么经验吧,在电脑上,我写代码还是... 阅读全文
posted @ 2011-09-28 17:17 小橋流水 阅读(416) 评论(0) 推荐(0) 编辑

2011年9月27日

摘要: 上周六去面人民搜索了,师兄推荐的,约的是下午两点一刻笔试。中午没吃饭就出发了,到的时候差不多1:30左右。害怕迟到,所以就没有吃午饭。 挺到两点一刻的时候,发现还没有轮到我面试,我就去问了一下前台,前台告诉我要稍微等一下,因为前面的人还没有面试完。然后我就问她下面有没有自动售货机能买点吃的。她听到我没有吃饭,她告诉我她们那里还有饭。后来她就带我去吃饭了,那里还放着几份盒饭,我吃了一盒炒面,不是很好... 阅读全文
posted @ 2011-09-27 22:30 小橋流水 阅读(216) 评论(0) 推荐(0) 编辑

2011年9月14日

摘要: 在腾讯做新人题,在开发机上写了一个程序,拷贝到运行机器上,运行的时候发现libstdc++.so.6: version `GLIBCXX_3.4.9' not found和libstdc++.so.6: version `GLIBCXX_3.4.11' not found的错误。strings了一下/lib64/libstdc++.so.6,确实没有发现GLIBCXX_3.4.9和GLIBCXX_... 阅读全文
posted @ 2011-09-14 23:03 小橋流水 阅读(170) 评论(0) 推荐(0) 编辑

2011年9月6日

摘要: 在基础笔试或面试中,这个问题经常被问到。 总结来说,有三种常用的用法: 函数内:这是我最先接触到的一种用法,还记得大一的时候,王寻雨老师(本部的一个老师,名字可能写错)给我们讲的,至今还记忆犹新。该用法就是在函数内定义的static变量,在所有的函数调用中都是用是同一个变量,常用来记录函数调用的次数等统计信息。 类成员变量和成员函数:这个无需多说,属于类的,而不属于对象的变量和函数需要加上... 阅读全文
posted @ 2011-09-06 20:24 小橋流水 阅读(206) 评论(0) 推荐(0) 编辑

2011年9月2日

摘要: 我们知道ip其实在计算机内部是用一个u_int就可以存储的,但是为了便于记忆,平时表示的时候采用的是点分十进制,那如果给你一个ip,你如何将他转化成一个long呢? 简单写了一个: #include using namespace std; long ip2long(const char *ip) { long l = 0, lt = 0; char str[4]; int len... 阅读全文
posted @ 2011-09-02 00:30 小橋流水 阅读(464) 评论(0) 推荐(0) 编辑

2011年9月1日

摘要: 给定一个高度和宽度组成的网格,返回该网络中总共的长方形(不包括正方形)的个数。Eg:width=3,height=3。 我们不妨考虑一个3*4的网格。首先我们考虑在什么情况下,出来的是正方形。当长和宽相等时,出来的就是正方形了。撇开正方形不考虑,一个3*4的网格中有多少个1*1不同的格子呢,很简单,就是12个。那有多少个1*2的格子呢?想一下,比如在第一行,应该3个,即4-2+1个,那总共有3*... 阅读全文
posted @ 2011-09-01 00:20 小橋流水 阅读(551) 评论(0) 推荐(0) 编辑

2011年8月18日

摘要: 今天请了一下午的假,去了一家叫做NHN的韩国公司面试,一共面了四面:3个技术和一个hr面的,看情况应该能给实习的offer。第一个面的是小兵,问的问题都很基础。我了个去,又问了关于多台的实现,上次在小米的面试就遇到这个了,我就告诉他我知道虚函数表那个东西,糊弄过去了,看来有时间该好好看看了。主要问了一下我在百度干了些什么,问了我的工作的情况。 第二个来面试的应该是一个组长级别的人,这个人应该有一... 阅读全文
posted @ 2011-08-18 22:58 小橋流水 阅读(236) 评论(0) 推荐(0) 编辑

2011年8月15日

摘要: 最近去一家公司面试了,面试官给我出了一道非常简单的题目,让我在纸上写下来。题目是:实现一个strncpy函数。 我很快就写完了: char *strncpy(char *dest, const char *src, size_t n) { for (int i =0; i 大家有没有看出什么问题呢?面试官开始还没有发现,后来下一个面试官过来的时候,发现一个问题。如果了解for循环的话,... 阅读全文
posted @ 2011-08-15 23:17 小橋流水 阅读(164) 评论(0) 推荐(0) 编辑

2011年4月15日

摘要: 陆续开始复习一下网络知识,把以前的东西全部捡回去 服务端: /* * File: main.cpp * Author: ziqiao * * Created on 2011年4月15日, 上午11:06 */ #include #include #include #include #include #include #include #include #inclu... 阅读全文
posted @ 2011-04-15 13:02 小橋流水 阅读(140) 评论(0) 推荐(0) 编辑

2011年4月1日

摘要: 前两天投微软实习的简历,网站要求小于200k,最好是100k,而我做的简历竟然有1.5M。我想了很多方法来压缩,都不管事。 首先,我将简历中的所有图片去除发现还有900多k,然后我将原本两页的简历缩减成1页,奇了个怪了,还有500多k。 没辙了,都想放弃了,后来想想是不是因为我用的简历模板是从一个有很多简历模板的文件中拷贝出来的原因。我猜测可能是带了一些这个简历中根本不存在的格式或设置的原因。 因... 阅读全文
posted @ 2011-04-01 02:17 小橋流水 阅读(149) 评论(0) 推荐(0) 编辑

2011年3月30日

摘要: 有一组数字,从1到n中减少了一个数,顺序也被打乱了,放在一个n-1的数组里,请找出丢失的数字。 用1+2+...+n(即n(n+1)/2)减去当前输入数据的总和。时间复杂度为O(n),空间复杂度O(1),缺点是容易溢出。缓解溢出的方法,求1+2+...+n的时候,边加边减。假如数组为a,那么这可以这么计算1-a[0]+2-a[1]+...+(n-1)-a[n-2]+n。 用1*2*...*n除... 阅读全文
posted @ 2011-03-30 11:39 小橋流水 阅读(813) 评论(0) 推荐(0) 编辑
摘要: 给定一个一个数,找出二进制表示有相同数量1的最大的和最小的数。 分析:首先考虑正数,我们将1尽可能放到高位(除符号位)。对于负数,就稍微复杂一点,因为在我们计算机上,负数是用补码表示的,对于补码,1应该竟可能放到低位(除符号位)。知道这些,就很容写出代码来了,下面是参考代码。 #include using namespace std;// 1的个数int ones(unsigne... 阅读全文
posted @ 2011-03-30 08:01 小橋流水 阅读(245) 评论(0) 推荐(0) 编辑

2011年3月28日

摘要: 今天将firefox升级到了4.0,有一些改变,非常好,但是也有一些插件不能用。有的插件倒无所谓,但是Gmarks不能用了,我不能接受,我所有的书签都是靠这个插件来管理的,不能用的话,非常不习惯。上网搜了搜,最后的解决办法是,有人升级了该插件,放到了google code上,地址如下:http://code.google.com/p/gmarks/,喜欢firefox 4又在使用Gmarks的朋友... 阅读全文
posted @ 2011-03-28 06:21 小橋流水 阅读(153) 评论(0) 推荐(0) 编辑

2011年3月22日

摘要: 今天无意间看到ACE的博客,发现apt-get有加速工具apt-fast,apt-fast的加速原理就是利用axel来取代wget。想当初我就想想办法将apt-get的下载工具改成axel,但是由于自己水平有限,一直没有实现。原来早有大牛已经实现。 下面讲一下安装的过程:1 sudo add-apt-repository ppa:tldm217/tahutek.net2 sudo apt-get ... 阅读全文
posted @ 2011-03-22 13:56 小橋流水 阅读(257) 评论(0) 推荐(0) 编辑
摘要: 实现一个挺高级的字符匹配算法:给一串很长字符串,要求找到符合要求的字符串,例如目的串:1231******3***2 ,12*****3 这些都要找出来其实就是类似一些和谐系统。。。。。 这题的真正意思就是,给你一个目标串,如“123”,只要一个字符串里面同时包含1、2和3,那么这个字符串就匹配了。系统越和谐,说明错杀的可能行也就越大。加入目标串的长度为m,模式串的长度为n,我们很容易想到O(... 阅读全文
posted @ 2011-03-22 01:20 小橋流水 阅读(287) 评论(0) 推荐(0) 编辑

2011年3月21日

摘要: #####ubuntu10.04#####deb http://mirror.dlut.edu.cn/ubuntu/ lucid main restricteddeb-src http://mirror.dlut.edu.cn/ubuntu/ lucid main restricteddeb http://mirror.dlut.edu.cn/ubuntu/ lucid-updates main ... 阅读全文
posted @ 2011-03-21 10:27 小橋流水 阅读(334) 评论(0) 推荐(0) 编辑
摘要: 有两个序列a,b,大小都为n,序列元素的值任意整数,无序;要求:通过交换a,b 中的元素,使[序列a 元素的和]与[序列b 元素的和]之间的差最小。例如:var a=[100,99,98,1,2, 3];var b=[1, 2, 3, 4,5,40]; ———————————————————— 2011年3月23日更新 感谢lambda2fei同学的提醒,下面的介绍的贪心方法,对于有的测试... 阅读全文
posted @ 2011-03-21 04:14 小橋流水 阅读(751) 评论(0) 推荐(0) 编辑

2011年3月17日

摘要: 个整型数组里除了两个数字之外,其他的数字都出现了两次。请写程序找出这两个只出现一次的数字。要求时间复杂度是O(n),空间复杂度是O(1)。可能大家都见识过找出一个只出现一次的数,直接把所有的数异或就可以了,最终的结果就是这个数了。但是如果出现两个这样的数,那又将如何呢? 假如这两个数为a和b,那么将所有的数异或得到的数必定为a^b。由于a和b不相等,那么a^b != 0,也就是说在a^b中必定至少... 阅读全文
posted @ 2011-03-17 05:26 小橋流水 阅读(270) 评论(0) 推荐(1) 编辑

2011年3月16日

摘要: 输入一个整数数组,调整数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分。要求时间复杂度为O(n)。这题跟之前的排好序列求和有点类似。我们可以永类似于快速排序的方法来做:用一个头指针和一个尾指针,向中间扫描,前面遇到偶数,后面遇到奇数暂停,交换这两个指针的指向,接着向中间扫描,直到两个指针相遇。 代码实现如下:代码 1 /* 2 * File: main.cpp ... 阅读全文
posted @ 2011-03-16 11:31 小橋流水 阅读(196) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 12 下一页

导航