上一页 1 2 3 4 5 6 ··· 12 下一页

2011年12月22日

摘要: 在百度实习已经三个多月了。我但是就计划在百度实习三个月,然后到其他的公司,去感受不同的企业文化。百度其实挺好的,我在这里的三个月学到了太多太多的东西。 刚来的两周时间,压力非常的大,以前基本上没有接触到linux,到了百度后,首先就是要做新人题。从设计到代码,单测都要独立完成。这个过程非常折磨人,周末的时候,我都在写代码的,学会了使用各种各样的的内部库,学会了单测,学会了Makefile,学... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(261) 评论(0) 推荐(0)
摘要: 个人目录下: Web Crawled by myself # 自己爬取的数据集 cn 5 depth # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 cn-2010-01-01 # 用nutch 0.7.2爬取的数据集,限制在cn域中,包括链接和文本 dlut.edu.cn2010-01-01 # 用nutch 0.... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(945) 评论(0) 推荐(0)
摘要: 导航类的查询是指那些有明确寻址需求的查询,如“优酷网”或“优酷”等。目前很多互联网用户很可能只能记得百度等搜索引擎的网址,或把百度设置为首页,要进别的网站时,一般通过搜索来解决。 在搜索引擎中,对于导航类的查询,如果返回的第一条搜索结果不是目标网站的话,对用户的搜索体验是巨大的伤害。比如搜索“中国银行”,如果返回的不是中国银行的网站,而是某钓鱼网站的话,那很有可能对用户造成非常的伤害。因此,很有必... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(217) 评论(0) 推荐(0)
摘要: WordPress有一个社交媒体连接的插件,可以将博客更新同步到微博,但很可惜的是不能同步到人人网,本打算自己修改添加一下这个功能。到网上找资料,发现人人网有一个日志的导入功能。就在发布日志的那个页面的右下角。导入时,填入你的博客的地址,我填的是我的博客的rss地址。第一次导入,会让你选择需要导入的日志,以及哪些人可以查看。据说,以后,当检测到你的博客有更新的话,也会同步到人人网上。这个功能还是比较方便的,省去了自己开发插件了。具体位置如下图: 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(401) 评论(0) 推荐(0)
摘要: 伪原创对与百度和搜搜等国内搜索引擎来说,效果很好,但是谷歌貌似对很少会把伪原创的东西排上来。比如你搜一篇博客,在百度出来90%的第一条不是原创的内容,很有可能是转载的或是伪原创的,但是谷歌貌似在这方面做得很好。在网上搜了搜关于伪原创的东西,发现有好多软件,说明这个行业还是很有市场的。从百度文库搞到一个伪原创的同义词表,作弊和反作弊的都可以看看,也许能挖掘一些规则什么的。52537条伪原创词库 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(511) 评论(0) 推荐(0)
摘要: 后溪最早见于《黄帝内经•灵枢•本输》篇,为手太阳小肠经的输穴,又为八脉交会之一,通于督脉小肠经。有舒经利窍、宁神之功。适合经常坐在电脑前的上班族、发育中的孩子,可预防驼背、颈椎、腰部、腿部疼痛,也有保护视力、缓解疲劳、补精益气的功效。 后溪穴的位置如下图所示。 我们想想,当我们坐在电脑旁阅读文件的时候,手是怎么放的?肯定是一手不离鼠标,一手仍在键盘上吧!保持这个姿势不动,人都变僵了。这时,不妨... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(539) 评论(0) 推荐(0)
摘要: 今天qq上一个师弟向我咨询实习相关的问题。关于实习,其实也一直有很多话要说。我是今年5月份出来实习的,一直到现在,已经7个月了,4个月在百度联盟研发部,剩下的三个月在腾讯soso。这个过程中既有欢笑,也有茫然和痛苦。我在收获实习工资(虽然不是很多)的同时,得到了巨大的成长。 我这个人最大的特点是喜欢钻研,我并不是个很聪明的人,也不太善于与人交流,但我喜欢钻研问题,但往往在面试的过程中别人了解不到我... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(419) 评论(1) 推荐(1)
摘要: 1、一个随机数产生器以概率p生成0,以概率(1-p)生成1,怎样生成等概率的0和1? 如果用这个随机数产生器产生两个位,出现00的概率为,出现01的概率为,出现10的概率为,出现11的概率为。看到没有,出现01和10的概率相等。那么我们就可以用这个随机数生成器每次产生2位,直到产生的是01或者10,当为01时,输出0,当为10时输出1。 问题扩展:还是给这么一个随机数产生器,要求等概率地产生。 解... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(606) 评论(0) 推荐(0)
摘要: Given a matrix in which each row and each column is sorted, write a method to find an element in it. Assumptions:»»Rows are sorted left to right in ascending order. Columns are sorted top to bottom in... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(165) 评论(0) 推荐(0)
摘要: Write a method to compute all permutations of a string. 翻译:写一个计算一个字符串所有排列的算法。 [方法1] 递归的方法 首先字符串分为a[0,1,...,n-2]和a[n-1]两部分,然后将递归求解a[0,1,...,n-2]的所有排列,最后将a[n-1]插入到a[0,1,...,n-2]的所有排列中去(注意一共有n个插入点) 代码如下... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(255) 评论(0) 推荐(0)
摘要: 昨天去小米笔试了,其中一道大题是求一个字符串的所有排列,如“AAB”的所有排列为{“AAB”、“ABA”,“BAA”},这道题在我之前的博客中有研究过,所以不赘述,请查看这里。 另外一道题是给定一些线段,线段有起点和终点,求这些线段覆盖的距离,重复的部分只计算一次。这道题其实应该也算比较easy了,昨天笔试的时候,写得有点复杂了。今天整理了一下思路:首先排序,起点低的在前面,起点相同的按终点排。然... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(663) 评论(0) 推荐(0)
摘要: 7K7K 2000W数据库 thunder://QUFodHRwOi8veGxpc3N1ZTExMC5zYW5kYWkubmV0LzdrN2syMDAw5LiHXzIwNDcucmFyP2ZpZD1iYXhLQ2sqeEtzWW9tUUVUSHBFS0x2ZjJGR2pBYmlNTUFBQUFBSzlqWEhHZXBQNFYwV09obHRhR2hqaGlheEJTJm1pZD02NjYmdGhy... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(2731) 评论(0) 推荐(0)
摘要: 对于一个网页来说,一般都会有非常丰富的边框或导航条信息,但是用户往往比较专注于主题内容,边框内容可以说是没有太大价值的。尤其是对于手持设备来说,显示大量的边框信息将变得非常讨厌。在搜索引擎中,其实只要搜索引网页的主题内容,对于边框内容的索引意义不大。 上面说了一下提取一个网页主体内容的作用,下面来讨论一下方法。如果真要准确地提取一个网页的主题将非常困难,因为网页的结构多种多样,如果要做到程序自动化... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(347) 评论(0) 推荐(0)
摘要: 看到李开复老师在微博上发ppt,感觉挺好的。原来新浪微博开通了发多张图片进行拼接的功能,这样就可以把ppt转成图片,然后再发布到新浪微博上。但是新浪微博有最多9张图片的限制,这个比较不爽,而对于腾讯微博,还不能发多张图片,这个就更不爽了。所以自己就写了一个将图片拼接起来的程序,用C#写的,非常简单,其实就一个函数,总的代码也不过130行,核心拼接函数如下: /// ... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(3778) 评论(0) 推荐(1)
摘要: 上网查了一下,官方貌似没有提供flash builder 4.5的下载,但是既然是基于eclipse的,那么应该能被安装在linux下。 首先,安装eclipse sudo apt-get install eclipse 然后,下载eclipse的flash builder 插件 最后就是安装了,运行 whereis eclipse 可以查看eclipse的安装路径,我这里找到的路径是:/u... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(341) 评论(0) 推荐(0)
摘要: Big endian machine: It thinks the first byte it reads is the biggest.Little endian machine: It thinks the first byte it reads is the littlest.举个例子,从内存地址0x0000开始有以下数据0x0000 0x120x0001 0x340x0002 0xab0x... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(213) 评论(0) 推荐(0)
摘要: 肚皮舞 Nobody 一个像夏天一个像秋天 其他节目1 其他节目2 其他节目3 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(188) 评论(0) 推荐(0)
摘要: 输出n对括号,正常打开,正常关闭的所有情况 [方法1] 采用递归的思路/** 输出n对括号,正常打开,正常关闭的所有情况 采用递归的思路 首先采用递归求出n-1对括号,所有正常的组合 然后,对于n-1对括号的每一种情况(用*表示)都有3中情况:(*),()*,*() 注意:第二种情况和第三种情况,可能是一样的,也可能不一样 对于一样的情况只能算作一种 **/ vector parentheses(... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(165) 评论(0) 推荐(0)
摘要: screen是一个很好的bash保存的工具,可以保存你现有的工作,网上有很多关于这个的配置,我找了一个精简了一下,个人感觉还是很不错的: #se the startup message startup_message off term linux ##use ` as the Global Key ## escape `` ##set a biger buffer defscro... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(339) 评论(0) 推荐(0)
摘要: 又到一年招聘时,公司和同学都面对选择的问题。公司想招到牛的人,同学想找到牛逼的公司。大家也都相互攀比着offer的情况。我也在几家公司中徘徊过,或者说现在也还在徘徊中。面对大公司或者小公司,大公司与大公司,小公司与小公司之间有各种各样的选择。 但是我的思路越来越清晰了。首先是要好好的定位自己。不妨问自己几个问题。你擅长什么?你喜欢做什么?你将来想成为什么样的人?什么对你来说是重要的?对于我来说,第... 阅读全文
posted @ 2011-12-22 22:41 小橋流水 阅读(207) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 12 下一页

导航