搜狗垂搜笔试

    网上看到了搜狗垂搜的实习招聘,网页抓取和网页处理方向,我挺喜欢这个方向的,同时本科接触过一点点这方面的知识,所以就投了简历,过了很久没有消息,然后突然有一天邮件通知我2月28号上午10点清华同方科技广场D栋19层笔试,那天我兴冲冲的跑到了清华科技园的D栋19层,开始拨打留下的那个电话,为什么我打不通呢,然后也看不到搜狗公司,当时那个急呀,都到10点了,然后赶快四处找人打听 ,原来清华同方科技广场和清华科技园不是一个地方,赶快打出租车去了清华同方科技广场,进搜狗的时候已经有3个人正在答题了,不过迟到了应该可以延长答题时间呢,哈哈,当时心情还是比较好的,下面说说能记住的一些笔试题吧,留点纪念,作的实在不怎么样了...

    前面都是比较小的题目,

    喝水问题,3个空瓶子换一瓶水,问100个人至少需要多少瓶水? 我想的方法是3+32*2=67

    两个向量<1,2,3>和<4,5,6>,求他们的余弦距离?余弦距离我不太清楚是什么概念,我写了一个余弦夹角的值...

    然后一个简单的聚类选择,说每个类别只属于一个类别的聚类方法?我选择的划分方法

    双向链表的删除节点问题

    无向图的边和节点的度的关系

    还有一个节点到另外一个节点有多少种走路方式,其中街道图如下:(我计算的结果是350)

    

    10个化学试剂瓶子本来均要装A试剂,但是其中一个错装了B试剂,A和B混合后60分钟发生明显化学反应,至少需要多少个试管能够在70分钟内检测出错误的B试剂?

    答案更新:此个题目解法应该这样理解,10个化学试剂瓶编号为0-9,0-9表示为2进制编码需要4位二进制编码。如下:

    0000,0001,0010,0011,0100,0101,0110,0111,1000,1001 , 这里我们利用4个化学试剂瓶,第一个瓶子装最高位为1的瓶子,第二个瓶子装第二高位为1的瓶子,第三个瓶子装第三高位为1的瓶子,第四个瓶子装最低位为1的瓶子,反应后哪个瓶子产生反应,相应位置填充1。则可得知错装了B试剂的瓶子编号。

    下列哪些数据结构适合频繁的插入和查找:A AVL B 哈希表 C 链表 D 最大堆    这个我选择的是AD,因为两个插入和查找代价不高。现在想想忘了哈希表了,当时只是可能觉得哈希表太难维护了,不太适合频繁插入,链表不适合频繁查找。

    还有一个题目不太会就是有1000个网页,其中包含搜狐的100,包含搜狗的80,同时包含搜狗搜狐的50,问互信息多少...我不理解互信息的概念,所以随便选择了一个选项...

    随机产生n个数字的和符合什么分布...我选择的均匀分布,其他还有一些奇怪的分布都不了解。

    还有一些数据挖掘分类方法,不过比较简单,选择下面哪种算法是分类方法,决策树啦,

    还有一个是关联规则挖掘名字的解释,让你选择上面描述的是那种数据挖掘方法

    其他的记忆的都不太清晰了,下面说一下大题吧,其实就是编程题目,不过笔试编程题目就是在白纸上写代码,是能够运行的代码,头文件什么的都要包含完整,这还真是个挑战,平时编程各种自动对齐,各种提示,写起来得心应手,真正的纸上写真是无语...乱写一通吧

    1、实现双向链表的插入和删除,函数的形式已经给了,只需要补充完整函数体即可。

    2、实现一个找出整数数组最大连续子序列和的问题,要给出起始位置,结束为止和最大和的值。

    3、实现一个大整数的减法,必须是字符串实现的,其实我更喜欢数组。

    上面3个还能够勉勉强强的有些思路,然后我把代码也稍微写了一下,有可能各种错误,因为平时我喜欢边写边调试,逐渐累积程序的过程,所以这种直接写很多压力很大,不知道思路对不对呢,主要是因为不是什么有难度的算法题目啦。

    最后一个题目也是让我比较伤心的,因为2个半小时的笔试时间,我差不多快2个小时的时候就走了,就是因为最后一个题目完全不了解... 

    内容是利用C++实现一个线程安全的单例模式类。

    首先,线程安全实现这个不知道,只了解应该是互斥、同步什么的,操作系统中了解过一些这方面的东西,但是这个不会,那么单例模式呢,这个也不会呀,只是知道这个类只能够创建一次吧。具体实现也不会,最后我就直接空在那里交了笔试试卷了。不知道会不会有后续,其实真的对这个职位挺感兴趣的,只能怪自己知识不足吧。设计模式我完全不会的,室友他们本科都学了,为什么我们本科没有开设这么一门课程呢,虽然最后一年浏览了大话设计模式的24种设计模式,可是现在一点点都不记得了...

    以上是我能记住的一些东西,当个以后找工作的经验吧,不过笔试也无所谓经验不经验的。实力强就比较好而已。

posted @ 2013-02-28 13:45  weixliu  阅读(824)  评论(3编辑  收藏  举报