总结:介绍算法模型一般从模型要解决的问题场景入手。然后介绍模型建模的思路使用的损失函数对损失函数的优化如何求解这几块。最后介绍下算法模型的优点和缺点

一、小米面试(凉凉)——一面1小时,二面40分钟

1、 数据结构很重要(重要指数10颗星)

2、 编程题:

(1)a = [1, 2, 3]

b = a[:-1] 这一步做的是什么,还可以怎么做,另外一种方法和这种方法那个时间复杂度更低

a.pop(2) # 3

 视频名字:(N) name   变金精刚  变形金刚  大黄蜂          

 query:(M)  金刚     f1: 2         2         0

                  f2:  1         2         0

 f1:  相同字符的个数

 f2:  最大连续相同字符的

怎么实现f1和f2 

(2)有n个变量,这n个变量分别都有1-n个值,那么这些值肯定会存在重复的情况,请编写一段程序来找出这些重复的值。

3、 GBDT/XGBoost/LightGBM/Adaboost知识总结(需要再看)

4、 自己做过的项目问得非常细致,我需要再细致化一下,很多细节上的问题我面试时并没有回答上来

5、 LSTM传入的是什么,输出的又是什么,没了解?

6、 命名主体识别输入模型的是什么,经过模型怎么就能识别出哪些是主体了,详细介绍一下实习时怎么做的?

7、 LSTM如何解决长期依赖的问题?/LSTM对RNN改进的地方在那里?

8、 线性模型和分类模型的区别和联系? 

二、腾讯游戏面试(一面失败)——35分钟

1、讲解了自己做过的比赛(讲解时要注意逻辑性,逐条推进)

2、业务场景:有一张游戏地图,有人物、有怪物,知道人物和怪物的坐标,人物和怪物分别有等级,人物打怪只能打与其相应的等级以及以下的等级,打怪的收益根据等级是递增的。问:怎么布置怪物的分布地方,使得人物在规定时间内打怪时获得的收益最高。

答:用优化算法,比如拉格朗日,将距离作为此收益函数的权重,对这个权重的优化又可以利用其它的算法进行。

三、中译语通面试(等待结果)——15分钟

1、SVD分解以及它有哪些用途?

       https://zhuanlan.zhihu.com/p/36546367 SVD矩阵分解——原理与几何意义

2、词嵌入方法有哪些?以及各自的优缺点

3、学习率怎么调,这样调有什么后果?

       https://blog.csdn.net/whut_ldz/article/details/78882871

       https://www.cnblogs.com/bonelee/p/8578481.html 机器学习中如何选择超参数

4、Python的一点小知识,关于numpy的

5、平常工程都用什么软件,会不会java、大数据处理平台,有没有打算学

6、解释一下梯度下降算法?

       https://www.cnblogs.com/pinard/p/5970503.html 刘建平讲解梯度下降

四、众微科技(通过)——32分钟

1、简单讲讲自己简历上比赛用到的模型、比较他们的优缺点

2、ROC、AUC分别是什么,ROC的横纵坐标分别是啥

3、python的lambda函数

4、讲一下CART树模型

5、对新网银行的比赛做了哪些特征处理

       异常值处理、类别标签的组合、数值标签的归一化、特征筛选、模型融合

五、文思海辉(通过)——1.5小时

1、面试之前先做了一套笔试题,后面通知我周一下午去面试的,笔试题就是与数学、python、机器学习相关算法有关的,比较简单

2、问简历上面写到的东西

3、根据笔试题一个求极限问题改的,问怎么求那个函数与任意一个数的大小,提示我说用二分法

4、有哪些概率图模型,简单介绍一下HMM

5、有哪些概率分布

6、说一说我做命名实体识别的过程

7、场景:怎么建立一套推荐系统来减轻HR的工作任务

8、场景:结合本科专业,桌子上放着一包香烟,我想要写些什么东西。我本科是学社会保障专业的,然后就从医疗保险角度介绍了一下,医疗体系与香烟可以产生哪些化学反应

9、怎么用最简单的方法得到每天从天空中飞过的飞机数,胡说八道了一通。

10、梯度的本质是什么

11、梯度爆炸和梯度消失怎么发生的,怎么解决

12、还有一些忘了

六、京东数科(通过)——40分钟

1、简单介绍自己,然后面试官会结合简历上面的经历详细问你各个知识点

2、XGBoost还有哪些优化方法,为什么它用CART回归作为基分类器

3、记忆最深的只有上面一个问题,其他好多都忘了,由于没有立即写下来