算法知识点

1面:
简介➕项目

正负样本

正样本: 与真值对应的目标类别来说该样本为正样本。(预测值与真实值相同)
负样本: 与真值不对应的其他所有目标类别来说该样本为负样本。(预测值与真实值不相同)
困难样本: 预测时与真值标签误差较大的样本。
简单样本: 预测时与真值标签误差较小的样本。
如:
图片分类:
需要识别马、羊、牛三个类别。
给一张马的图片。对于预测马来说这个样本为正样本,对于预测羊和牛来说该样本为负样本。
真值one-hot标签:[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时,真值one-hot标签相差较大,则此时该样本是困难样本。而预测出[0.98, 0.01, 0.01]时,与真值one-hot标签相差较小,则此时该样本为简单样本。
语音识别:
需要识别“我 爱 中 国”四个字。
语音片段对应“我”。则对于预测“我”来说这个样本为正样本,对于预测其他字来说该样本为负样本。
参考

机器学习指标怎么计算的?

准确率 召回率 F1 ROC曲线怎么得到的?
AUC是什么? AUC的数学解释?

说几个常用的树模型

Xgboost的优势和劣势

logistic Regression的函数是什么 怎么实现二分类的 如果改变分类的阈值 准确率召回率等指标怎么变

说几个熟悉的神经网络

RNN和LSTM区别 LSTM为什么可以解决gradient vanishing问题
Resnet网络解决的什么问题 怎么解决的

说几个神经网络的激活函数?

特点分别是什么

参考:
牛客网:同花顺机器学习算法工程师面经

posted @ 2022-03-13 19:23  zzflybird  阅读(21)  评论(0)    收藏  举报