1_机器学习基础题(1)
在学习的过程中碰到的机器学习基础题:
- 第1题:
A.增加模型复杂度,模型在测试集上的准确率就能更好(错,会出现过拟合,在训练集上效果更好,在测试集上,效果变差)
B.L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑(错,说反了,L2正则化平滑,L1稀疏)
C.对于PCA,我们应该选择是的模型具有最小variance的主成分(错,应该是选择最大的variance的作为主成分)
D.每次使用K-means算法得到的聚类结果可能会不一样 (对,k-means因为其初始点的随机初始化,使得其是一种不确定算法,而PCA是一种确定性算法。)
- 第2题:
A.准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率
B.召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率
C.正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高(错,越接近1越高)
D.为了解决准确率和召回率冲突问题,引入了F1分数
- 第3题:以下哪个模型是生成式模型?
- 解析:监督学习方法可以分为生成方法(generative approach)和判别方法(discriminative approach)。所学到的模型分别称为生成模型(generative model)和判别模型(discriminative model)生成方法由数据学习联合概率分布,然后求出条件概率分布作为预测的模型。
生成式模型:朴素贝叶斯模型,混合高斯模型,隐马尔克夫模型,贝叶斯网络,Sigmoid Belief Networks,马尔科夫随机场,深度信念网络;
判别式模型: K近邻,线性回归,逻辑回归,神经网络,支持向量机,高斯过程,条件随机场,CART(Classification and Regression Tree)
A.贝叶斯模型(生成式模型)
B.逻辑回归 (判别)
C.SVM(判别)
D.条件随机场(判别)
- 第4题:以下哪个模型是生成式模型?
全部正确:正则化可以防止过拟合,L1正则化能得到稀疏解,L2正则化约束了解空间,L2正则化约束了解空间,Dropout也是一种正则化方法

浙公网安备 33010602011771号