问题

1 只考虑二阶特征组合情况,穷举所有可能的二阶特征组合并用LR训练,与直接使用FM训练,哪一种效果更好?为什么?

答:使用FM效果更好。原因是穷举所有二阶特征组合,对于高维稀疏特征来说,某些特征组合项非0的样本数是很少的,势必会导致学出来的权重不准,这也是为什么FM要学习特征隐向量的原因。

 

2 如果把连续特征不做离散化处理,直接用到FM中来,你觉得会对模型有什么影响?

答:连续特征的样本分布是很稀疏的,也就是每个特征值很可能只对应几个样本,这样学出来的特征组合权重是不准的。

 

posted @ 2017-10-13 21:03  coldyan  阅读(181)  评论(0编辑  收藏  举报