【读论文】1-关于流媒体预测-推荐系统、数据挖掘
一些有意思的 点:
1、使用推荐算法根据用户预测的热度结果累加,作为最终预测的实体热度
2、根据实际需求,指定两个模型评判的标准:
数值型,直接和数值比较;分类型,看能否映射到特定区间
3、
均方误差:
均方根误差:
平方误差:对异常值有更大权重
异常值有的情况下看mae
R平方:展示背离程度、实际预测的线性相关度
4、
分类:
准确:所有例子被正确分类的比例
数据集分类不平衡时,不合适用来判断结果的好坏
这种情况使用召回和F-score合适
5、
对于生命周期较短的实体,在发布之前预测流行度很有意义
将预测问题转为一个两步的分类问题;
1、预测实体是否会接收到评论
2、判断评论得分是高还是低

浙公网安备 33010602011771号