【读论文】1-关于流媒体预测-推荐系统、数据挖掘

一些有意思的 点:

1、使用推荐算法根据用户预测的热度结果累加,作为最终预测的实体热度

2、根据实际需求,指定两个模型评判的标准:

数值型,直接和数值比较;分类型,看能否映射到特定区间

3、

均方误差:
均方根误差:
平方误差:对异常值有更大权重
异常值有的情况下看mae
R平方:展示背离程度、实际预测的线性相关度

4、

分类:
准确:所有例子被正确分类的比例
数据集分类不平衡时,不合适用来判断结果的好坏

这种情况使用召回和F-score合适

5、

对于生命周期较短的实体,在发布之前预测流行度很有意义
将预测问题转为一个两步的分类问题;
1、预测实体是否会接收到评论
2、判断评论得分是高还是低

 

 

 

 

 

posted @ 2022-09-01 19:26  土星狗蛋  阅读(39)  评论(0)    收藏  举报