摘要: 原文链接:http://tecdat.cn/?p=26988 原文出处:拓端数据部落公众号 豆瓣已经成为国内影迷和影评人的聚集地。 豆瓣评分已经成为评价中国电影的重要指标。 豆瓣积累了大量的电影数据,为电影行业分析提供了重要资源。 豆瓣电影被用来衡量国内外电影的发展。 中国与其他国家对比 汇总年电影 阅读全文
posted @ 2022-06-15 16:06 拓端tecdat 阅读(511) 评论(0) 推荐(0)
摘要: ​原文链接:http://tecdat.cn/?p=26982 原文出处:拓端数据部落公众号 简介 客户流失/流失,是企业最重要的指标之一,因为获取新客户的成本通常高于保留现有客户的成本。 事实上,根据一个 study by Bain & Company,随着时间的推移,现有客户倾向于从公司购买更多 阅读全文
posted @ 2022-06-15 16:05 拓端tecdat 阅读(236) 评论(1) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=22492 原文出处:拓端数据部落公众号 降维技术之一是主成分分析 (PCA) 算法,该算法将可能相关变量的一组观察值转换为一组线性不相关变量。在本文中,我们将讨论如何通过使用 R编程语言使用主成分分析来减少数据维度分析葡萄酒数据(查看文末了解数据获 阅读全文
posted @ 2022-06-15 16:04 拓端tecdat 阅读(243) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=26932 原文出处:拓端数据部落公众号 在进行交叉验证之前,很自然地说“我会预烧 50%(比如说)我的数据来训练一个模型,然后用剩下的来拟合模型”。例如,我们可以使用训练数据进行变量选择(例如,在逻辑回归中使用一些逐步过程),然后,一旦选择了变量, 阅读全文
posted @ 2022-06-15 16:02 拓端tecdat 阅读(218) 评论(0) 推荐(0)
摘要: 原文链接:http://tecdat.cn/?p=26915 原文出处:拓端数据部落公众号 零膨胀泊松回归用于对超过零计数的计数数据进行建模。此外,理论表明,多余的零点是通过与计数值不同的过程生成的,并且可以独立地对多余的零点进行建模。因此, zip 模型有两个部分,泊松计数模型和用于预测多余零点的 阅读全文
posted @ 2022-06-15 16:01 拓端tecdat 阅读(940) 评论(0) 推荐(0)