摘要: 机器学习模型处理不了原始文本。无论是线性回归、XGBoost还是神经网络,遇到 "red" 、 "medium" 、 "CA" 这类分类变量都没法直接处理。所以必须把它们转成数字这个过程就是分类编码。 大家入门时肯定都学过独热编码或序数编码,但编码方法其实非常多。目标编码、CatBoost编码、Ja 阅读全文
posted @ 2025-12-10 21:50 deephub 阅读(6) 评论(0) 推荐(0)