kaggle-Elo Merchant Category Recommendation(赛题理解)(一)
一.赛题任务
通过顾客的历史交易记录以及顾客和商家的信息数据进行模型训练,最终预测测试集里面所有信用卡的忠诚度分数
数据下载地址:https://www.kaggle.com/c/elo-merchant-category-recommendation/rules
二.赛题数据
1.train.csv:训练集和test.csv:测试集
card_id:信用卡id
first_active_month:首次使用信用卡购物的月份
feature_1/2/3:匿名的信用卡离散特征
target:忠诚度分数目标列

2.historical_transactions.csv:信用卡(card_id)在给定商家的历史交易记录,对于每张信用卡,最多包含其三个月的交易记录
card_id:独一无二的信用卡id
month_lag:距离参考日期的月份
purchase_date:购物日期(时间)
category_1/2/3:匿名购物特征1,2,3
installments:购买商品的数量
merchant_category_id:商品种类id
subsector_id:商品种类群id
merchant_id:商品id
purchase_amount: 标准化的购物金额
city_id:城市id
state_id:州id

3.new_merchant_transactions.csv:每张信用卡在新商家的购物数据,最多包含两个月的数据(字段说明同上)
4.merchants.csv:数据集所有商家(商家id)的附加信息
merchant_id:商品标识
merchant_group_id:商品组
merchant_category_id:商品种类id
subsector_id:商品种类群id
numerical_1/2:匿名数值特征1/2
category_1:匿名类别特征
most_recent_sales_range:在最近活跃月份的销售额等级
most_recent_purchases_range:在最近活跃月份的交易数量等级
avg_sales_lage3/6/12:过去3/6/12个月的月平均收入除以上一个活跃月份的收入
avg_purchases_lag3/6/12:过去3/6/12个月的月平均交易量除以上一个活跃月份的交易量
active_months_lage3/6/12:过去3/6/12个月的月内活跃月份的数量
category_4:匿名特征4

三.评价指标
RMSE(均方根误差)

浙公网安备 33010602011771号