kaggle-Elo Merchant Category Recommendation(赛题理解)(一)

一.赛题任务

  通过顾客的历史交易记录以及顾客和商家的信息数据进行模型训练,最终预测测试集里面所有信用卡的忠诚度分数

  数据下载地址:https://www.kaggle.com/c/elo-merchant-category-recommendation/rules

 

二.赛题数据

  1.train.csv:训练集和test.csv:测试集

    card_id:信用卡id

    first_active_month:首次使用信用卡购物的月份

    feature_1/2/3:匿名的信用卡离散特征

    target:忠诚度分数目标列

    

  2.historical_transactions.csv:信用卡(card_id)在给定商家的历史交易记录,对于每张信用卡,最多包含其三个月的交易记录

    card_id:独一无二的信用卡id

    month_lag:距离参考日期的月份

    purchase_date:购物日期(时间)

    category_1/2/3:匿名购物特征1,2,3

    installments:购买商品的数量

    merchant_category_id:商品种类id

    subsector_id:商品种类群id

    merchant_id:商品id

    purchase_amount: 标准化的购物金额

    city_id:城市id

    state_id:州id

    

  3.new_merchant_transactions.csv:每张信用卡在新商家的购物数据,最多包含两个月的数据(字段说明同上)

  4.merchants.csv:数据集所有商家(商家id)的附加信息

    merchant_id:商品标识

    merchant_group_id:商品组

    merchant_category_id:商品种类id

    subsector_id:商品种类群id

    numerical_1/2:匿名数值特征1/2

    category_1:匿名类别特征

    most_recent_sales_range:在最近活跃月份的销售额等级

    most_recent_purchases_range:在最近活跃月份的交易数量等级

    avg_sales_lage3/6/12:过去3/6/12个月的月平均收入除以上一个活跃月份的收入

    avg_purchases_lag3/6/12:过去3/6/12个月的月平均交易量除以上一个活跃月份的交易量

    active_months_lage3/6/12:过去3/6/12个月的月内活跃月份的数量

    category_4:匿名特征4

    

 

三.评价指标

  RMSE(均方根误差)

posted @ 2022-02-15 10:14  麦扣  阅读(466)  评论(0)    收藏  举报