随笔分类 - Arrangements
record arrangements and supervise the process
摘要:project:ChainOD_demo 输入:0803-0830出行链 输出: 过程:首先将进站时间戳处理成97-1440范围内的数(因为是从3号开始的),即根据时间戳就能知道这条记录在哪个段内,并将reducer的数目设置为1500,同一个时间段的记录放在同一个reducer里面,这样就能每个r
阅读全文
摘要:其实需要了解泊松混合模型,但是因为资源很少的关系,先了解下泊松模型 这篇文章大体介绍了泊松模型的推导和意义
阅读全文
摘要:此图是公交刷卡一部分数据,属性值分别是DEAL_TYPE,EXIT_TIME,GRANT_CARD_CODE,CARD_TYPE,LINE_CODE,VEHICLE_CODE,ON_STATION,OFF_STATION, RUN_COMP_CODE,DRIVER_CODE 各自所代表的意义分别是:
阅读全文
摘要:2017年02月10日以前:P9 2017年02月19日前:P51 模型评估与选择(第二章内容) 模型评估:训练及测试、构造测试集的方法 性能度量:错误率、查准率和查全率(PR曲线)、ROC曲线与和额AUC、代价敏感错误率和代价曲线(加入了各类错误的代价)、比较检验(涉及到的概率论知识很多未细看)
阅读全文
浙公网安备 33010602011771号