随笔分类 -  Arrangements

record arrangements and supervise the process
摘要:project:ChainOD_demo 输入:0803-0830出行链 输出: 过程:首先将进站时间戳处理成97-1440范围内的数(因为是从3号开始的),即根据时间戳就能知道这条记录在哪个段内,并将reducer的数目设置为1500,同一个时间段的记录放在同一个reducer里面,这样就能每个r 阅读全文
posted @ 2017-05-22 14:54 Amelie.tingting 阅读(1458) 评论(0) 推荐(0)
摘要:其实需要了解泊松混合模型,但是因为资源很少的关系,先了解下泊松模型 这篇文章大体介绍了泊松模型的推导和意义 阅读全文
posted @ 2017-04-25 11:23 Amelie.tingting 阅读(1591) 评论(0) 推荐(0)
摘要:此图是公交刷卡一部分数据,属性值分别是DEAL_TYPE,EXIT_TIME,GRANT_CARD_CODE,CARD_TYPE,LINE_CODE,VEHICLE_CODE,ON_STATION,OFF_STATION, RUN_COMP_CODE,DRIVER_CODE 各自所代表的意义分别是: 阅读全文
posted @ 2017-03-15 20:44 Amelie.tingting 阅读(775) 评论(1) 推荐(1)
摘要:1。 阅读全文
posted @ 2017-02-21 15:35 Amelie.tingting 阅读(205) 评论(0) 推荐(0)
摘要:2017年02月10日以前:P9 2017年02月19日前:P51 模型评估与选择(第二章内容) 模型评估:训练及测试、构造测试集的方法 性能度量:错误率、查准率和查全率(PR曲线)、ROC曲线与和额AUC、代价敏感错误率和代价曲线(加入了各类错误的代价)、比较检验(涉及到的概率论知识很多未细看) 阅读全文
posted @ 2017-02-11 12:58 Amelie.tingting 阅读(115) 评论(0) 推荐(0)