摘要: 1.项目背景 在做交通路线分析的时候,客户需要找出车辆的行车规律,我们将车辆每天的行车路线当做一个数据样本,总共有365天或是更多,从这些数据中通过聚类来获得行车路线规律统计分析。 我首先想到是K-means算法,不过它的算法思想是任选K个中心点,然后不停的迭代,在迭代的过程中需要不停的更新中心点。在我们着这个项目中,此方案不能解决,因为我们是通过编辑距离来计算两条路线的相似度。可以参考(1.交... 阅读全文
posted @ 2015-11-29 21:58 农民阿姨 阅读(1728) 评论(0) 推荐(0) 编辑
摘要: 1.最近工作中要实现用户车辆的行驶路线的聚类,由于所给的数据只有用户一天中交通卡口所监视的卡口名称 :即青岛路-威海路-济阳路 。 要通过聚类实现车辆路线的规律分析,首先要解决的是相似度问题,我们知道计算相似度可以用 :空间向量距离(欧式距离,余弦相似度)等算法。可是这些在此要求中都不适应,故需要用编辑距离来解决此问题 2. 编辑距离的思想: a.是指两个字符串之间,由一个转成另一个所需的最... 阅读全文
posted @ 2015-11-29 13:07 农民阿姨 阅读(1686) 评论(0) 推荐(0) 编辑
摘要: 1.Hbase 根据rowkey 查询 conf的配置信息如下: conf = new Configuration(); conf.set("hbase.zookeeper.quorum", "192.168.50.253:2181"); conf.set("hbase.rootdir", "hdfs://192.168.50.253:9000... 阅读全文
posted @ 2015-11-29 12:04 农民阿姨 阅读(3053) 评论(0) 推荐(0) 编辑