摘要:
一、淘宝 反作弊体系结构 淘宝反作弊体系结构可以从数据、算法、和系统三个维度来解释 数据:主要是将识别的作弊数据汇总到买家、宝贝、订单和卖家 四个维度并全量提供给了数据平台供各业务方使用,即可用作算法训练样本的特征,也方便系统查询和监控作弊数据的趋势变化情况; 算法:覆盖了包括账号网、交易网、资金网 阅读全文
posted @ 2020-10-13 17:02
小小喽啰
阅读(1295)
评论(0)
推荐(0)
摘要:
geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,这种方式简单粗暴,可以满足对小规模的数据进行经纬度的检索 目录: 经纬度常识 认识geohash geohash算法 geohash原理 对照表 经纬度常识 经线是纵的,经度是横的 阅读全文
posted @ 2020-10-13 16:56
小小喽啰
阅读(927)
评论(0)
推荐(0)
摘要:
http://spark.apache.org/docs/1.6.0/mllib-guide.html 阅读全文
posted @ 2020-10-13 16:46
小小喽啰
阅读(107)
评论(0)
推荐(0)
摘要:
工作中,我们经常遇到CSV乱码的问题,这个时候我们可以使用notepad++处理,当然我们可以使用python处理,代码入下 #coding=utf-8 import pandas as pd import os df=open('2_wsg_sswl_loan_rejected_tues_fri. 阅读全文
posted @ 2020-10-13 12:23
小小喽啰
阅读(1126)
评论(0)
推荐(0)
浙公网安备 33010602011771号