上一页 1 ··· 192 193 194 195 196 197 198 199 200 ··· 273 下一页
摘要: cat /etc/*-release OR lsb_release -d 阅读全文
posted @ 2017-11-03 16:38 bonelee 阅读(4408) 评论(0) 推荐(0)
摘要: Feature Extraction Feature Extraction converts vague features in the raw data into concrete numbers for further analysis. In this section, we introduc 阅读全文
posted @ 2017-11-03 14:21 bonelee 阅读(965) 评论(0) 推荐(0)
摘要: 见 http://www.infoq.com/cn/articles/deep-learning-time-series-anomaly-detection 但是不够详细 阅读全文
posted @ 2017-11-03 11:18 bonelee 阅读(9304) 评论(0) 推荐(0)
摘要: 基于机器学习的web异常检测 from: https://jaq.alibaba.com/community/art/show?articleid=746 Web防火墙是信息安全的第一道防线。随着网络技术的快速更新,新的黑客技术也层出不穷,为传统规则防火墙带来了挑战。传统web入侵检测技术通过维护规 阅读全文
posted @ 2017-11-03 11:08 bonelee 阅读(3282) 评论(0) 推荐(0)
摘要: 用机器学习检测异常点击流 用机器学习检测异常点击流 本文内容是我学习ML时做的一个练手项目,描述应用机器学习的一般步骤。该项目的目标是从点击流数据中找出恶意用户的请求。点击流数据长下图这样子,包括请求时间、IP、平台等特征: 该项目从开始做到阶段性完成,大致可分为两个阶段:算法选择和工程优化。算法选 阅读全文
posted @ 2017-11-03 09:43 bonelee 阅读(34312) 评论(2) 推荐(3)
摘要: 给定数据集 x(1),x(2),..,x(m),我们假使数据集是正常的,我们希望知道新的数据 xtest 是不 是异常的,即这个测试数据不属于该组数据的几率如何。我们所构建的模型应该能根据该测 试数据的位置告诉我们其属于一组数据的可能性 p(x)。 高斯分布 高斯分布,也称为正态分布。回顾高斯分布的 阅读全文
posted @ 2017-11-03 09:27 bonelee 阅读(2903) 评论(1) 推荐(0)
摘要: https://wenku.baidu.com/view/ee9d9800cdbff121dd36a32d7375a417866fc131.html 使用kmeans算法做流量异常检测 明确指出数据预处理需要规范化 例如网络流量异常检测方法,对网络流量样本数据进行归一化和均值化处理,得到网络流量样本 阅读全文
posted @ 2017-11-03 09:01 bonelee 阅读(10485) 评论(0) 推荐(0)
摘要: kmeans demo 摘自:http://spark.apache.org/docs/latest/api/python/pyspark.mllib.html#module-pyspark.mllib.feature pyspark.mllib.feature module Python pack 阅读全文
posted @ 2017-11-02 20:11 bonelee 阅读(2627) 评论(1) 推荐(0)
摘要: For (much) more power and flexibility, use a dedicated spellchecking library like PyEnchant. There's a tutorial, or you could just dive straight in: P 阅读全文
posted @ 2017-11-02 12:10 bonelee 阅读(18144) 评论(0) 推荐(1)
摘要: 公用函数的放到了 common.py 文件中. 通过 --py-files 可以在pyspark中可以顺利导入: pyspark --py-files lib/common.py > import common OK 阅读全文
posted @ 2017-11-02 12:09 bonelee 阅读(2882) 评论(0) 推荐(0)
上一页 1 ··· 192 193 194 195 196 197 198 199 200 ··· 273 下一页