会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
将者,智、信、仁、勇、严也。
Hi,我是李智华,华为-安全AI算法专家,欢迎来到安全攻防对抗的有趣世界。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
191
192
193
194
195
196
197
198
199
···
274
下一页
2017年11月14日
ES聚合底层机制-bucket深的话采用广度优先更好,而如果是年度统计还是深度优先好
摘要: 见原文,仅仅摘录部分:https://www.elastic.co/guide/cn/elasticsearch/guide/current/_preventing_combinatorial_explosions.html 。。。 图 42. Build full depth tree 用真实点的
阅读全文
posted @ 2017-11-14 15:22 bonelee
阅读(2017)
评论(0)
推荐(0)
2017年11月12日
词袋模型
摘要: http://blog.csdn.net/pipisorry/article/details/41957763 文本特征提取 词袋(Bag of Words)表征 文本分析是机器学习算法的主要应用领域。但是,文本分析的原始数据无法直接丢给算法,这些原始数据是一组符号,因为大多数算法期望的输入是固定长
阅读全文
posted @ 2017-11-12 12:29 bonelee
阅读(3728)
评论(0)
推荐(0)
2017年11月11日
xss 多分类 优选 贝叶斯、逻辑回归、决策树
摘要: import re import numpy as np from sklearn import cross_validation from sklearn import datasets from sklearn import svm from sklearn.externals import joblib from sklearn.metrics import classification...
阅读全文
posted @ 2017-11-11 13:20 bonelee
阅读(743)
评论(1)
推荐(0)
ssh跳板登陆太麻烦,使用expect每次自动登录 利用expect 模拟键盘动作,在闲置时间之内模拟地给个键盘响应
摘要: 防止超时掉线的代码:
阅读全文
posted @ 2017-11-11 00:17 bonelee
阅读(941)
评论(0)
推荐(0)
2017年11月10日
flatMap作用
摘要: 总结:1. map会将每一条输入映射为一个新对象。{苹果,梨子}.map(去皮) = {去皮苹果,去皮梨子} 其中: “去皮”函数的类型为:A => B 2.flatMap包含两个操作:会将每一个输入对象输入映射为一个新集合,然后把这些新集合连成一个大集合。 {苹果,梨子}.flatMap(切碎)
阅读全文
posted @ 2017-11-10 14:30 bonelee
阅读(15766)
评论(0)
推荐(1)
spark 类标签的稀疏 特征向量
摘要: 一个向量(1.0,0.0,3.0)它有2中表示的方法 密集:[1.0,0.0,3.0] 其和一般的数组无异 稀疏:(3,[0,2],[1.0,3.0]) 其表示的含义(向量大小,序号,值) 序号从0开始 本地向量和矩阵 本地向量(Local Vector)存储在单台机器上,索引采用0开始的整型表示,
阅读全文
posted @ 2017-11-10 13:08 bonelee
阅读(3161)
评论(1)
推荐(0)
spark scala word2vec 和多层分类感知器在情感分析中的实际应用
摘要: 转自:http://www.cnblogs.com/canyangfeixue/p/7227998.html 对于威胁检测算法使用神经网络训练有用!!!TODO待实验 结果如下:
阅读全文
posted @ 2017-11-10 11:46 bonelee
阅读(1538)
评论(2)
推荐(0)
ES cross cluster search跨集群查询
摘要: ES 5.3以后出的新功能。测试demo如下: 下载ES 5.5版本,然后分别本机创建2个实例,配置如下: 再创建一个实例用于跨集群搜索,配置如下: 然后写入测试数据 es_data.json: 插入一条数据到9200机器: 然后写入测试数据 es_data2.json: 同理再插入一条数据到920
阅读全文
posted @ 2017-11-10 10:58 bonelee
阅读(3522)
评论(2)
推荐(0)
2017年11月9日
spark pipeline 例子
摘要: 管道里的主要概念 MLlib提供标准的接口来使联合多个算法到单个的管道或者工作流,管道的概念源于scikit-learn项目。 1.数据框:机器学习接口使用来自Spark SQL的数据框形式数据作为数据集,它可以处理多种数据类型。比如,一个数据框可以有不同的列存储文本、特征向量、标签值和预测值。 2
阅读全文
posted @ 2017-11-09 16:53 bonelee
阅读(2956)
评论(2)
推荐(0)
sklearn 词袋 CountVectorizer
摘要: from sklearn.feature_extraction.text import CountVectorizer texts=["dog cat fish","dog cat cat","fish bird", 'bird'] cv = CountVectorizer() cv_fit=cv.fit_transform(texts) print(cv.get_feature_names...
阅读全文
posted @ 2017-11-09 11:57 bonelee
阅读(1385)
评论(0)
推荐(0)
上一页
1
···
191
192
193
194
195
196
197
198
199
···
274
下一页
公告