摘要: 注意:仅仅是数值型字段才可以,如果是字符类型字段则不能直接搞定 需要使用pandas get_dummies搞定 例如: Using the get_dummies will create a new column for every unique string in a certain colum 阅读全文
posted @ 2017-11-08 20:06 bonelee 阅读(4227) 评论(1) 推荐(0)
摘要: Scala: import org.apache.spark.ml.linalg.Vectors val data = Seq( (7, Vectors.dense(0.0, 0.0, 18.0, 1.0), 1.0), (8, Vectors.dense(0.0, 1.0, 12.0, 0.0), 阅读全文
posted @ 2017-11-08 17:54 bonelee 阅读(7231) 评论(0) 推荐(0)
摘要: from pyspark import SparkContext, SQLContext from pyspark.ml import Pipeline from pyspark.ml.classification import DecisionTreeClassifier from pyspark.ml.feature import StringIndexer, VectorIndexer f... 阅读全文
posted @ 2017-11-08 14:20 bonelee 阅读(2422) 评论(4) 推荐(0)
摘要: 本文档将介绍:如何通过Linux审计系统auditd监测WebShell执行系统命令的行为。 测试环境:CentOS7.0_x64 auditd简介 Linux审计系统提供了一种跟踪系统上与安全相关的信息的方法。基于预先配置的规则,审核生成日志条目以记录尽可能多的关于系统上发生的事件信息。 audi 阅读全文
posted @ 2017-11-08 12:02 bonelee 阅读(2106) 评论(2) 推荐(0)
摘要: 另一位对AI表现出极大兴趣的演讲嘉宾,就是短篇科幻小说《折叠北京》的作者:郝景芳。 演讲一开始她就提到了测试AI的三个问题: 第一个测试题,如果哥伦布没有发现新大陆对中国哪个菜系影响最大? 第二个测试题,她说没想到今天这么冷,她希望你如何回复它? 第三个测试题,明年可以学英语,也可以学编程,你会选择 阅读全文
posted @ 2017-11-08 09:15 bonelee 阅读(548) 评论(0) 推荐(0)
摘要: “杨子见歧路而哭之”的例子:杨子看到有一只羊走失了,他走到了分叉的地方,他不知道羊在哪一条路上,这个时候他就不能够决定,觉得很悲伤,因为看起来唯一的方法,就是你必须先去走一条路,然后再走另外一条路。 阅读全文
posted @ 2017-11-08 09:11 bonelee 阅读(3335) 评论(0) 推荐(0)