会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kayy
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2018年3月25日
feature select
摘要: 特征选择的主要作用是:降维,减少特征数量,防止过拟合,增强模型的泛化能力。 1、变异系数(标准差/均值) 2、皮尔逊相关系数(线性相关) 3、互信息 4、线性拟合系数 5、L1(Lasso)或者L2(Ridge)正则化 6、树模型 7、交叉验证 8、卡方检验
阅读全文
posted @ 2018-03-25 22:16 kayy
阅读(186)
评论(0)
推荐(0)
pandas dataframe to rdd
摘要: import pandas as pd from pyspark.sql import SQLContext from pyspark import SparkContext from pyspark.sql import SparkSession sc = SparkContext()#连接spa
阅读全文
posted @ 2018-03-25 09:33 kayy
阅读(477)
评论(0)
推荐(0)