• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
~(',D)=I一<
博客园 | 首页 | 新随笔 | 新文章 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4

2019年4月5日

sklearn learn preprocessing
摘要: train\_test\_split stratify:测试集和训练集中的类标签比例同原始的样本中类标签的比例相同,都为2:3 随机算子 在学习机器学习的过程中,常常遇到random_state这个参数,下面来简单叙述一下它的作用。 为什么需要用到这样一个参数random_state(随机状态)? 阅读全文
posted @ 2019-04-05 01:18 星不予 阅读(230) 评论(0) 推荐(0)
 
 

2019年4月2日

数据预处理 简介
摘要: ——《Applied predictive modeling》 数据预处理 数据的准备能够极大的影响模型的预测能力,如对数据集进行变换以减少数据偏移和离群值的影响,能够显著提高模型的表现。 对于特征工程来说,使用预测变量的组合能够比使用单独的预测变量更加有效,最有效的编码数据方法来自于建模者对于问题 阅读全文
posted @ 2019-04-02 20:27 星不予 阅读(614) 评论(0) 推荐(0)
 
 

2019年2月23日

requests 爬虫
摘要: 爬虫 常用爬虫爬取网页,但如果一直爬取会被ban掉,因此需要对爬虫进行一些改进反反爬 使用requests和beautifulsoup4构建爬虫,1.随机user agent;2.ip代理;4.cookie;3.爬取间隔 随机user agent requests的user agent通过heade 阅读全文
posted @ 2019-02-23 14:59 星不予 阅读(316) 评论(0) 推荐(0)
 
 

2018年12月18日

java_集合类_简
摘要: collection,List,Set,Map 阅读全文
posted @ 2018-12-18 01:58 星不予 阅读(161) 评论(0) 推荐(0)
 
 

2018年12月3日

ubuntu16.04 安装java
摘要: 1.从官网下载 jdk 8u191 linux x64.tar.gz(https://www.oracle.com/technetwork/java/javase/downloads/jdk8 downloads 2133151.html),放进download 2.解压并放入设定的文件夹内 3.添 阅读全文
posted @ 2018-12-03 19:06 星不予 阅读(164) 评论(0) 推荐(0)
 
 

2018年11月30日

ML_Clustering
摘要: 西瓜书学习——聚类——kmeans、LVQ、DBSCAN、AGNES、DIANA 阅读全文
posted @ 2018-11-30 16:18 星不予 阅读(220) 评论(0) 推荐(0)
 
 
上一页 1 2 3 4

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3