会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Volcano!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
···
20
下一页
2018年12月13日
数据挖掘:数据(数据的基本统计描述)
摘要: 一、概述 二、中心趋势度量:均值、中位数、众数、中列数 也就是度量数据分布的中部或中心位置。(给定一种属性,它的值大部分落在何处) 频率:区间内数值的个数。 1)均值(mean) 数据集“中心”的最常用、最有效的数值度量是均值。 均值对应于关系数据库系统提供的内置聚集函数 average(SQL 的
阅读全文
posted @ 2018-12-13 02:31 何永灿
阅读(2999)
评论(0)
推荐(0)
2018年12月7日
数据挖掘:数据(数据对象与属性类型)
摘要: 一、概述 二、标称属性(nominal attribute) 1)特点 2)其它 # 例:hari_color(头发颜色)、marital_status(婚姻状况)、occupation(职业),都是标称属性,表示对象的特征。 三、二元属性(binary attitute) 1)特点 2)其它 四、
阅读全文
posted @ 2018-12-07 00:32 何永灿
阅读(11058)
评论(0)
推荐(0)
2018年12月5日
数据挖掘:基本概念理解
摘要: 定义 数据挖掘:从大量数据中挖掘有趣模式和知识的过程。 一、知识发现过程 1)数据预处理 1、数据清理:消除噪声和删除不一致数据; 2、数据集成:多种数据源组合在一起。 3、数据选择:从数据库中提取与分析任务相关的数据。 4、数据变换:通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式。 2)数据
阅读全文
posted @ 2018-12-05 16:38 何永灿
阅读(2231)
评论(0)
推荐(0)
2018年9月9日
SQL:Linux下,MySQL 安装、链接、远程链接、修改初始密码,找回 root 密码、创建数据库用户、genelog
摘要: yum search + 服务:查询服务是否存在; yum remove + 服务:卸载服务; 使用 service 操作服务时,服务的名称后要加上字符 d,如启动:service mysqld start ; cat /vir/log/mysqld.log | grep + 关键字:从 MySQL
阅读全文
posted @ 2018-09-09 19:43 何永灿
阅读(651)
评论(0)
推荐(0)
2018年9月5日
Linux:WebServer(Nginx 虚拟主机配置与伪静态实现)
摘要: ps + 查看方式 | grep + 服务/端口/软件等:查看状态; 一、基本操作 Nginx 多用于商业系统; 一个端口只能被一个服务使用; Nginx 可以同时监听多个端口,也就是配置时,一个主机中添加多个端口,浏览器访问该域名时,无论访问哪个端口都对应相同的内容; 1)安装 Nginx 默认不
阅读全文
posted @ 2018-09-05 16:47 何永灿
阅读(1280)
评论(0)
推荐(0)
2018年9月4日
Linux:WebServer(Apacge)
摘要: / + 内容:表示在文本中搜索该内容; :q!:不保存直接退出; chown -R imooc:imooc /data:将 /data 文件夹的权限所有人该为用户 imooc; -R:采用递归的方式; /data 文件夹下的所有文件的权限都为用户 imooc; sudo su + 用户名:切换用户;
阅读全文
posted @ 2018-09-04 23:13 何永灿
阅读(427)
评论(0)
推荐(0)
2018年8月27日
GitHub 上传文件
摘要: 一、过程及代码 原文出处:一步一步教你如何在GitHub上上传自己的项目 原文作者:夏雨薇安 二、出错 error: src refspec master does not match any. error: failed to push some refs to 解决方法: 原文出处:git pu
阅读全文
posted @ 2018-08-27 17:41 何永灿
阅读(183)
评论(0)
推荐(0)
机器学习:项目流程及方法(以 kaggle 实例解释)
摘要: 一、项目目录 (一)数据加载 基础统计 特征分类 基本分布(scatter) (二)数据分析 正态性检验 偏离度分析 (hist | scatter) 峰度分析 (hist | scatter) 分散度分析 (box) 特征本身分散度 SalePrice 的分散度 方差齐次检验 方差分析 (bar)
阅读全文
posted @ 2018-08-27 00:49 何永灿
阅读(840)
评论(0)
推荐(0)
2018年8月25日
数据科学:待学习的内容
摘要: pandas.Series 的一些方法:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.corr.html
阅读全文
posted @ 2018-08-25 20:41 何永灿
阅读(232)
评论(0)
推荐(0)
2018年8月24日
机器学习:项目流程
摘要: 原文出处:机器学习项目流程 原文作者:wxquare 1. 理解实际问题,抽象为机器学习能处理的数学问题 理解实际业务场景问题是机器学习的第一步,机器学习中特征工程和模型训练都是非常费时的,深入理解要处理的问题,能避免走很多弯路。 2. 获取数据 获取数据包括获取原始数据以及从原始数据中经过特征工程
阅读全文
posted @ 2018-08-24 20:51 何永灿
阅读(310)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
···
20
下一页
公告