会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Christine
仰望星空 脚踏实地
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
3
4
5
6
7
2019年8月18日
K-近邻算法小结
摘要: K近邻(K Nearest Neighbor,KNN)算法是一种基本分类与回归方法,也是最简单的机器学习方法之一,这里只对K近邻算法的分类问题做总结。 K近邻算法简单、直观,它的工作原理是:给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最近邻的$k$个实例,这$k$个实例的多数属于某
阅读全文
posted @ 2019-08-18 23:56 Christine_7
阅读(850)
评论(0)
推荐(0)
2019年7月13日
数据结构与算法学习笔记 (三) 排序 搜索
摘要: 集中汇总常见的排序算法(冒泡排序,选择排序,插入排序,希尔排序,归并排序,快速排序,堆排序,计数排序,桶排序)和搜索算法(顺序搜索,二分搜索,插值搜索,跳跃搜索,快速搜索,哈希搜索)的算法原理,算法复杂度的分析,以及算法实现。 学习目标: 理解算法是如何实现的 掌握算法的原理 判断算法的优越性 排序
阅读全文
posted @ 2019-07-13 22:44 Christine_7
阅读(275)
评论(0)
推荐(0)
2019年7月6日
数据结构与算法学习笔记 (二) 栈 链表 队列 树 堆 图 并查集
摘要: 学习数据结构与算法的目的: 1.掌握底层 coding 2.从顶层宏观的去观察一种数据结构的各种操作 推荐 一个动态可视化网站 "Visualgo" 栈 栈(stack)又名堆栈,它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。栈允许进行插入和删除操作的一端称为栈顶(top),
阅读全文
posted @ 2019-07-06 23:37 Christine_7
阅读(387)
评论(0)
推荐(0)
2019年6月30日
Spark数据分析技术学习笔记(一)——基础概念、RDD使用
摘要: "Spark快速大数据分析" 这本书用Java/Python/Scala三种语言介绍了Spark的基本概念和简单操作,对于入门Spark是一个不错的选择,这里做一个总结,方便以后查看。 首先,要搞清楚Spark是什么?它是一个用来实现快速而通用的集群计算的平台,在速度方面扩展了MapReduce计算
阅读全文
posted @ 2019-06-30 21:23 Christine_7
阅读(405)
评论(0)
推荐(0)
2019年6月17日
Python数据分析学习笔记
摘要: 利用Python进行数据分析这本书,介绍了高效解决各种数据分析问题的Python语言和库,结合其他学习资源集中总结一下Python数据分析相关库的知识点。 数据分析相关库 (1) NumPy NumPy(Numerical Python)是Python科学计算的基础包,支持大量的 维度数组与矩阵 运
阅读全文
posted @ 2019-06-17 19:36 Christine_7
阅读(1213)
评论(0)
推荐(0)
2019年6月15日
Python机器学习(Sebastian著 ) 学习笔记——第六章模型评估与参数调优实战(Windows Spyder Python 3.6)
摘要: scikit learn 分层K折交叉验 StratifiedKFold迭代器 scikit learn k折交叉验证 使用scikit learn中的学习曲线函数评估模型 样本大小与训练准确率、测试准确率之间的关系 通过验证曲线判定过拟合与欠拟合
阅读全文
posted @ 2019-06-15 22:41 Christine_7
阅读(642)
评论(0)
推荐(0)
2019年6月14日
Python机器学习(Sebastian著 ) 学习笔记——第五章通过降维压缩数据(Windows Spyder Python 3.6)
摘要: 数据压缩是机器学习领域中重要的内容,通过数据压缩技术可以将原始数据集变换到一个维度更低的新的特征子空间,帮助对数据存储和分析。 降维压缩数据,分为无监督和有监督两类,先来介绍无监督数据压缩——主成分分析(Principal Component Analysis,PCA) PCA是在高维数据中找到最大
阅读全文
posted @ 2019-06-14 15:16 Christine_7
阅读(375)
评论(0)
推荐(0)
2019年6月13日
Python机器学习(Sebastian著 ) 学习笔记——第四章数据预处理(Windows Spyder Python 3.6)
摘要: 数据的质量和数据中包含的有用信息的数量直接影响机器学习算法最终的学习结构,因此,数据集进行学习算法之前,对数据进行检验及预处理至关重要。 主要内容: 数据集中缺失数据的删除和填充 数据格式化 模型构建中的特征选择 数据预处理 将数据集划分为训练数据集合测试数据集 本例数据集包含178个葡萄酒样本,每
阅读全文
posted @ 2019-06-13 18:30 Christine_7
阅读(424)
评论(0)
推荐(0)
2019年6月5日
数据结构与算法学习笔记 (一) 复杂度分析
摘要: 数据结构与算法是计算机类从业者的必修课,一直学的不够深入,前段时间订阅了个专栏,终于开始总结了,拖延症太可怕 必须得改!开始学习数据结构与算法之前,先思考为什么要学习数据结构与算法呢?数据结构与算法解决了什么问题呢?我们要知道数据结构与算法解决的是如何让计算机执行速度更“快”和存储空间更“省”的问题
阅读全文
posted @ 2019-06-05 19:47 Christine_7
阅读(287)
评论(0)
推荐(0)
2019 第三季度计划
摘要: 把每个阶段学习的内容记录下来,也是监督自己的一种方式。更新从6月开始,加油! 主题 | 内容 | 更新频次 | | Spark | ①Spark快速大数据分析②Spark高级数据分析③编程基础| 1/1 2周 数据结构与算法 | ①数据结构②算法 | 1/周 Linux | 鸟哥Linux私房菜 |
阅读全文
posted @ 2019-06-05 18:40 Christine_7
阅读(141)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
公告