软件开发 - 随笔分类 - HoLoong

手撸机器学习算法 - 逻辑回归

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归逻辑回归算法介绍今天我们一起来学习使用非常广泛的分类算法：逻辑回归，是的，你没有看错，虽然它名字里有回归，但是它确实是个分类算法，作为除了感知机以外，最最最简单的分类算法，下面我们把它与感知机对比来进行学习；从决策边界上看感知阅读全文

posted @ 2021-06-24 16:05 HoLoong 阅读(631) 评论(1) 推荐(0)

手撸机器学习算法 - 岭回归

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归算法介绍今天我们来一起学习一个除了线性回归、多项式回归外最最最简单的回归算法：岭回归，如果用等式来介绍岭回归，那么就是：\(岭回归 = 多项式回归 + 惩罚项\)，\(多项式回归 = 线性回归 + 多项式特征构建\)，从上述等式可以阅读全文

posted @ 2021-06-18 10:00 HoLoong 阅读(1946) 评论(1) 推荐(0)

手撸机器学习算法 - 多项式回归

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归算法介绍今天我们来一起学习一个除了线性回归外最最最简单的回归算法：多项式回归；从线性回归到多项式回归事实上与线性回归相比，多项式回归没有增加任何需要推导的东西，唯一增加的是对原始数据进行多项式特征转换，这有点类似我们在非线性问题阅读全文

posted @ 2021-06-17 09:55 HoLoong 阅读(772) 评论(1) 推荐(0)

手撸机器学习算法 - 非线性问题

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归算法介绍前面两篇分别介绍了分类与回归问题中各自最简单的算法，有一点相同的是它们都是线性的，而实际工作中遇到的基本都是非线性问题，而能够处理非线性问题是机器学习有实用价值的基础；首先，非线性问题在分类与回归中的表现是不同的，在回归问阅读全文

posted @ 2021-06-15 15:20 HoLoong 阅读(2200) 评论(1) 推荐(0)

手撸机器学习算法 - 线性回归

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归如果说感知机是最最最简单的分类算法，那么线性回归就是最最最简单的回归算法，所以这一篇我们就一起来快活的用两种姿势手撸线性回归吧；算法介绍线性回归通过超平面拟合数据点，经验误差一般使用MSE（均平方误差），优化方法为最小二乘法，算法阅读全文

posted @ 2021-06-11 18:02 HoLoong 阅读(837) 评论(1) 推荐(0)

手撸机器学习算法 - 感知机

摘要：系列文章目录：感知机线性回归非线性问题多项式回归岭回归感知机（Perceptron）是最最最简单的机器学习算法（分类），同时也是深度学习中神经元的基础组件；算法介绍感知机与逻辑回归、SVM类似的是同样是构建一个分割超平面来实现对数据点的分类，不同点在于超平面的查找过程更加的简单粗暴，阅读全文

posted @ 2021-06-11 11:59 HoLoong 阅读(773) 评论(1) 推荐(2)

《Python深度学习》 Part 1

摘要：全部内容来源于《Python深度学习》，以练习为主，理论知识较少，掺杂有一些个人的理解，虽然不算很准确，但是胜在简单易懂，这本书是目前看到最适合没有深度学习经验的同学们入门的书籍了，不妨试试，该书作者：Francois Chollet，即Keras之父，该书译者：张亮；相关内容以及代码已经在Kag 阅读全文

posted @ 2021-05-21 10:09 HoLoong 阅读(269) 评论(0) 推荐(1)

分布式机器学习：如何快速从Python栈过渡到Scala栈

摘要：首先介绍下我的情况和需求，如果你跟我类似，那么这篇文章将很有帮助；我之前的技术栈主要是Java、Python，机器学习方面主要用到是pandas、numpy、sklearn、scipy、matplotlib等等，因为工作需要使用spark，所以理所应当的开始学习pyspark；之后一方面团队其他阅读全文

posted @ 2020-10-20 15:48 HoLoong 阅读(597) 评论(0) 推荐(0)

Spark 频繁模式挖掘

摘要：Spark - Frequent Pattern Mining 官方文档：https://spark.apache.org/docs/2.2.0/ml-frequent-pattern-mining.html 挖掘频繁项、项集、子序列或者其他子结构通常是大规模数据分析的第一步，这也是近些年数据挖掘领阅读全文

posted @ 2020-09-29 17:31 HoLoong 阅读(786) 评论(1) 推荐(0)

Spark Parquet详解

摘要：Spark - Parquet 概述 Apache Parquet属于Hadoop生态圈的一种新型列式存储格式，既然属于Hadoop生态圈，因此也兼容大多圈内计算框架（Hadoop、Spark），另外Parquet是平台、语言无关的，这使得它的适用性很广，只要相关语言有对应支持的类库就可以用； Pa 阅读全文

posted @ 2020-09-29 16:27 HoLoong 阅读(4607) 评论(1) 推荐(1)

Spark 模型选择和调参

摘要：Spark - ML Tuning 官方文档：https://spark.apache.org/docs/2.2.0/ml-tuning.html 这一章节主要讲述如何通过使用MLlib的工具来调试模型算法和pipeline，内置的交叉验证和其他工具允许用户优化模型和pipeline中的超参数；目阅读全文

posted @ 2020-09-28 10:52 HoLoong 阅读(891) 评论(1) 推荐(0)

Spark 特征提取、转换和选择

摘要：Spark(3) - Extracting, transforming, selecting features 官方文档链接：https://spark.apache.org/docs/2.2.0/ml-features.html 概述该章节包含基于特征的算法工作，下面是粗略的对算法分组：提取：阅读全文

posted @ 2020-09-25 12:13 HoLoong 阅读(1751) 评论(1) 推荐(0)

Android绘图及Bitmap几个知识点整理

摘要：Android Path绘制的折线如何变得平滑多个点可以连成一个折线,如何将折线的拟合处变为曲线,使得整个线看上去更加平滑呢? 分下来有以下三种实现方法：方法1： Paint.setStrokeJoin(Paint.Join.ROUND) 这个方法可以将path中所有线段的Join方式设置为RO 阅读全文

posted @ 2020-06-10 18:10 HoLoong 阅读(668) 评论(0) 推荐(0)

简单说维特比算法 - python实现

摘要：动态规划求最短路径算法,与穷举法相比优点在于大大降低了时间复杂度; 假如从起点A到终点S的最短路径Road经过点B1,那么从起点A到B1的最短路径的终点就是B1,否则如果存在一个B2使得A到B2的距离小于B1,那么起点A到终点S的最短路径Road就不应该经过B1,而应该经过B2,这显示是矛盾的,证明阅读全文

posted @ 2020-06-10 17:37 HoLoong 阅读(368) 评论(0) 推荐(0)

200行Python代码实现贪吃蛇

摘要：200行Python代码实现贪吃蛇话不多说，最后会给出全部的代码，也可以从这里Fork，正文开始；目前实现的功能列表：贪吃蛇的控制，通过上下左右方向键；触碰到边缘、墙壁、自身则游戏结束；接触到食物则食物消失，同时根据食物类型身体会变长；目前长度显示；暂停、死亡界面；运行动图代码片段阅读全文

posted @ 2020-04-07 20:53 HoLoong 阅读(9498) 评论(2) 推荐(1)

140行Python代码实现Flippy Bird

摘要：140行代码实现Flippy Bird 话说这游戏中文名叫什么来着，死活想不起来了，算了话不多说，140行实现小游戏系列第二章，依然是简单小游戏，与数独游戏相比，在游戏界面显示上更难一些，但是在逻辑方面更简单一些，需要处理的无非是速度、加速度、时间、位置、碰撞检测，界面方面则要实现整个动态的显示；阅读全文

posted @ 2020-04-05 17:43 HoLoong 阅读(2784) 评论(1) 推荐(1)

Python实现十大经典排序算法

摘要：Python实现十大经典排序算法代码最后面会给出完整版，或者可以从我的Githubfork，想看动图的同学可以去这里看看；小结：运行方式，将最后面的代码copy出去，直接python sort.py运行即可；代码中的健壮性没有太多处理，直接使用的同学还要检查检查；对于希尔排序，gap的选择阅读全文

posted @ 2020-04-04 18:30 HoLoong 阅读(1015) 评论(0) 推荐(0)

150+行Python代码实现带界面的数独游戏

摘要：150行代码实现图形化数独游戏 "Github地址" ，欢迎各位大佬们fork、star啥的，感谢；今天闲着没事干，以前做过html+js版的数独，这次做个python版本的，界面由pygame完成，数独生成由递归算法实现，由shuffle保证每次游戏都是不一样的情况，have fun；功能列表阅读全文

posted @ 2020-04-03 17:41 HoLoong 阅读(10350) 评论(6) 推荐(1)

机器学习竞赛分享：通用的团队竞技类的数据分析挖掘方法

摘要：前言 1. 该篇分享来源于NFL竞赛官方的R语言版本，我做的主要是翻译为Python版本； 2. 分享中用到的技巧、构建的特征、展示数据的方式都可以应用到其他领域，比如篮球、足球、LOL、双人羽毛球等等，只要是团队竞技，都可以从中获益； 3. 分享基于kaggle上的 "NFL大数据碗" ，也就是基阅读全文

posted @ 2020-01-21 17:49 HoLoong 阅读(569) 评论(1) 推荐(0)

机器学习竞赛分享：NFL大数据碗（上篇）

摘要：kaggle竞赛分享：NFL大数据碗上竞赛简介一年一度的NFL大数据碗，今年的预测目标是通过两队球员的静态数据，预测该次进攻推进的码数，并转换为该概率分布；竞赛链接 https://www.kaggle.com/c/nfl big data bowl 2020 项目链接，该项目代码已经pub 阅读全文

posted @ 2020-01-20 14:33 HoLoong 阅读(1105) 评论(2) 推荐(0)

Ho Loong

机器学习、深度学习、数据挖掘、游戏、心理学、WOW

随笔分类 - 软件开发

公告