随笔分类 -  软件开发

编程、脚本、IDE
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 逻辑回归 算法介绍 今天我们一起来学习使用非常广泛的分类算法:逻辑回归,是的,你没有看错,虽然它名字里有回归,但是它确实是个分类算法,作为除了感知机以外,最最最简单的分类算法,下面我们把它与感知机对比来进行学习; 从决策边界上看 感知 阅读全文
posted @ 2021-06-24 16:05 HoLoong 阅读(631) 评论(1) 推荐(0)
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 算法介绍 今天我们来一起学习一个除了线性回归、多项式回归外最最最简单的回归算法:岭回归,如果用等式来介绍岭回归,那么就是:\(岭回归 = 多项式回归 + 惩罚项\),\(多项式回归 = 线性回归 + 多项式特征构建\),从上述等式可以 阅读全文
posted @ 2021-06-18 10:00 HoLoong 阅读(1946) 评论(1) 推荐(0)
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 算法介绍 今天我们来一起学习一个除了线性回归外最最最简单的回归算法:多项式回归; 从线性回归到多项式回归 事实上与线性回归相比,多项式回归没有增加任何需要推导的东西,唯一增加的是对原始数据进行多项式特征转换,这有点类似我们在非线性问题 阅读全文
posted @ 2021-06-17 09:55 HoLoong 阅读(772) 评论(1) 推荐(0)
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 算法介绍 前面两篇分别介绍了分类与回归问题中各自最简单的算法,有一点相同的是它们都是线性的,而实际工作中遇到的基本都是非线性问题,而能够处理非线性问题是机器学习有实用价值的基础; 首先,非线性问题在分类与回归中的表现是不同的,在回归问 阅读全文
posted @ 2021-06-15 15:20 HoLoong 阅读(2200) 评论(1) 推荐(0)
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 如果说感知机是最最最简单的分类算法,那么线性回归就是最最最简单的回归算法,所以这一篇我们就一起来快活的用两种姿势手撸线性回归吧; 算法介绍 线性回归通过超平面拟合数据点,经验误差一般使用MSE(均平方误差),优化方法为最小二乘法,算法 阅读全文
posted @ 2021-06-11 18:02 HoLoong 阅读(837) 评论(1) 推荐(0)
摘要:系列文章目录: 感知机 线性回归 非线性问题 多项式回归 岭回归 感知机(Perceptron)是最最最简单的机器学习算法(分类),同时也是深度学习中神经元的基础组件; 算法介绍 感知机与逻辑回归、SVM类似的是同样是构建一个分割超平面来实现对数据点的分类,不同点在于超平面的查找过程更加的简单粗暴, 阅读全文
posted @ 2021-06-11 11:59 HoLoong 阅读(773) 评论(1) 推荐(2)
摘要:全部内容来源于《Python深度学习》,以练习为主,理论知识较少,掺杂有一些个人的理解,虽然不算很准确,但是胜在简单易懂,这本书是目前看到最适合没有深度学习经验的同学们入门的书籍了,不妨试试,该书作者:Francois Chollet,即Keras之父,该书译者:张亮; 相关内容以及代码已经在Kag 阅读全文
posted @ 2021-05-21 10:09 HoLoong 阅读(269) 评论(0) 推荐(1)
摘要:首先介绍下我的情况和需求,如果你跟我类似,那么这篇文章将很有帮助; 我之前的技术栈主要是Java、Python,机器学习方面主要用到是pandas、numpy、sklearn、scipy、matplotlib等等,因为工作需要使用spark,所以理所应当的开始学习pyspark; 之后一方面团队其他 阅读全文
posted @ 2020-10-20 15:48 HoLoong 阅读(597) 评论(0) 推荐(0)
摘要:Spark - Frequent Pattern Mining 官方文档:https://spark.apache.org/docs/2.2.0/ml-frequent-pattern-mining.html 挖掘频繁项、项集、子序列或者其他子结构通常是大规模数据分析的第一步,这也是近些年数据挖掘领 阅读全文
posted @ 2020-09-29 17:31 HoLoong 阅读(786) 评论(1) 推荐(0)
摘要:Spark - Parquet 概述 Apache Parquet属于Hadoop生态圈的一种新型列式存储格式,既然属于Hadoop生态圈,因此也兼容大多圈内计算框架(Hadoop、Spark),另外Parquet是平台、语言无关的,这使得它的适用性很广,只要相关语言有对应支持的类库就可以用; Pa 阅读全文
posted @ 2020-09-29 16:27 HoLoong 阅读(4607) 评论(1) 推荐(1)
摘要:Spark - ML Tuning 官方文档:https://spark.apache.org/docs/2.2.0/ml-tuning.html 这一章节主要讲述如何通过使用MLlib的工具来调试模型算法和pipeline,内置的交叉验证和其他工具允许用户优化模型和pipeline中的超参数; 目 阅读全文
posted @ 2020-09-28 10:52 HoLoong 阅读(891) 评论(1) 推荐(0)
摘要:Spark(3) - Extracting, transforming, selecting features 官方文档链接:https://spark.apache.org/docs/2.2.0/ml-features.html 概述 该章节包含基于特征的算法工作,下面是粗略的对算法分组: 提取: 阅读全文
posted @ 2020-09-25 12:13 HoLoong 阅读(1751) 评论(1) 推荐(0)
摘要:Android Path绘制的折线如何变得平滑 多个点可以连成一个折线,如何将折线的拟合处变为曲线,使得整个线看上去更加平滑呢? 分下来有以下三种实现方法: 方法1: Paint.setStrokeJoin(Paint.Join.ROUND) 这个方法可以将path中所有线段的Join方式设置为RO 阅读全文
posted @ 2020-06-10 18:10 HoLoong 阅读(668) 评论(0) 推荐(0)
摘要:动态规划求最短路径算法,与穷举法相比优点在于大大降低了时间复杂度; 假如从起点A到终点S的最短路径Road经过点B1,那么从起点A到B1的最短路径的终点就是B1,否则如果存在一个B2使得A到B2的距离小于B1,那么起点A到终点S的最短路径Road就不应该经过B1,而应该经过B2,这显示是矛盾的,证明 阅读全文
posted @ 2020-06-10 17:37 HoLoong 阅读(368) 评论(0) 推荐(0)
摘要:200行Python代码实现贪吃蛇 话不多说,最后会给出全部的代码,也可以从这里Fork,正文开始; 目前实现的功能列表: 贪吃蛇的控制,通过上下左右方向键; 触碰到边缘、墙壁、自身则游戏结束; 接触到食物则食物消失,同时根据食物类型身体会变长; 目前长度显示; 暂停、死亡界面; 运行动图 代码片段 阅读全文
posted @ 2020-04-07 20:53 HoLoong 阅读(9498) 评论(2) 推荐(1)
摘要:140行代码实现Flippy Bird 话说这游戏中文名叫什么来着,死活想不起来了,算了话不多说,140行实现小游戏系列第二章,依然是简单小游戏,与数独游戏相比,在游戏界面显示上更难一些,但是在逻辑方面更简单一些,需要处理的无非是速度、加速度、时间、位置、碰撞检测,界面方面则要实现整个动态的显示; 阅读全文
posted @ 2020-04-05 17:43 HoLoong 阅读(2784) 评论(1) 推荐(1)
摘要:Python实现十大经典排序算法 代码最后面会给出完整版,或者可以从我的Githubfork,想看动图的同学可以去这里看看; 小结: 运行方式,将最后面的代码copy出去,直接python sort.py运行即可; 代码中的健壮性没有太多处理,直接使用的同学还要检查检查; 对于希尔排序,gap的选择 阅读全文
posted @ 2020-04-04 18:30 HoLoong 阅读(1015) 评论(0) 推荐(0)
摘要:150行代码实现图形化数独游戏 "Github地址" ,欢迎各位大佬们fork、star啥的,感谢; 今天闲着没事干,以前做过html+js版的数独,这次做个python版本的,界面由pygame完成,数独生成由递归算法实现,由shuffle保证每次游戏都是不一样的情况,have fun; 功能列表 阅读全文
posted @ 2020-04-03 17:41 HoLoong 阅读(10350) 评论(6) 推荐(1)
摘要:前言 1. 该篇分享来源于NFL竞赛官方的R语言版本,我做的主要是翻译为Python版本; 2. 分享中用到的技巧、构建的特征、展示数据的方式都可以应用到其他领域,比如篮球、足球、LOL、双人羽毛球等等,只要是团队竞技,都可以从中获益; 3. 分享基于kaggle上的 "NFL大数据碗" ,也就是基 阅读全文
posted @ 2020-01-21 17:49 HoLoong 阅读(569) 评论(1) 推荐(0)
摘要:kaggle竞赛分享:NFL大数据碗 上 竞赛简介 一年一度的NFL大数据碗,今年的预测目标是通过两队球员的静态数据,预测该次进攻推进的码数,并转换为该概率分布; 竞赛链接 https://www.kaggle.com/c/nfl big data bowl 2020 项目链接,该项目代码已经pub 阅读全文
posted @ 2020-01-20 14:33 HoLoong 阅读(1105) 评论(2) 推荐(0)