摘要:zip()的作用 先看一下语法: Python的内置help()模块提供了一个简短但又有些令人困惑的解释: 返回一个元组迭代器,其中第i个元组包含每个参数序列或可迭代对象中的第i个元素。当最短的可迭代输入耗尽时,迭代器将停止。使用单个可迭代参数,它将返回1元组的迭代器。没有参数,它将返回一个空的迭代 阅读全文
posted @ 2020-02-16 09:18 jpld 阅读 (133) 评论 (0) 编辑
摘要:回归模型的性能的评价指标主要有:RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、R2_score。但是当量纲不同时,RMSE、MAE、MSE难以衡量模型效果好坏。这就需要用到R2_score,实际使用时,会遇到许多问题,今天我们深度研究一下。 预备知识 搞清楚R2_score 阅读全文
posted @ 2019-12-11 13:54 jpld 阅读 (464) 评论 (0) 编辑
摘要:Boosting算法 Boosting是一种用来提高弱分类器准确度的算法,是将“弱学习算法“提升为“强学习算法”的过程,主要思想是“三个臭皮匠顶个诸葛亮”。一般来说,找到弱学习算法要相对容易一些,然后通过反复学习得到一系列弱分类器,组合这些弱分类器得到一个强分类器。 Boosting算法要涉及到两个 阅读全文
posted @ 2019-12-04 15:02 jpld 阅读 (45) 评论 (0) 编辑
摘要:本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入、数据清洗、预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作。 生成数据表 常见的生成数据表的方法有两种,第一种是导入外部数据,第二 种是直接写入数据。Excel中的“文件”菜单中提供了获取外部数据的功 阅读全文
posted @ 2019-12-03 14:38 jpld 阅读 (568) 评论 (0) 编辑
摘要:作者:努力的孔子 https://www.cnblogs.com/yanshw/p/10735079.html 对模型进行评估时,可以选择很多种指标,但不同的指标可能得到不同的结果,如何选择合适的指标,需要取决于任务需求。 正确率与错误率 正确率 :正确分类的样本数/总样本数,accuracy 错误 阅读全文
posted @ 2019-11-28 11:42 jpld 阅读 (40) 评论 (0) 编辑
摘要:介绍 在参与的项目和产品中,涉及到模型和算法的需求,主要以自然语言处理(NLP)和知识图谱(KG)为主。NLP涉及面太广,而聚焦在具体场景下,想要生产落地的还需要花很多功夫。 作为NLP的主要方向,情感分析,文本多分类,实体识别等已经在项目中得到应用。例如 通过实体识别,抽取文本中提及到的公司、个人 阅读全文
posted @ 2019-11-25 10:25 jpld 阅读 (105) 评论 (0) 编辑
摘要:本文是对 "100天搞定机器学习|Day33 34 随机森林" 的补充 前文对随机森林的概念、工作原理、使用方法做了简单介绍,并提供了分类和回归的实例。 本期我们重点讲一下: 1、集成学习、Bagging和随机森林概念及相互关系 2、随机森林参数解释及设置建议 3、随机森林模型调参实战 4、随机森林 阅读全文
posted @ 2019-11-22 13:06 jpld 阅读 (451) 评论 (0) 编辑
摘要:1、熵的定义 熵最早是一个物理学概念,由克劳修斯于1854年提出,它是描述事物无序性的参数,跟热力学第二定律的宏观方向性有关:在不加外力的情况下,总是往混乱状态改变。熵增是宇宙的基本定律,自然的有序状态会自发的逐步变为混沌状态。 1948年,香农将熵的概念引申到信道通信的过程中,从而开创了”信息论“ 阅读全文
posted @ 2019-11-20 16:55 jpld 阅读 (41) 评论 (0) 编辑
摘要:目前计算机视觉(CV)与自然语言处理(NLP)及语音识别并列为人工智能三大热点方向,而计算机视觉中的对象检测(objectdetection)应用非常广泛,比如自动驾驶、视频监控、工业质检、医疗诊断等场景。 目标检测的根本任务就是将图片或者视频中感兴趣的目标提取出来,目标的识别可以基于颜色、纹理、形 阅读全文
posted @ 2019-11-20 09:39 jpld 阅读 (626) 评论 (1) 编辑
摘要:100天搞定机器学习 大家好,100天搞定机器学习前54天是对Avik Jain开源项目100 Days Of ML Code的翻译+自己的理解 https://github.com/Avik Jain/100 Days Of ML Code 但是这个项目到54天就鸽掉了,十分可惜。 从第55天开始 阅读全文
posted @ 2019-11-20 09:18 jpld 阅读 (80) 评论 (0) 编辑