随笔档案「2020年2月」 - 吕汉鸿

Deep Learning with Python 读书笔记（五）机器学习模型的评估

摘要：在机器学习中，我们通常都将手中的数据分为3部分：训练数据、验证数据和测试数据。不用相同的数据来训练和评估一个机器学习模型的原因很容易理解，那就是容易造成模型的过拟合（overfitting）。过拟合的模型在新数据面前，预测的准确度不仅仅会停滞不前，甚至会不断的恶化。我们知道机器学习的目标是获得一个阅读全文

posted @ 2020-02-24 20:29 吕汉鸿阅读(260) 评论(0) 推荐(0)

软件外包中心的成熟度模型

摘要：本人作者：吕汉鸿事实证明，软件外包对全球许多公司来说都是巨大的成功。这些组织的CIO制定了IT战略，以支持企业在发展业务方面的愿景。 CIO对其他高级管理人员的承诺是按时并在预算范围内交付高质量的项目。在年度审核期间评估和选择成熟的离岸开发中心（ODC）已成为CIO议程中的关键部分。在本文中，我们将介绍离岸开发中心的成熟度模型。开发中心是由发起软件项目的组织全资拥有还是该组织的第三方合作伙伴，都没有太大的区别。该模型是我本人在3家知名国际银行（花旗银行、瑞士银行、野村证券）管理跨国家和跨时区的离岸软件项目时并结合软件开发最佳实践而总结出来的。该模型很好地服务于上述华尔街公司的IT策略。对于非银行业，这种成熟度模型同样适用，因为这些最佳实践并非针对特定行业。阅读全文

posted @ 2020-02-23 00:13 吕汉鸿阅读(375) 评论(0) 推荐(0)

Deep Learning with Python 读书笔记（四）导数、梯度和随机梯度下降

摘要：一个连续函数f(x) = y，其中x和y都是实数，当x值有个微小的变化时，y的值也会只有一个微小的变化，所以f(x+epsilon_x) = y+epsilon_y，这里epsilon_x和epsilon_y都是一个很小的值。当f(x)函数代表一条光滑的曲线时，我们可以用一条直线模拟f(x)在点p周围的微小变化，因此我们可以再把上面的公式写成： f(x+epsilon_x) = y + a*epsilon_x （前提是epsilon_x和epsilon_y都是一个很小的值），这里a是曲线f在点p的斜率，见下图。阅读全文

posted @ 2020-02-22 23:04 吕汉鸿阅读(293) 评论(0) 推荐(0)

Deep Learning with Python 读书笔记（三）神经网络的引擎：梯度优化

摘要：我们知道神经网络的每个层（layer）都会对输入数据做如下的转换： output = relu(dot(W, input) + b) 上面表达式中的W和b都是张量数据（tensor），它们代表这个神经网络层的属性，也被称作权重（weights）。这些权重数据就是神经网络通过学习训练数据而获得的。阅读全文

posted @ 2020-02-22 01:15 吕汉鸿阅读(202) 评论(0) 推荐(0)

Deep Learning with Python 读书笔记（二）机器学习历史回顾

摘要：虽然深度学习在近几年取得了不小的成功，也得到了业界的广泛关注，但是深度学习并不是机器学习中唯一最好的解决问题的方法。在我们深入学习深度学习之前，简单的了解机器学习中其他的方法非常必要，这样帮助我们避免把所有机器学习问题都尝试用深度学习算法去解决的错误想法。阅读全文

posted @ 2020-02-21 00:25 吕汉鸿阅读(250) 评论(0) 推荐(0)

Deep Learning with Python 读书笔记（一）人工智能、机器学习和深度学习

摘要：人工智能始于上世纪50年代，那时的计算机科学也只是一个刚刚兴起的学科。几位科学家一直在思考这样一个问题 - 人类能否让计算机具有思考问题的能力？在大家探索这个问题的同时，一个人工智能的定义被业界接受：人工智能是让电脑去解决通常需要人类智能才能解决的问题。根据这个定义，人工智能是一个广泛的领域，既包括机器学习和深度学习，也包括那些根本没有“学习”内容的其他方法，比如早期的国际象棋程序，它仅仅是把大量的象棋规则写进代码，所以根本没有学习的成分。在之后的很长一段时间里，不少专业人士都认为人类的智能完全可以通过编写足够多的“死规则”来实现。这种认识实际上是一种“假的”人工智能（symbolic AI），但是这种“假的”人工智能一直主宰这个领域，到了上世纪80年代随着专家系统的出现达到顶峰。阅读全文

posted @ 2020-02-20 21:52 吕汉鸿阅读(423) 评论(0) 推荐(0)

Once in a life time 机器学习/Java

02 2020 档案

公告