深度学习第一节——绪论

人工智能和机器学习概述

深度学习和人工智能的一个大环境,2017年颁布新一代人工智能发展规划,今年,科技部和四家企业,百度,阿里云,腾讯,科大讯飞在自动驾驶,城市大脑,医疗影像,智能语音成立了新一代开放创新平台,美国自下而上。

人工智能人才缺口,从全球整体来看,人工智能存在严重供给不足,在中国尤其严重。教育部加快培养人工智能高端人才,完善教育体系,2018.04推动人工智能一级学科建设,到2020年建设100个“人工智能+X”复合特色专业,建立50家人工智能学院研究院,面向产业合作,面向教育,面向产业合作的。

什么是人工智能?Aetificial Intelligence,使机器人像人一样进行感知、认知、决策、执行的人工程序或系统。麦卡锡发明LISP,阿兰·图灵机器制能。图灵与人工智能:图灵测试,验证码系统,数字,图片,验证码有一些是深度学习能解决的。模仿游戏:图灵团队破解Enigma密码系统,体现对抗式生成网络(GAN),图灵奖是计算机届的诺贝尔奖,2017年颁给RISC指令集。

人工智能发展标志性事件,高速发展期,2006年,深度学习被提出,人工智能算法产生。人工智能的三个层面:计算智能:能存能算,快速计算,记忆存储,深蓝算法的核心是暴力穷举;感知智能:能听能说、能看会认,类似于人的视觉、听觉、触觉等感知能力。认知智能:逻辑推理、知识理解、决策思考,概念、意识、观念都是认知智能的表现,人类可以进化。

人工智能+金融:芝麻信用,阿里巴巴的电商数据,蚂蚁金服的互联网数据,合作公共机构合作伙伴,用户自主信息提交渠道。影响消费信贷,消费分期,信用卡,P2P。人工智能+内容创作:淘宝鲁班系统制作个性化海报。人工智能+机器人,。

人工智能>机器学习>深度学习。人工智能是一个领域,机器学习是一个方法。

AI数理基础,逻辑和概率。主流技术逻辑推理。

实现人工智能主要有两条脉络,一个是早期的知识工程专家系统,另外一个是机器学习。区别:前者是人工定义准则,后者是机器模型,决策树,不是专家手工定义,有训练的文档,对有些邮件标注书否是垃圾文件,通过数据自动学习的模型,例子:调查问卷,性格测试。 首先确定一个语义概念,二确定同一概念的不同图像模式。总结:知识工程的方式是基于手工设计规则,因为专家人来设计结果容易解释,系统构建费时费力,依赖专家主观经验,难以保证一致性和准确性,机器学习的方法基于数据自动学习,提高信息处理的效率,减少人工规则主观性,可信度高,但结果可能不易解释,减少人工规则主观性,可信度高。

软件2.0假设,从编程角度,写函数过程专家系统,机器学习

问题尺度,规则复杂度作为尺度衡量问题规模,决定使用什么方法。

知识工程的发展和融合。

机器学习的应用技术领域。计算机视觉,

计算机视觉:人脸识别,图像分类,目标检测,图像搜索,图像分割,视频监控。语音技术:语音识别,语音合成,声纹识别,语音唤醒(智能音箱)。自然语言处理:文本分类,机器翻译,知识图谱,自动问答,信息检索,文本生成。

机器学习的定义:最常用:“计算机系统能够利用经验提高自身的性能”;可操作:“机器学习本质是一个基于经验数据的函数估计问题”;统计学:“提取重要模式、趋势,并理解数据,即从数据中学习。”总结:从数据中自动提取知识。

机器学习学什么,有大量数据,有意义的模式,擅长没有解析解的问题。优化方法寻找近似解。

怎么学,要素。模型:对要学习问题映射的假设(问题剑魔,确定假设空间),策略:从假设空间中学习选择最幽默性的准则(确定目标函数),算法:根据目标函数求解最有模型的具体计算方法(求解模型参数)。

模型:三个维度:数据标记,包括监督学习模式,无监督学习模式。半监督学习,强化学习(离标记越远越近,环境跟智能体的反馈,适合解决决策类问题)。

 

 

人工智能是一个科技领域,是一个目标,机器学习是实现这个目标的一种方法,在机器学习方法里,有很多种分类方法,如果神经网络里用了深度的神经网络,深度学习的方法。

传统机器学习:人工设计特征。在实际应用中,特征往往比分类器更重要。

流程:原始数据——数据预处理——特征提取——特征转换——预测识别——结果。

传统深度学习和深度学习区别:同:都有输入输出

专家系统:手工射击规则

传统:LBP

简单表示学习:没有人参与

深度学习:特征就是我们输出

深度学习时代:

1.收集标注数万张图片

2.挑几个深度模型,选几组模型超参数

3.交给机器绞尽脑汁优化学模型中的数千万、数亿权重参数

大概几个月时间

后深度学习时代:

1.收集代表性图片

2.交给机器绞尽脑汁完成任务

 

深度学习理论研究:从能到不能

深度学习的“不能”与解释性:

知道哪些特征对输出有重要影响:

稳定性低

可调式性差

双向:算法能被人的知识体系理解,利用和结合人类知识

参数不透明

机器偏见

知识得到有效存储、积累和复用——越学越聪明

增量性差

推理能力差

posted @ 2020-10-17 17:33  Schnappy  阅读(431)  评论(0)    收藏  举报