1.深度学习介绍 [跟着沐神-动手学深度学习]
深度学习介绍
AI地图
·感知:所能看到的物体
·推理:根据所看到的东西想象未来可能会发生什么
·知识:根据所看到的数据或者是现象形成自己的知识
·规划:在知道所有东西的情况下能够进行一个比较长远的规划
深度学习的模式识别已经彻底改变,引入了一系列技术(计算机视觉、自然语言处理和自动语音识别)。
成功的应用深度学习:必须知道如何抛出一个问题、建模的数学方法、将模型与数据拟合的算法,以及实现这些工程的技术。
深度学习在应用上的突破:
一、图片分类
什么是ImageNet?
ImageNet是一个计算机视觉系统识别项目,ImageNet 通过类似于 WordNet 层次结构组织图像数据。ImageNet数据集是一个比较大的图片分类数据集,包含1000类的自然物体的图片,大约有100万张图片。
上图表示了从 2010 年到 2017 年的 ImageNet 分类的错误率 ,X轴表示时间 Y轴表示错误率 图中的点表示一些工作的错误率
在2012年的时候错误率有一个比较大的下降,也是深度学习的开始,在接下来的5年中,深度学习将整个图片分类的误差已经降到非常低了,2017年的时候,基本上所有的团队都能将错误率达到 5% 以内,基本上可以达到人类对图片识别的精度,因此,深度学习在图片分类上已经做的非常好了 。
二、物体检测和分割
·当不仅仅希望知道图片中有什么内容,还想要知道是什么、在什么地方,这就需要物体检测
·物体分割是想要知道每一个像素是属于哪一个物体
三、样式迁移
将样式图片和内容图片进行合成,也可以认为就是滤镜,这样的好处是只要找到某一种样式的图片就可以把内容图片换成任意所想要的形式
四、人脸合成
利用算法随机合成人脸,以上图片中的人脸为算法合成,人眼判断是否为假较为困难。
五、文字生成图片
输入萝卜遛狗的图片,生成牛油果椅子。
六、图片生成文字
七、无人驾驶
利用计算机视觉模型将所有路线规划出来,现在智能辅助驾驶国内问界、理想和小米等。
案例研究
广告点击
任务:用户输入然后推荐用户广告
问题三个阶段:触发、点击率评估和排序
1、触发 在输入关键词之后,立即找到一些相应的广告
2、点击率预估 建议一个预测模型,预测用户在看到广告之后的点击情况,p表示用户点击广告的概率
3、排序 跟据广告的点击率和每次用户点击之后广告主所付的报酬,利用用户点击率*竞价作为广告排序的依据,数值越大的排名越靠前,排名较低的可能会进行舍弃
预测与训练
1、在看到一个广告之后,首先需要进行特征提取:广告主、产品描述信息、产品图片
2、将上述特征放入预测模型之后就能够得到点击率的预测
3、另外,可以将过去所有用户的广告点击数据存下来,然后将其作为用户真实的点击行为进行特征提取,然后对模型进行训练 .