一. 深度学习概览

1.为什么resnet应用在图像识别

     因为传统神经网络精度有限,而只是增加层数无法提高精度。而resnet可以改变这个问题。

2.Microsoft SwitchBoard

   在语音识别中进行的突破。

3.微软AI

两个微软做的图像识别视频识别,在网站上就可以跑,非常有趣!

https://customvision.ai/这个可以自己做一个分类识别

https://www.videoindexer.ai这个可以在视频中把人分出来(有名人库,名人可以查到姓名),还可以把这些人说的文字写成文本(可以精确到人在几分几秒说话),把重要的部分打标签,真的很高级!!!

 下面是微软的一款工具CNTK

CNTK(全开源)(微软很多东西用它做训练,和tenserflow还有caffe比好处就是特别快)代码在github上开源,见链接:

https://github.com/Microsoft/CNTK

 

 

 CNTK与其他对比就是在多GPU加速和多机器方面速度几乎依然可以呈现线性增长,而不是增长速度大幅放慢。

4.最新的一些工具:

lightGBM

lightLDA

lightRNN

5.对偶学习(e.g.从图像生成文字再从文字生成图像,那么这两个图像都是图像,可以寻找其中关系。)

因为很多机器学习依赖于人工标记一些数据,而这个的代价是非常昂贵的,所以通过对偶学习可以节省成本,优化框架。