第一次作业

对人工智能技术的认识

当前课程过半，大家对机器学习、模式识别等人工智能领域有了一定的认识，现布置一篇博客作业：

检索一些文献或者网页资讯，记录机器学习等人工智能领域的前沿技术介绍、展望、应用，了解我们国家的先进或不足，存在的卡脖子技术等（选取一种技术方向即可）
平时有关注机器之心公众号，对行业的现状略有了解
先进：
人脸识别，应用在各行各业，比如安防监控、金融领域。因为政策的支持，我国人脸识别行业蓬勃发展。我有所了解的是face++，在国产安卓机中普遍使用的解决方案，仅依靠摄像头，解锁速度快错误率低，体验很好。相比其他厂商的方案，在周围黑暗噪点多的环境下表现优异。同时旷视也为支付宝提供线下人脸支付机器、线上刷脸。同时face++现已成长为世界最大的人脸识别技术平台。
旷视的MegEngine框架，在旷视内部一直使用的框架，国产深度学习框架中优秀代表，基于c++开发，从对比数据来看训练速度优于Pytorch和TF，同时具备一些Pytorch和TF不具备的特性。

不足：

最不足的我认为是硬件。现在主流的框架依赖的硬件CUDA一家独大，国内阿里、依图也在开发硬件，但都是ASIC，自家用。距离建立起生态还有很长的路要走。

补充：

最近一周，YOLO V4热度较高，尝试去了解了下YOLO V4 ：

在相关论文中，研究者对比了 YOLOv4 和当前最优目标检测器，发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下，速度是 EfficientDet 的二倍。此外，与 YOLOv3 相比，新版本的 AP 和 FPS 分别提高了 10% 和 12%。

许多特征可以提高 CNN 的准确率，然而真正实行起来，还需要在大型数据集上对这些特征组合进行实际测试，并且对测试结果进行理论验证。某些特征仅在某些模型上运行，并且仅限于特定的问题，或是只能在小型数据集上运行；而另外有些特征（如批归一化和残差连接）则适用于大多数模型、任务和数据集。
YOLOv4 使用了以下特征组合，实现了新的 SOTA 结果：

加权残差连接（WRC）
Cross-Stage-Partial-connection，CSP
Cross mini-Batch Normalization，CmBN
自对抗训练（Self-adversarial-training，SAT）
Mish 激活（Mish-activation）
Mosaic 数据增强
DropBlock 正则化
CIoU 损失

据介绍，YOLOv4 在 MS COCO 数据集上获得了 43.5% 的 AP 值 (65.7% AP50)，在 Tesla V100 上实现了 ∼65 FPS 的实时速度。
YOLO v4 与其他 SOTA 目标检测器的对比结果如下图所示。从图上可以看出，YOLOv4 位于帕累托最优曲线上，并在速度和准确性上都优于最快和最精准的检测器。

Alexey Bochkovskiy实在太牛了...

posted @ 2020-05-05 21:22 fzu_Y 阅读(231) 评论(0) 收藏举报

刷新页面返回顶部

fzu_Y

第一次作业

对人工智能技术的认识

当前课程过半，大家对机器学习、模式识别等人工智能领域有了一定的认识，现布置一篇博客作业：

补充：

最近一周，YOLO V4热度较高，尝试去了解了下YOLO V4 ：

公告