2020软件杯赛题分析

赛题名称:视频全量目标分析和建模

赛题简介：人工智能结合视觉分析，极大推动各行业视觉应用。人脸识别、车辆测别、车辆智能驾驶等。结合当前高清1080P、2K、4K等视频，利用人工智能进行视觉分析技术，具有广泛得应用场景。

业务场景：针对10分钟1080P视频，视频内容街景（行车记录仪、电影等拍摄）内容，需要利用视觉分析技术，对高分辨率视频进行视频图像语义分割，赛题要求参赛者给出测试视频数据中每帧的每个点的类别预测。本赛题是为了对街景或高楼的高清视频进行目标检测和语义分割，相比于基于现有的方案进行简单的调参，我们更鼓励参赛者提出创新的深度学习算法模型解决方案。

基本功能要求：

场景要求是基于华为AI昇腾平台，重点考核建筑物等固定目标得识别和分割。

基本要求如下：

1、视频内容内移动目标识别，包括人、机动车、非机动车、建筑、植物等；

2、实现对高清视频的图像语义分割，对每帧的每个点的类别预测；

3、基于华为昇腾AI平台进行开发。

例如以下实现方式：

图片1.jpg

参考资料：基于目标建模的视频图像目标检测研究 https://www.ixueshu.com/document/994906362d7885decca0479d5b18b1b9318947a18e7f9386.html

视频跟踪中的目标建模及相似性度量研究：http://xueshu.baidu.com/usercenter/paper/show?paperid=ca30c97dd3c6ed4a2e9527f102220322&site=xueshu_se

python读取视频显示视频和保存视频文件：https://blog.csdn.net/qq_18343569/article/details/50275305

开发环境及语言：

华为云 python

江苏鲲鹏生态创新中心提供AI开发和训练平台，（AI平台会提供基础的开发和训练环境。数据集参考VOC、COC O、cityscapes-image-pairs及Semantic Segmentation for Self Driving Cars等），开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

江苏鲲鹏生态创新中心提供AI开发和训练平台，（视频资源自备，电影或者实际拍摄），开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

功能需求

可导入一段10分钟1080P视频

视频内容内移动目标识别，包括人、机动车、非机动车、建筑、植物等；

实现对高清视频的图像语义分割，对每帧的每个点的类别预测

对不同事物进行不同颜色标记并可以剔除

性能需求

实现移动目标5种识别以上

实现移动目标10种识别，其中建筑物必须识别。

系统良好运行

posted @ 2020-04-29 21:45 20173667 阅读(507) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

20173667

2020软件杯赛题分析

公告