2020软件杯赛题分析

赛题名称:视频全量目标分析和建模

赛题简介:人工智能结合视觉分析,极大推动各行业视觉应用。人脸识别、车辆测别、车辆智能驾驶等。结合当前高清1080P、2K、4K等视频,利用人工智能进行视觉分析技术,具有广泛得应用场景。

业务场景:针对10分钟1080P视频,视频内容街景(行车记录仪、电影等拍摄)内容,需要利用视觉分析技术,对高分辨率视频进行视频图像语义分割,赛题要求参赛者给出测试视频数据中每帧的每个点的类别预测。本赛题是为了对街景或高楼的高清视频进行目标检测和语义分割,相比于基于现有的方案进行简单的调参,我们更鼓励参赛者提出创新的深度学习算法模型解决方案。

基本功能要求:

场景要求是基于华为AI昇腾平台,重点考核建筑物等固定目标得识别和分割。

基本要求如下:

1、视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;

2、实现对高清视频的图像语义分割,对每帧的每个点的类别预测;

3、基于华为昇腾AI平台进行开发。

例如以下实现方式:

图片1.jpg

参考资料:基于目标建模的视频图像目标检测研究  https://www.ixueshu.com/document/994906362d7885decca0479d5b18b1b9318947a18e7f9386.html

视频跟踪中的目标建模及相似性度量研究:http://xueshu.baidu.com/usercenter/paper/show?paperid=ca30c97dd3c6ed4a2e9527f102220322&site=xueshu_se

python读取视频显示视频和保存视频文件:https://blog.csdn.net/qq_18343569/article/details/50275305

开发环境及语言:

华为云 python

江苏鲲鹏生态创新中心提供AI开发和训练平台,(AI平台会提供基础的开发和训练环境。数据集参考VOCCOCOcityscapes-image-pairsSemantic Segmentation for Self Driving Cars等),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

江苏鲲鹏生态创新中心提供AI开发和训练平台,(视频资源自备,电影或者实际拍摄),开发者可以向江苏鲲鹏生态创新中心获取账号和资源。开发语言、深度学习框架及数据库等不限制。

 

 

 功能需求

可导入一段10分钟1080P视频

视频内容内移动目标识别,包括人、机动车、非机动车、建筑、植物等;

实现对高清视频的图像语义分割,对每帧的每个点的类别预测

对不同事物进行不同颜色标记并可以剔除

 

性能需求

实现移动目标5种识别以上

实现移动目标10种识别,其中建筑物必须识别。

系统良好运行

 

 

 

 

 

posted @ 2020-04-29 21:45  20173667  阅读(507)  评论(0编辑  收藏  举报