【文献阅读】多NAO机器人通信与轨迹规划问题研究

`2019`

# 多NAO机器人通信与轨迹规划问题研究

> 本文要使机器人足球赛中,使机器人在踢球时通信更加可靠,场上各机器人能够各司其职,多机器人规划出来的路径短且光滑,使得多机器人在进行协作踢球时效率更高。

## `一、应用背景`

​		通信问题:机器人足球赛中通信实时性差、通信质量不好、通信效率低等;

​		踢球时角色分配混乱;

​		规划的轨迹比较长而且不够光滑。

## `二、研究路线`

(1)控制系统体系、模块。

(2)通信方法:UDP 在通信时机器人之间不需要建立连接,而是可以通过广播方式共享信息。

(3)结合分级竞标策略的思想和任务分配方式中市场交易机制的优点,提出一种改进的主攻、助攻和后卫等角色分配算法。

![](https://img2020.cnblogs.com/blog/2530969/202109/2530969-20210910162024877-228630178.png)

![](https://img2020.cnblogs.com/blog/2530969/202109/2530969-20210910161931674-660839660.png)


​		认知是接收摄像头的图像和视频,以及传感器从运动过程获得的数据并处理这些数据,最后将高级运动命令发送给运动的过程。运动过程实际上通过生成 NAO 的 21 个关节目标角度来执行运动命令。这些运动命令通过 lib-bhuman 发送目标角度给 NAO 的设备通信管理器 DCM。

​		将 NAO 机器人控制系统的基本架构划分为五个部分。分别是视觉、定位、通信、动作和决策等 5 个模块。

![](https://img2020.cnblogs.com/blog/2530969/202109/2530969-20210910161940388-319075629.png)


① 眼睛——视觉模块——主要处理摄像头采集的图像和视频数据,进行图像处理与模式识别,为定位模块和决策模块提供有效的信息;

② 导航——定位模块——通过比赛场上的一些标志信息(如边线、罚球点等)等视觉信息和动作反馈信息,以及无线模块发送的机器人共享的定位信息,采用如蒙特卡罗算法等定位算法生成并更新自身位置信息;

③ 电话——通信模块——根据 UDP通信协议,使场上的 NAO 机器人可以互相传输球和自身位置的信息,并且在比赛过程中接收裁判的控制信息以及其他有用的团队信息,从而使得 NAO 机器人可以通过该模块进行数据和信息共享,使多机器人之间能够相互配合;

④ 发动机——动作模块——接受并解析“决策模块”的命令参数,并将其转换为机器人底层的关节和指示器的运行参数,使机器人执行上层模块的命令;

⑤ 大脑——决策系统——根据视觉模块提供的图像信息以及定位模块提供的位置信息来制定各种决策,进而将决策通过信息共享的方式让所有机器人都接收到,最后接受到决策的机器人选择性地驱动动作模块执行行为的过程。决策系统的优秀程度决定了机器人智能水平的高低,是实现机器人之间良好协作的关键。

## `三、研究细节`

(1)机器人队间通信是把消息通过 UDP 包的方式向场上广播,接收到的机器人根据队号以及机器人的编号来处理接收到的 UDP 包。【缺点:没有考虑通信距离、存在数据丢包】

(2)决策系统——分层结构:

![](https://img2020.cnblogs.com/blog/2530969/202109/2530969-20210910161948797-1313171936.png)


① 根据自己与球的距离分配前锋角色,各角色对球执行的操作有不同的权重(有点像Q网络?)。当球所处的位置变化时,再次根据自己与球的距离,进行角色转换。动作策略、动作幅度的选择还与所处的区域范围、对手的位置、队友的位置、射门角度等有关。

② 守门员只接收球的信息,不参与角色分配。与球保持同一直线,根据球速等制定策略。守门员可以帮助队友定位。

③ 实现方法:

 	1. 角色适合度——投标算法——按次序分配机器人角色,降低重复分配的可能性;
 	2. 主攻机器人离球越近,且越朝向对方球门以及越靠近双方球门中心连线时,踢球命中率越高。卡耐基梅隆大学提出了一种主攻角色投标公式。计算得出的投标值越小,越适合主攻的角色。其他角色同理。
 	3. 分配完主攻,助攻和后卫的角色后,若还有未分配的角色,则担任机会主义者,在前场寻找机会。如果出现机器人被罚下的情况,机会主义者可以暂时顶替空缺,也能保持场上机器人整体阵型的完整性。守门员角色固定,不参与角色动态分配。

(3)点球实验验证

​	① 点球实验,即在没有对方球员干扰下进行踢球并完成射门,保证了周围环境不会对比赛带来影响。

(4)动态路径规划

​	RRT实时性差、可重复性差。在动态可变的障碍物环境中,需要实时地根据场上障碍物的信息进行实时的路径规划,以适应比赛场上的环境。结合 RRT 算法全局搜索的优势,需要引进适当的局部搜索算法。

## `优点与不足`

(1)优点:在多 NAO 机器人通信与实现、动态角色变换和轨迹规划算法等方面的研究取得了不错的成果。

(2)不足:

​	① 机器人定位的准确性;

​	② 从一个节点到另一个节点的过程中首先要进行转身等预备动作;

​	③ 球、队友机器人、球场的图像识别与处理;



## 参考文献!

(1)中国科技大学的薛峰等主要针对 NAO 机器人的步态规划和动作方面进行了研究,并在 NAO 机器人步态规划方面研究取得了一定的成果[14]。

(2)安徽大学的李龙澍教授团队在 NAO 机器人目标识别与自定位方面进行了大量的研究工作,他们在球的识别、球门和球场的识别等算法方面进行了大量的研究,可以说在图像处理方面取得了相当喜人的成果[15~17]。

(3)将 NAO 机器人运用在科研或者比赛的主要是参加 RoboCup,来自于德国的 B-human 团队[18]经过多年的研究形成了一套完整的B-human 系统架构。

(4)点对点的IP通信协议无法满足动态、实时通信的要求。MACS协议是动态、按需分配的多址通信协议,这种协议可以实现资源的按需分配和动态实时分配,但因其控制时隙的存在也增大了计算和存储空间开销,降低了多机器人协作的效率[21]。

(5)在机器人足球比赛过程中,数据的传递和信息的共享往往会存在一定的错误和延时,这不 仅影响了机器人间通信的可靠性,而且也影响了整场比赛的效率。为了解决通信可靠性的这类问题,芬兰学者 Yang Liu 提出了额外的纠错法则[22]。

(6)张凯[24]在研究多智能体机器人系统结构的基础上,深入研究了多机器人的通信模型和通信方式,并针对多智能体系统的特点提出了一种多层次智能体网络统一模型。

(7)陈鹏慧等[36]对多机器人协作的角色分配进行了分析,提出了一种基于多影响因素的角色动态分配机制,使得多机器人之间能够合理地进行任务分配。

(8)程硕远等[37]针对足球机器人在角色任务分配上实时性等的不足,提出了一种“ 角色分配、行为选择、数据输出”三个层次的决策模型,并就角色分配机制流程、队员信息的完善和排名以及角色的确定进行了深入的研究。

## `启发`

(1)结合涌现的特征之一——相互作用,采用分布式控制,参考《Structural multi-agent learning》的思想,进行通信层次化!

(2)系统的泛化性——参考UPDeT!

(3)编队的利用!


posted on 2021-09-10 16:21  Ohnokazu  阅读(190)  评论(0)    收藏  举报