移动边缘计算调查:通信视角
移动边缘计算调查:通信视角
2017年的论文
A Survey on Mobile Edge Computing: The Communication Perspective
摘要 — 在物联网和 5G 通信愿景的推动下,近年来,移动计算发生了范式转变,从集中式移动云计算转向移动边缘计算 (MEC)。MEC 的主要特点是将移动计算、网络控制和存储推向网络边缘(例如,基站和接入点),以便在资源有限的移动设备上实现计算密集型和延迟关键型应用程序。MEC 承诺大幅降低延迟和移动能耗,解决实现 5G 愿景的关键挑战。MEC 承诺的收益激励了学术界和工业界为开发该技术付出了广泛的努力。MEC 研究的一个主要目标是无缝融合无线通信和移动计算这两个学科,从而产生从计算卸载技术到网络架构的广泛新设计。本文对最先进的 MEC 研究进行了全面调查,重点是无线电和计算资源的联合管理。我们还讨论了 MEC 研究的一系列问题、挑战和未来研究方向,包括 MEC 系统部署、支持缓存的 MEC、MEC 的移动性管理、绿色 MEC 以及隐私感知 MEC。这些方向的进步将促进 MEC 从理论到实践的转变。最后,我们介绍了 MEC 的最新标准化工作以及一些典型的 MEC 应用场景。
索引术语 — 移动边缘计算、雾计算、移动云计算、计算卸载、资源管理、绿色计算。
I. 引言
过去十年见证了云计算成为一种新的计算范式。其愿景是将计算、存储和网络管理集中在云中,指的是数据中心、骨干 IP 网络和蜂窝核心网络 [1], [2]。然后,可以利用云中可用的大量资源来提供弹性计算能力和存储,以支持资源受限的最终用户设备。云计算一直在推动许多互联网公司的快速增长。例如,云业务已成为 Amazon 最赚钱的领域 [3],而 Dropbox 的成功在很大程度上依赖于 Amazon 的云服务。
然而,近年来,随着云的功能越来越多地向网络边缘移动,计算出现了一种新的趋势 [4]。据估计,在不久的将来将部署数百亿台边缘设备,并且它们的处理器速度正在按照摩尔定律呈指数级增长。收集分布在网络边缘的大量闲置计算能力和存储空间,可以产生足够的容量来在移动设备上执行计算密集型和延迟关键任务。这种范式称为移动边缘计算 (MEC) [5]。虽然长传播延迟仍然是云计算的一个主要缺点,但 MEC 具有近接访问功能,被广泛认为是实现下一代互联网各种愿景的关键技术,例如触觉互联网(毫秒级反应时间)[6]、物联网 (IoT) [7] 和物联网 [8]。目前,来自学术界和工业界的研究人员一直在积极推广 MEC 技术,寻求移动计算和无线通信两个学科的技术和理论的融合。本文旨在从传播的角度对这一年轻领域的关键研究进展进行综述。我们还将提出一个研究展望,其中包含一系列有前途的 MEC 研究方向。
A. 面向 5G 的移动计算:从云到边缘
在过去十年中,移动设备的普及和移动 Internet 流量的指数级增长推动了无线通信和网络的巨大进步。特别是,小基站网络、多天线和毫米波通信的突破有望在下一代系统中为用户提供千兆无线接入 [9]。高速和高可靠的空中接口允许在远程云数据中心运行移动设备的计算服务,从而产生了称为移动云计算 (MCC) 的研究领域。但是,MCC 存在一个固有的局限性,即从最终用户到远程云中心的传播距离长,这将导致移动应用程序的延迟过长。因此,MCC 不足以满足各种对延迟至关重要的新兴移动应用程序的需求。目前,正在设计新的网络架构,以更好地将云计算的概念集成到移动网络中,本文后半部分将对此进行讨论。
在 5G 无线系统中,将部署超高密度边缘设备,包括小型蜂窝基站 (BS)、无线接入点 (AP)、笔记本电脑、平板电脑和智能手机,每个设备的计算能力可与十年前的计算机服务器相媲美。因此,大量设备将在每个时刻处于空闲状态。特别是,它将收集网络边缘可用的大量计算和存储资源,这将足以实现无处不在的移动计算。简而言之,从 1G 到 4G 的无线系统的主要目标是追求越来越高的无线速度,以支持从以语音为中心的流量过渡到以多媒体为中心的流量。随着无线速度接近有线速度,5G 的任务有所不同且更加复杂,即支持 ICT 和互联网的爆炸性发展。在功能方面,5G 系统将支持通信、计算、控制和内容交付 (4C)。在应用方面,5G 的广泛新应用和服务不断涌现,例如实时在线游戏、虚拟现实 (VR) 和超高清 (UHD) 视频流,这些应用和流媒体需要前所未有的高访问速度和低延迟。过去十年还见证了下一代互联网的不同愿景的兴起,包括 IoT、触觉互联网(毫秒级延迟)、Internet-of-Me 和社交网络。特别是,Cisco 预测,到 2020 年,互联网上将增加约 500 亿台物联网设备(例如传感器和可穿戴设备),其中大多数设备用于计算、通信和存储的资源有限,不得不依赖云或边缘设备来增强其能力 [10]。现在人们普遍认为,仅依靠云计算不足以实现 5G 中雄心勃勃的计算和通信毫秒级延迟。此外,最终用户和远程云之间的数据交换将使数据海啸饱和并导致回程网络瘫痪。这使得用 MEC 补充云计算变得至关重要,MEC 将流量、计算和网络功能推向网络边缘。这也与下一代网络的一个关键特征相一致,即信息越来越多地在本地生成和消费,这源于物联网、社交网络和内容交付等应用的蓬勃发展 [4]。
MEC 的概念由欧洲电信标准协会 (ETSI) 于 2014 年首次提出,并被定义为“在靠近移动用户的无线接入网络 (RAN) 内提供 IT 和云计算能力”的新平台 [5]。MEC 的原始定义是指使用 BS 从移动设备卸载计算任务。最近,Cisco 提出了雾计算的概念,作为 MEC 的一种通用形式,其中边缘设备的定义越来越广泛,从智能手机到机顶盒 [11]。这导致了一个名为雾计算和网络 [4], [12], [13] 的新研究领域的出现。但是,Fog Computing 和 MEC 的领域是重叠的,并且这两个术语经常互换使用。在本文中,我们重点介绍 MEC,但讨论的许多技术也适用于雾计算。
MEC 基于虚拟化平台实现,该平台利用了网络功能虚拟化 (NFV)、以信息为中心的网络 (ICN) 和软件定义网络 (SDN) 方面的最新进展。具体来说,NFV 通过创建多个虚拟机 (VM) 1 来同时执行不同的任务或运行不同的网络功能,使单个边缘设备能够为多个移动设备提供计算服务 [15]。另一方面,ICN 为 MEC 提供了另一种端到端服务识别范式,从以主机为中心转变为以信息为中心,以实现上下文感知计算。最后,SDN 允许 MEC 网络管理员通过函数抽象来管理服务,实现可扩展的动态计算 [16]。MEC 研究的一个主要重点是开发这些通用网络技术,以便它们可以在网络边缘实施。
越来越多的新兴移动应用程序将从 MEC 中受益,将其计算密集型任务卸载到 MEC 服务器进行云执行。在下文中,我们将提供两个示例来说明 MEC 的基本原理。一个是人脸识别应用,如图 1 所示,它通常由五个主要计算部分组成,包括图像采集、人脸检测、预处理、特征提取和分类 [17]。虽然图像采集组件需要在移动设备上执行以支持用户界面,但其他组件可以卸载以进行云处理,其中包含复杂的计算,例如信号处理和机器学习 (ML) 算法。另一种可以利用网络边缘丰富资源的流行应用程序流是增强现实 (AR) 应用程序,它们能够将计算机生成的数据与物理现实相结合。如图 2 所示,AR 应用程序有五个关键组件 [18]–[20],即视频源(从移动摄像头获取原始视频帧)、跟踪器(跟踪用户的位置)、映射器(构建环境模型)、对象识别器(识别环境中的已知对象)和渲染器(准备处理后的帧以供显示)。在这些组件中,视频源和渲染器应该在本地执行,而计算最密集的组件,即跟踪器、映射器和对象识别器,可以卸载以进行云执行。通过这种方式,移动用户可以享受 MEC 的各种好处,例如减少延迟和节省能源,这将在下一小节中详细说明。
B. 移动边缘计算与移动云计算
如表 I 所示,MEC 和 MCC 系统在计算服务器、与最终用户的距离和典型延迟等方面存在显著差异。与 MCC 相比,MEC 具有实现低延迟、为移动设备节省能源、支持上下文感知计算以及增强移动应用程序的隐私和安全性等优势。下面通过一些示例和应用程序简要介绍了这些优势。
低延迟:移动服务的延迟是三个部分的总和:传播、计算和通信延迟,分别取决于传播距离、计算容量和数据速率。首先,对于密集的小蜂窝网络或设备到设备 (D2D) 传输,MEC 的信息传播距离通常为数十米,在一般情况下通常不超过 1 公里。相比之下,云计算需要从最终用户传输到核心网络或数据中心的节点,距离从几十公里到跨大洲的距离不等。这导致 MEC 的传播延迟比 MCC 短得多。其次,MCC 要求信息通过多个网络,包括无线接入网络、回程网络和互联网,其中流量控制、路由和其他网络管理作可能会导致过度延迟。由于网络边缘的通信受到限制,MEC 不会遇到这些问题。最后,对于计算延迟,云具有巨大的计算能力,比边缘设备(例如 BS)高几个数量级。但是,与边缘设备相比,云必须由更多的用户共享,从而缩小他们在计算延迟方面的差距。此外,现代 BS 足够强大,可以运行高度复杂的计算程序。例如,BS 的边缘云的计算能力比运行流行的射击游戏《使命召唤 13》的最低要求(例如,超过 3.3GHz 的 CPU、8GB RAM、70GB 存储空间)高 102-104 倍2。一般来说,实验表明 MCC 的总延迟在 30-100 毫秒的范围内 [31]。这对于许多延迟关键型移动应用程序来说是不可接受的,例如实时在线游戏、虚拟运动和自动驾驶,这些应用程序可能需要延迟接近 1ms 的触觉速度 [37]。相比之下,MEC 具有较短的传播距离和简单的协议,有可能为延迟关键型 5G 应用实现触觉级延迟。
移动节能:由于其紧凑的形式,物联网设备的能量存储有限,但需要配合并执行复杂的任务,如监控、人群感应和健康监测[38]。为数百亿台物联网设备供电仍然是设计物联网的一个关键挑战,因为频繁的电池充电/更换即使不是不可能,也是不切实际的。通过有效支持计算卸载,MEC 成为延长 IoT 设备电池寿命的有前途的解决方案。具体来说,计算密集型任务可以从 IoT 设备卸载到边缘设备,以降低其能耗。实验已经证明,通过计算卸载可以显著节省能源,例如,多媒体应用程序 eyeDentify [39] 的计算负载增加了 44 倍,或者不同 AR 应用程序的电池寿命增加了 30-50% [40]。
情境感知:MEC 与 MCC 的另一个关键特性是 MEC 服务器能够利用边缘设备与最终用户的距离来跟踪他们的实时信息,例如行为、位置和环境。基于这些信息的推理允许向最终用户提供上下文感知服务 [41]–[43]。例如,AR 应用程序 Museum Video Guide 可以根据用户在博物馆中的位置预测用户的兴趣,从而自动提供与艺术品和古董等相关的内容 [44]。另一个例子是 CTrack 系统,它使用 BS 指纹来跟踪和预测大量用户的轨迹,用于交通监控、导航和路线规划以及个性化行程管理 [45]。
隐私/安全增强:与 MCC 相比,增强移动应用程序隐私和安全性的能力也是 MEC 带来的一个有吸引力的好处。在 MCC 系统中,云计算平台是远程公共大型数据中心,例如 Amazon EC2 和 Microsoft Azure,由于用户信息资源高度集中,容易受到攻击。此外,用户数据的所有权和管理在 MCC 中是分开的,这将导致私人数据泄露和丢失的问题 [46]。使用邻近边缘服务器为规避这些问题提供了一个很有前途的解决方案。一方面,由于分布式部署、小规模性质和有价值信息的集中度较低,MEC 服务器不太可能成为安全攻击的目标。其次,许多 MEC 服务器可以是私有的 cloudlet,这将缓解对信息泄露的担忧。需要在最终用户和服务器之间交换敏感信息的应用程序将从 MEC 中受益。例如,MEC 的企业部署可以帮助避免将受限数据和材料上传到远程数据中心,因为企业管理员自己管理授权、访问控制和分类不同级别的服务请求,而无需外部单元 [47]。
C. 论文动机和大纲
MEC 已成为实现物联网和 5G 愿景的关键使能技术 [15], [48], [49]。MEC 研究位于移动计算和无线通信的交叉点,其中许多研究机会的存在导致了一个高度活跃的领域。近年来,来自学术界和工业界的研究人员研究了与 MEC 相关的广泛问题,包括系统和网络建模、最优控制、多用户资源分配、实施和标准化。随后,已经发表了几篇调查文章,以概述具有不同重点的 MEC 领域,包括系统模型、架构、支持技术、应用、边缘缓存、边缘计算卸载以及与物联网和 5G 的连接 [27]、[28]、[50]–[56]。他们的主题总结如下。[50] 概述了 MEC 平台,其中讨论了不同的现有 MEC 框架、架构及其应用场景,包括 FemtoClouds、REPLISM 和 ME-VOLTE。[51] 的调查侧重于 MEC 中的使能技术,例如云计算、VM、NFV、SDN,这些技术允许灵活的控制和多租户支持。在 [52] 中,作者对不同的 MEC 应用程序、服务模型、部署场景以及网络架构进行了分类。[53] 中的调查提出了 MEC 应用的分类法,并确定了潜在的研发方向,例如内容扩展、本地连接、增强以及数据聚合和分析。在 [28] 中,调查了 MEC 中边缘计算、缓存和通信 (3C) 的新兴技术,显示了 3C 的融合。此外,还讨论了 MEC 的关键推动因素,如云技术、SDN/NFV 和智能设备。[54] 中的调查侧重于 MEC 计算卸载中的三个关键设计问题,即卸载决策、计算资源分配和移动性管理。此外,MEC在物联网中的作用,即创建新的物联网服务,在[ 55 ]中通过参考物联网用例的MEC部署实例被强调。文献[ 27 ]还介绍了MEC在5G网络中的几个有吸引力的使用场景,包括移动边缘编排、协作缓存和处理以及多层干扰消除。此外,文献[ 56 ]从应用开发商、服务提供商和网络设备供应商的角度讨论了与MEC相关的潜在商机。从前期工作来看,目前还缺乏一篇系统的综述性文章,对移动计算与无线通信深度融合的具体MEC研究成果进行全面而具体的讨论,这也是当前工作的动力所在。本文与现有的MEC研究的不同之处在于:首先,本综述总结了MEC中现有的计算和通信模型,以便于理论分析,并为研究人员和实践者提供快速参考。接下来,我们对MEC中的联合无线电和计算资源分配进行了全面的文献综述,这是本文的中心主题。本文的文献综述将是对现有MEC研究文献的一个有价值的补充,可以使研究界的读者更系统地了解MEC系统的资源管理技术。此外,我们从通信的角度识别和讨论了MEC中的几个研究挑战和机会,并阐述了潜在的解决方案。此外,为了弥补MEC理论研究与实际应用之间的差距,还将介绍MEC近期的标准化工作和使用场景。
本文的结构如下。在第二节中,我们总结了 MEC 的基本模型,包括计算任务模型、通信模型、移动设备模型和 MEC 服务器模型,并在此基础上建立了 MEC 延迟和能耗模型。接下来,我们在第三节对不同类型 MEC 系统(包括单用户、多用户系统和多服务器 MEC)的无线电和计算资源联合管理研究进行了全面回顾。随后,第四部分讨论了一系列关键研究问题和未来方向,包括:1)MEC 系统的部署;2)支持缓存的 MEC;3)MEC 的移动性管理;4)绿色 MEC;5)MEC 中的安全和隐私问题。具体而言,我们分析了每个研究问题的设计挑战,并提供了几种潜在的研究方法。最后,第五节回顾并讨论了 MEC 的标准化工作和应用,第六节为结束语。为了便于参考,我们在表 II 中总结了本文中经常使用的缩略语的定义。
II. MEC 计算和通信模型
本节将介绍典型 MEC 系统关键计算/通信组件的系统模型。这些模型提供了将各种功能和操作抽象为优化问题的机制,并为下文讨论的理论分析提供了便利。
在图 3 所示的 MEC 系统中,关键组件包括移动设备(又称终端用户、客户端、服务用户)和 MEC 服务器。MEC 服务器通常是云计算和电信运营商部署在终端用户附近的小型数据中心,可以与无线接入点共用。服务器通过网关与数据中心相连。移动设备和服务器被空中接口隔开,可以利用先进的无线通信和网络技术建立可靠的无线链路。在下面的小节中,我们将介绍 MEC 系统不同组件的模型,包括计算任务模型、无线通信信道和网络模型,以及移动设备和 MEC 服务器的计算延迟和能耗模型。
A. 计算任务模型
在计算任务建模中,有多种参数起着关键作用,包括延迟、带宽利用率、上下文感知、通用性和可扩展性 [22]。虽然开发精确的任务模型非常复杂,但也有一些简单合理、数学上可操作性强的模型。在本小节中,我们将介绍现有 MCC 和 MEC 文献中常用的两种计算任务模型,分别对应二进制计算卸载和部分计算卸载。
1) 二进制卸载的任务模型:
高度集成或相对简单的任务无法分区,必须作为一个整体在本地移动设备上执行,或卸载到 MEC 服务器上(称为二进制卸载)。这样的任务可以用三字段符号 \(A(L,τ_d,X)\)来表示。这种常用的符号包含任务输入数据大小 \(L\)(以比特为单位)、完成期限 \(τ_d\)(以秒为单位)和计算工作量/强度 \(X\)(以每比特 CPU 周期为单位)等信息。这些参数与应用的性质有关,可通过任务剖析器估算 [56], [57]。使用这三个参数不仅能捕捉移动应用的基本特性,如计算和通信需求,还能方便地对执行延迟和能耗性能进行简单评估(将在第 II-C 节中进行分析)。
任务 \(A(L,τ_d,X)\) 要求在硬截止时间 \(τ_d\) 之前完成。该模型也可扩展为处理软截止时间要求,即允许一小部分任务在 \(τ_d\) 之后完成 [58]。在这种情况下,执行 1 位任务输入数据所需的 CPU 周期数被建模为随机变量 X。具体来说,将 \(x_0\) 定义为一个正整数,使得 \(Pr(X>x_0)≤ρ\) 其中 \(ρ\) 是一个小实数:\(0<ρ≪1\)。由此可知,\(Pr(LX>Wρ)≤ρ\),其中 \(Wρ=Lx_0\) 。那么,在给定 \(L\) 位任务输入数据的情况下,\(Wρ\) 几乎肯定会为所需的 CPU 周期数设定上限。
2) 部分卸载的任务模型:
实际上,许多移动应用程序都由多个程序/组件组成(如图 2 所示的 AR 应用程序中的计算组件),因此有可能实现细粒度(部分)计算卸载。具体来说,程序可分为两部分,一部分在移动设备上执行,另一部分卸载到边缘执行。
用于部分卸载的最简单任务模型是数据分区模型,在该模型中,任务输入位是位独立的,可任意分为不同的组,并由 MEC 系统中的不同实体执行,例如,在移动设备和 MEC 服务器上并行执行。
然而,在许多应用程序中,不同程序/组件之间的依赖性不容忽视,因为它对执行程序和计算卸载有重大影响,原因如下:
- 首先,函数或例程的执行顺序不能任意选择,因为某些组件的输出是其他组件的输入。
- 其次,由于软件或硬件的限制,有些功能或例程可以卸载到服务器上远程执行,而有些功能或例程只能在本地执行,如图像显示功能。
这就需要比上述数据分区模型更复杂的任务模型,以捕捉应用程序中不同计算功能和例程之间的相互依赖关系。任务调用图就是这样一种模型。任务调用图通常是有向无环图(DAG),即没有有向循环的有限有向图。我们将其标记为 \(G(V,E)\),其中顶点集 \(V\) 表示应用程序中的不同程序,边集 \(E\) 表示它们的调用依赖关系。如图 4 所示,子任务(即任务组件,如函数或例程)有三种典型的依赖模型,即顺序依赖、并行依赖和一般依赖 [59], [60]。对于移动启动的应用程序,第一步和最后一步,如收集 I/O 数据和在屏幕上显示计算结果,通常需要在本地执行。因此,图 4(a)-4(c) 中的节点 1 和节点 N 都是必须在本地执行的组件。此外,每个程序所需的计算工作量和资源(如所需的 CPU 周期数和内存量)也可在任务调用图的顶点中指定,而每个程序的输入/输出数据量可通过对边施加权重来表征。
B. 通信模式
在 MCC 文献中,移动设备与云服务器之间的通信信道通常被抽象为具有恒定速率或给定分布的随机速率的比特管道。采用这种粗糙的模型是为了提高可操作性,对于设计 MCC 系统来说可能是合理的,因为这些系统的重点是解决核心网络和大规模云管理中的延迟问题,而不是无线通信延迟问题。MEC 系统的情况则不同。考虑到小规模边缘云和对延迟要求严格的应用,通过设计高效的空中接口来减少通信延迟是设计的重点。因此,上述比特管道模型是不够的,因为它们忽略了无线传播的一些基本特性,而且过于简化,无法实施先进的通信技术。具体来说,无线信道与有线信道的区别主要体现在以下几个方面[61]:
- 由于大气导流、环境中散射物体(如建筑物、墙壁和树木)的反射和折射,无线信道中存在众所周知的多路径衰落,使得信道高度时变,并可能造成严重的符号间干扰(ISI)。因此,需要有效的 ISI 抑制技术,如均衡和扩频,以实现可靠的传输。
- 无线传输的广播性质会导致信号受到占用相同频谱的其他信号的干扰,从而降低各自的接收信号与干扰加噪声比(SINR),进而导致检测出错的概率。为应对性能下降,干扰管理成为无线通信系统最重要的设计问题之一,并吸引了大量研究人员的关注 [62]-[64]。
- 频谱短缺一直是超高速无线电接入的主要障碍,促使人们广泛研究如何利用新的频谱资源[65]、[66],设计新颖的收发器架构[67]-[69]和网络范例[70]、[71]以提高频谱效率,以及开发频谱共享和聚合技术以促进有效利用分散和未充分利用的频谱资源[72]-[74]。
无线信道在时间、频率和空间上的随机变化,使得设计高效的 MEC 系统时必须无缝集成计算卸载控制和无线电资源管理。例如,当无线信道处于深度衰落时,远程执行所减少的执行延迟可能不足以弥补传输数据速率急剧下降所导致的传输延迟的增加。在这种情况下,最好推迟卸载,直到信道增益有利时再卸载,或切换到质量更好的频率/空间信道进行卸载。此外,增加传输功率可以提高数据传输速率,但也会导致更大的传输能耗。基于上述考虑,有必要对卸载和无线传输进行联合设计,根据准确的信道状态信息(CSI)对时变信道进行自适应设计。
在 MEC 系统中,通信通常是在接入点和移动设备之间进行,也有可能直接进行 D2D 通信。MEC 服务器是由云计算/电信运营商部署的小型数据中心,可与无线接入点(如公共 WiFi 路由器和 BS)共用,以减少资本支出(CAPEX)(如场地租金)。如图 3 所示,无线接入点不仅为 MEC 服务器提供无线接口,还能通过回程链路访问远程数据中心,从而帮助 MEC 服务器进一步将一些计算任务卸载到其他 MEC 服务器或大型云数据中心。对于因无线接口不足而无法直接与 MEC 服务器通信的移动设备,与邻近设备的 D2D 通信可提供将计算任务转发给 MEC 服务器的机会。此外,D2D 通信还能在移动设备集群内实现资源共享和计算负载平衡方面的点对点合作。
目前,已有不同类型的商业化移动通信技术,包括近场通信(NFC)、射频识别(RFID)、蓝牙、WiFi 和长期演进(LTE)等蜂窝技术。此外,由 LTE 发展而来的 5G 网络将与新的无线接入技术相结合,目前正在标准化过程中,最早将于 2020 年投入商业使用[75]。这些技术可支持从手机到接入点的无线卸载,或不同数据速率和传输范围的点对点移动合作。我们在表 III 中列出了典型无线通信技术的主要特点,它们在工作频率、最大覆盖范围和数据传输速率方面有很大不同。就近距离无线通信而言,覆盖范围和数据传输速率都很低,因此该技术适用于只需少量信息交换的应用,如电子支付和物理访问验证。射频识别(RFID)与近距离无线通信(NFC)类似,但只能进行单向通信。蓝牙是一种更强大的技术,可在 MEC 系统中实现短距离 D2D 通信。对于手机与 MEC 服务器之间的长距离通信,WiFi 和 LTE(或未来的 5G)是接入 MEC 系统的两种主要技术,可根据链路可靠性进行自适应切换。要在 MEC 系统中部署无线技术,就需要重新设计通信和网络协议,以整合计算和通信基础设施,并有效提高比数据传输更复杂的计算效率。
C. 移动设备的计算模型
在本小节中,我们将介绍移动设备的计算模型,并讨论评估计算性能的方法。
移动设备的 CPU 是本地计算的主要引擎。CPU 性能由 CPU 周期频率 \(f_m\)(也称为 CPU 时钟速度)控制。最先进的移动 CPU 架构采用了先进的动态频率和电压缩放(DVFS)技术,可以逐步提高或降低 CPU 周期频率(或电压),从而分别增加或减少能耗。在实际应用中,\(f_m\) 的值受最大值 \(f^{max}_{CPU}\) 的限制,这反映了移动设备计算能力的局限性。根据第 II-A 节中介绍的计算任务模型,可以计算出任务 \(A(L,τ,X)\)的执行延迟为
这表明,为了减少执行延迟,需要较高的 CPU 时钟速度,但代价是较高的 CPU 能耗。
由于移动设备受到能源限制,本地计算的能耗是衡量移动计算效率的另一个关键指标。根据电路理论[76]-[79],CPU 功耗可分为动态功耗、短路功耗和泄漏功耗等几个因素,其中动态功耗占主导地位。特别是,[78] 中表明,动态功耗与 \(V^2_{cir}f_m\) 的乘积成正比,其中 \(V_{cir}\) 是电路供电电压。文献[76]和[79]进一步指出,CPU 芯片在低电压限制下工作时,其时钟频率与供电电压近似成线性比例。因此,CPU 周期的能耗由 \(κf^2_m\) 给出,其中 κ 是与硬件架构相关的常数。对于 CPU 时钟速度为 \(f_m\) 的计算任务 \(A(L,τ,X\)),可以得出其能耗:
从(1)和(2)中可以看出,移动设备可能无法在规定期限内完成计算密集型任务,或者移动执行任务的能耗过高,以至于机载电池很快耗尽。在这种情况下,最好将任务执行过程卸载到移动电子设备服务器上。
除 CPU 外,移动设备中的其他硬件组件,如随机存取存储器 (RAM) 和闪存,也会对计算延迟和能耗产生影响 [80],详细讨论超出了本调查的范围。
D. MEC 服务器的计算模型
在本小节中,我们将介绍 MEC 服务器的计算模型。与移动设备类似,计算延迟和能耗也是我们特别关注的问题。
与 MEC 系统中的通信或本地计算延迟相比,服务器计算延迟可以忽略不计,因为服务器的计算负载远远低于其计算能力[79], [81]。如果服务器的计算负载在延迟和计算能力限制下由多用户资源管理进行调节,那么该模型也适用于服务器资源受限的多用户 MEC 系统[82]。
另一方面,由于边缘服务器的计算资源相对有限,有必要在 MEC 系统的总体设计中考虑不可忽略的服务器执行时间,从而产生本小节余下部分讨论的服务器计算模型。文献中考虑了两种可能的模型,分别对应于确定性和随机性服务器计算延迟。确定性模型是为了考虑对延迟敏感的应用的精确服务器计算延迟而提出的,它是利用虚拟机和 DVFS 等技术实现的。具体来说,假设 MEC 服务器为不同的移动设备分配了不同的虚拟机,允许独立计算 [83]。让 \(f_{s,k}\) 表示为移动设备 \(k\) 分配的服务器 CPU 周期频率。与第 II-C 节类似,用 \(t_{s,k}\) 表示的服务器执行时间可计算为 \(t_{s,k}=w_k/f_{s,k}\) ,其中 \(w_k\) 是处理卸载计算工作量所需的 CPU 周期数。该模型已被广泛用于设计计算资源分配政策[84]-[86]。文献[82]也提出了类似的模型,其中假定 MEC 服务器会对全部卸载的计算工作负载进行负载平衡。换句话说,MEC 服务器上的 CPU 周期会按比例分配给每个移动设备,使它们经历相同的执行延迟。此外,对于计算能力相对较小的 MEC 服务器,除了 CPU 处理时间外,还应考虑服务器调度排队延迟,因为在这种情况下,通过虚拟化技术进行并行计算是不可行的,因此需要按顺序处理计算工作负载。在不失一般性的前提下,将移动设备的处理顺序记为 \(k\),并命名为移动 \(k\)。因此,包括设备 \(k\) 的排队延迟在内的服务器计算总延迟(用 \(T_{s,k}\) 表示)可表示为
对于延迟容忍型应用,平均服务器计算时间可根据随机模型得出。例如,在 [87] 中,任务到达和服务时间分别由泊松过程和指数过程建模。因此,平均服务器计算时间可以利用排队理论中的技术推导出来。最后,对于上述所有模型,正如文献[1]所研究的那样,多个虚拟机共享同一物理机将在不同虚拟机之间引入 I/O 干扰。这将导致每个虚拟机的计算延迟延长,用 \(T′_{s,k}\) 表示,其模型为 \(T′_{s,k}=T_{s,k}(1+ϵ)n\),其中 ϵ 是性能下降因子,表示延迟增加的百分比[88]。
MEC 服务器的能耗由 CPU、存储、内存和网络接口的使用情况共同决定。由于 CPU 在这些因素中占主导地位,因此是文献研究的重点。MEC 服务器的能源消耗广泛使用了两种可行的模型。一种模型基于 DVFS 技术,具体描述如下。考虑一个处理 K 个计算任务的 MEC 服务器,第 k 个任务分配了 w_k 个 CPU 周期,CPU 周期频率为f_{s,k}。因此,MEC 服务器 CPU 消耗的总能量(用 E_s 表示)可以表示为
这与移动设备的情况类似。另一个模型是基于最近的研究[89]-[91]发现的,即服务器能耗与 CPU 利用率成线性关系,而 CPU 利用率取决于计算负载。此外,即使服务器处于闲置状态,其平均能耗仍高达 CPU 全速运行时的 70%。因此,MEC 服务器的能耗可按以下公式计算
其中,\(E_{max}\) 是完全利用服务器的能耗,α 是空闲能耗的一部分(如 70%),u 表示 CPU 利用率。该模型表明,节能型 MEC 应允许服务器在轻负载情况下切换到睡眠模式,并将计算负载整合到更少的活动服务器上。
E. 总结与启示
图 5 总结了 MEC 计算和通信模型,为下一节分析 MEC 资源管理奠定了基础。这些模型为卸载设计提供了一些有用的启示,具体如下。
-
移动多媒体中心的有效设计应充分利用和整合无线通信和移动计算两个领域的先进技术。
-
为不同的 MEC 应用选择合适的计算任务模型至关重要。例如,软截止时间任务模型可用于社交网络应用,但由于对计算延迟的严格要求,不适用于 AR 应用。此外,对于特定应用,任务模型还取决于卸载场景,例如,当输入数据被卸载时,可以使用数据分区模型,而当每个任务组件可以整体卸载时,则应考虑任务调用图。
-
无线信道条件对计算卸载的能耗量有很大影响。由于用户与 MEC 服务器之间的距离很短,MEC 有可能降低传输能耗。先进的无线通信技术,如干扰消除和自适应功率控制,可以进一步降低卸载能耗。
-
动态 CPU 周期频率控制是控制移动设备和 MEC 服务器计算延迟和能耗的关键技术。具体来说,提高 CPU 周期频率可以缩短计算时间,但会增加能耗。有效的 CPU 周期频率控制应在计算延迟和能耗之间取得最佳平衡。
-
除了任务执行延迟外,如果 MEC 服务器的计算能力相对较小,或者重计算负载被卸载到服务器上,计算调度延迟也是不可忽略的。可以设计负载平衡和智能调度策略来减少总计算延迟。
III. 能源和环境管理系统中的资源管理
无线电和计算资源的联合管理在实现高能效和低延迟的 MEC 方面发挥着关键作用。MEC 服务器和无线接入点(如 BS 和 WiFi 路由器)位于同一地点的网络架构有利于相关技术的实施。在本节中,我们将全面概述有关 MEC 系统资源管理的文献,如图 6 所示。我们的讨论从简单的单用户系统开始,包括单个移动设备和单个 MEC 服务器,从而阐述了关键的设计考虑因素和基本的设计方法。随后,我们考虑了更复杂的多用户 MEC 系统,即多个卸载用户竞争使用无线电和服务器计算资源,并进行协调。最后,我们将讨论扩展到具有异构服务器的多用户多媒体中心系统,这种系统不仅可以自由选择服务器,还允许服务器之间的合作。这种网络级的操作可以大大提高 MEC 系统的性能。
A. 单用户MEC平系统
本小节重点讨论简单的单用户 MEC 系统,并回顾了近期针对这种情况的一系列研究工作。讨论按照三种常用任务模型进行,即二元卸载的确定性任务模型、部分卸载的确定性任务模型和随机任务模型。
1) 采用二进制卸载的确定性任务模型:
考虑上述单用户 MEC 系统,其中的二进制卸载决策是关于特定任务应卸载到边缘执行还是本地计算。对最佳卸载策略的研究可以追溯到传统云计算系统,当时通常假定通信链路具有固定速率 B。文献[92]和[93]提出了确定卸载决策的一般准则,目的是最大限度地减少移动能耗和计算延迟。将 \(w\) 表示任务的计算量(CPU 周期),\(f_m\) 表示移动设备的 CPU 速度,\(d\) 表示输入数据大小,\(f_s\) 表示云服务器的 CPU 速度。只有在以下情况下,将计算卸载到云服务器才能改善延迟性能
这适用于需要大量计算和少量数据输入的应用,或云服务器速度快、传输速率足够高的应用。此外,让 \(p_m\) 代表移动设备的 CPU 功耗,\(p_t\) 代表传输功率,π 代表任务在服务器上运行时设备的功耗。在以下情况下,卸载任务有助于节省移动设备的能耗
即计算量大、通信量小的应用应被卸载。
然而,无线通信的数据传输率并不是一成不变的,它会随时间变化的信道增益而变化,并取决于传输功率。这就需要设计功率适应和数据调度的控制策略,以简化卸载过程。此外,由于 CPU 功耗与 CPU 周期频率呈超线性增长,因此可以使用 DVFS 技术将移动执行的计算能耗降至最低。这些问题导致自适应 MEC 领域的活跃,概述如下。
文献[94]提出了在计算期限约束下的传输能耗最小化问题,优化变量为输入数据传输时间,著名的香农-哈特利公式给出了功率速率函数。该优化问题是凸问题,可以封闭形式求解。其中,当信道功率增益大于阈值且服务器 CPU 速度足够快时,任务卸载是可取的,这揭示了无线信道对卸载决策的影响。Zhang 等人[79]进行了进一步的研究,以最小化执行具有软实时性要求的任务时的能耗,该任务针对的是多媒体应用等,要求在给定概率 ρ 的情况下在最后期限内完成任务。卸载决策取决于能耗较低的计算模式(卸载或本地计算)。一方面,使用 DVFS 技术优化本地执行的能耗,该技术被表述为一个凸优化问题,目标函数是 Wρ CPU 周期的预期能耗以及这些 CPU 周期的时间长度约束。通过求解卡鲁什-库恩-塔克(KKT)条件,以闭合形式得出了计算持续时间内的最佳 CPU 周期频率,这表明处理器应随着已完成 CPU 周期数量的增加而加速。
另一方面,通过数据传输调度使任务卸载的预期能耗最小。在吉尔伯特-埃利奥特信道模型下,通过动态编程(DP)技术获得了最佳数据传输调度,并推导出了最小预期能耗相对于执行截止日期的缩放规律。文献[81]进一步发展了这一框架,其中本地计算和卸载均由无线能量传输驱动。具体来说,本地计算的最佳 CPU 周期频率和卸载的时间划分应与传输功率相适应。
2) 带有部分卸载功能的确定性任务模型:
一个相对复杂的移动应用程序的运行可以分解成一系列较小的子任务。受并行计算最新进展的启发,[59]、[60]和[95]-[100]中提出了部分卸载(也称为程序分区)方案,以进一步优化 MEC 性能。
在[95]中,考虑了程序分区的全粒度,即任务输入数据可任意划分为本地执行和远程执行。对卸载率、传输功率和 CPU 周期频率进行了联合优化,以在延迟(或能耗)约束下最大限度地减少移动能耗(或延迟)。与二元卸载相比,能量和延迟最小化问题都是非凸问题。前一个问题可以用变量替换技术优化解决,而后一个问题在 [95] 中提出了一种次优算法。
在[59]、[60]和[96]-[100]中,应用是通过前面讨论的任务调用图来建模的,这些任务调用图指定了不同子任务之间的依赖关系,并设计了代码分区方案,以动态生成用于卸载的最佳任务集。文献[59]利用移动设备和服务器之间的负载平衡概念,开发了一种启发式程序分区算法,以最大限度地减少执行延迟。Kao 等人在[96]中研究了具有规定资源利用率约束的延迟最小化问题,并提出了一种多项式时间近似解决方案,同时保证了性能。为了使计算卸载实现的节能效果最大化,[60] 采用整数编程方法对调度和云卸载决策进行了联合优化。在[97]中,考虑了包括块衰落信道、独立相同分布(i.i.d.)随机信道和马尔可夫随机信道在内的无线信道模型,发现带有完成时间约束的预期能耗最小化问题是一个随机最短路径问题,并证明了一次爬升策略(即执行只从移动设备迁移到服务器一次)是最优的。此外,在优化程序分区方案的同时,还优化了物理层参数,如发射和接收功率、星座大小以及不同无线电接口的数据分配[98]-[100]。
3) 随机任务模型:
还有人针对随机任务模型开发了资源管理策略,随机任务模型的特点是任务随机到达,到达但尚未执行的任务加入任务缓冲区队列[101]-[106]。对于这类系统,长期性能(如长期平均能耗和执行延迟)与确定性任务到达相比更为相关,而且最佳系统操作的时间相关性使设计更具挑战性。因此,与确定性任务模型的简单情况相比,随机任务到达的 MEC 系统设计是一个探索较少的领域。在文献[101]中,为了最大限度地降低移动能耗,同时将违反截止日期要求的执行比例控制在阈值以下,提出了一种动态卸载算法,以基于 Lyapunov 优化技术确定移动用户运行的应用程序中卸载的软件组件,在这种情况下,设备可以访问 3G 和 WiFi 网络,但它们在不同地点的速率各不相同。假设本地和边缘并发执行是可行的,[102] 基于马尔可夫决策过程(MDP)理论设计了延迟最优的任务调度策略,该策略根据信道状态控制本地处理单元和传输单元的状态以及任务缓冲队列长度。结果表明,最优任务调度策略明显优于贪婪调度策略(即只要任务空闲,就将其调度到本地 CPU/传输单元)。为了联合优化计算延迟和能耗,文献[100]和[104]考虑了最小化长期平均执行成本的问题,前者仅基于 MDP 理论优化了卸载数据大小,而后者则在半 MDP 框架下联合控制了本地 CPU 频率、调制方案以及数据速率。文献[105]研究了具有异构应用类型的 MEC 系统中的能量-延迟权衡问题,包括不可卸载工作负载、云可卸载工作负载和网络流量。该研究提出了一种基于 Lyapunov 优化的算法,用于共同决定卸载策略、任务分配、CPU 时钟速度和所选网络接口。研究还表明,能耗与 V 成反比减少,而延迟与 V 成线性增加,其中 V 是所提算法中的一个控制参数。文献[106]对使用多核移动设备的 MEC 系统进行了类似研究。
4) 总结与启示:
单用户 MEC 系统的资源管理方案比较见表 IV。这一系列工作为控制计算卸载提供了许多有益的启示,总结如下。
-
考虑二进制卸载。为了节省能量,当用户有理想的信道条件或本地计算能力较小时,计算卸载比本地计算更可取。此外,还可以利用波束成形和多输入多输出技术来减少卸载的能耗。在减少延迟方面,当用户拥有较大带宽,而 MEC 服务器具备巨大计算能力时,计算卸载比本地计算更有优势。
-
部分卸载允许灵活的组件/数据分区。通过将耗时或耗能的子任务卸载到 MEC 服务器,与二进制卸载相比,部分卸载可实现更大的节能和更小的计算延迟。图论是根据任务依赖图设计卸载调度的有力工具。
-
对于随机任务模型,可以利用任务到达和通道的时间相关性来设计自适应动态计算卸载策略。此外,通过卸载速率控制保持用户和 MEC 服务器的任务缓冲区稳定性至关重要。
B. 多用户 MEC 系统
上一小节针对的是具有专用 MEC 服务器的单用户 MEC 系统的资源管理政策,而本小节考虑的是由共享一个边缘服务器的多个移动设备组成的多用户 MEC 系统。下文将研究几个新的挑战,包括多用户联合无线电和计算资源分配、MEC 服务器调度和多用户合作边缘计算。
1) 无线电和计算资源联合分配:
与中央云相比,MEC 服务器的计算资源要少得多。因此,设计多用户 MEC 系统的一个关键问题是如何将有限的无线电和计算资源分配给多个移动设备,以实现系统级目标,如最小的移动能耗总和。下文回顾了针对不同多用户移动电子通信系统的集中式和分布式资源分配方案。
对于集中式资源分配 [82]、[84]、[99]、[107]-[112],MEC 服务器获取所有移动信息,包括 CSI 和计算请求,做出资源分配决策,并将决策通知移动设备。在[82]中,移动用户分时共享单个边缘服务器,并具有不同的计算工作量和本地计算能力。为了最小化移动能耗总和,提出了一个凸优化问题。主要发现是,控制卸载数据大小和时间分配的最优策略具有简单的基于阈值的结构。具体来说,首先根据移动用户的信道条件和本地计算能耗推导出卸载优先级函数。然后,优先级高于和低于给定阈值的用户将分别执行完全卸载和最小卸载(以满足给定的计算截止时间)。这一结果还被扩展到基于 OFDMA 的 MEC 系统,用于设计接近最优的计算卸载策略。在文献[84]中,MEC 服务器不是控制卸载数据的大小和时间,而是确定移动传输功率,并为不同用户分配服务器 CPU 周期,以减少移动能耗总和。最优解表明,在每个移动设备的传输功率和分配的 CPU 周期数之间存在一个一一对应的最优映射。这项工作在 [99] 中得到了进一步扩展,在任务调用图模型的基础上考虑了最优二进制卸载。Ren 等人[110]考虑了 MEC 中的多用户视频压缩卸载,并最小化了本地压缩、边缘云压缩和部分压缩卸载情况下的延迟。此外,为了使每个用户都有多个任务的多用户 MEC 系统的能量和延迟成本最小化,Chen 等人[111]通过可分离半无限松弛方法联合优化了卸载决策和通信资源分配,后来[112]将计算资源分配和处理成本考虑在内,对该方法进行了扩展。与文献[82]、[84]、[99]、[110]-[112]不同,文献[107]在所有移动设备的服务质量(QoS)要求约束下,最大化了服务提供商的收入。假设每个用户的资源使用量是固定的,这就产生了一个半 MDP 问题,该问题被转化为线性规划(LP)模型并得到有效解决。文献[108]假定了随机任务到达模型,通过基于 Lyapunov 优化的在线算法研究了多用户 MEC 系统中的能量-延迟权衡问题,该算法可联合管理可用的无线电和计算资源。文献[109]还研究了基于云无线接入网(C-RAN)的多用户 MEC 系统的集中资源管理。
另一个研究方向是利用博弈论和分解技术设计多用户 MEC 系统的分布式资源分配[85], [86], [113]-[117] 。在 [85] 和 [113] 中,计算任务分别被假定为本地执行或通过单干扰信道和多干扰信道完全卸载。在移动发射功率固定的情况下,提出了一个整数优化问题,以最小化总能耗和卸载延迟,该问题被证明是 NP 难题。研究人员没有设计集中式解决方案,而是应用博弈论技术开发了一种能够实现纳什均衡的分布式算法。此外,研究还表明,对每个用户而言,只有当接收到的干扰功率低于阈值时,卸载才是有益的。此外,这项工作在 [114] 和 [115] 中得到了扩展,其中每个移动设备都有多个任务,并可分别将计算卸载到由共同边缘服务器连接的多个接入点。在卸载过程中,除了传输能量,这项工作还考虑了接入点的扫描能量和固定电路功率。所提出的分布式卸载策略表明,只有当选择同一接入点的新用户获得更大收益时,移动设备才应将计算转移到不同的接入点。基于 [85] 中的系统模型,[86] 研究了移动传输功率和边缘服务器 CPU 周期分配的联合优化。为解决所提出的混合整数问题,利用分解技术依次优化了资源分配和卸载决策。具体来说,卸载决策问题被简化为子模块最大化问题,并通过设计启发式贪婪算法来解决。文献[116]和[117]分别利用类似的分解技术和连续凸近似技术设计了 MEC 系统的分布式资源分配算法。
2) MEC 服务器调度:
前面讨论的工作[82]、[84]-[86]、[107]、[115]都是基于用户同步和并行本地及边缘计算可行性的假设。然而,研究实用的 MEC 服务器调度需要放宽这些假设,下面将讨论这些假设及其设计结果。首先,不同用户的到达时间一般是异步的,因此计算资源有限的边缘服务器最好按顺序缓冲和计算任务,这样就会产生排队延迟。在文献[118]中,为了应对突发任务到达,服务器调度与上行-下行传输调度相结合,利用排队理论使平均延迟最小化。其次,即使任务同步到达,运行不同类型应用(从延迟敏感型应用到延迟耐受型应用)的用户对延迟的要求也会有很大不同。因此,服务器调度需要根据用户的延迟要求为其分配不同的优先级。在[119]中,预资源分配后,MEC 服务器会在服务器计算过程中检查不同任务的截止时间,并自适应地调整任务执行顺序,以满足异构延迟要求。最后,一些计算任务由多个依赖的子任务组成,因此这些模块的调度必须满足任务依赖性要求。文献[120]考虑了具有顺序子任务安排的任务模型,该模型联合优化了多个用户的程序分区和服务器计算调度,以最小化平均完成时间。因此,提出了一种启发式算法来解决所提出的混合整数问题。具体来说,它首先优化每个用户的计算分区。在这些分区下,它将搜索违反资源约束的时间间隔并进行相应调整。此外,[116] 还考虑了图 4(c) 所示的多用户一般依赖任务模型。这种模式大大增加了计算时间特征描述的复杂性。为解决这一难题,我们为每个子任务定义了就绪时间的衡量标准,即计算完所有前置任务的最早时间。然后,联合优化卸载决策、移动 CPU 周期频率和移动传输功率,从而利用所提出的分布式算法降低移动能耗和计算延迟总和。
3) 多用户合作边缘计算:
多用户协同计算被认为是一种很有前途的技术,它通过提供两个优势来提高移动多媒体中心的性能[121]-[127]。首先,计算资源有限的 MEC 服务器在为大量卸载移动用户提供服务时可能会超负荷。在这种情况下,可以通过点对点移动协同计算来减轻服务器的负担。其次,用户之间共享计算资源可以平衡用户计算工作量和计算能力的不均衡分布。文献[121]提出了实现多用户协同计算的 D2D 通信。这项工作特别研究了如何检测和利用其他用户的计算资源。文献[122]采用了这一想法,提出了基于 D2D 的异构 MCC 网络。研究表明,这种新颖的框架能提高网络容量和卸载概率。此外,针对无线传感器网络,文献[123]提出了合作计算,以增强其计算能力。首先,研究了使两个合作节点总能耗最小的最佳计算分区。然后利用这一结果设计了公平感知的高能效合作节点选择。此外,Song 等人[124]的研究表明,在多用户 MEC 系统中,对等用户之间共享计算结果可以显著减少通信流量。假设任务可以被卸载或在本地计算,他们提出了一个混合整数优化问题,以在系统通信流量的约束下最小化总能耗。为了解决这个具有挑战性的问题,分别基于定价理论和李亚普诺夫优化理论提出了两种在线任务调度算法。此外,文献[125]还提出了一种采用辅助器的四槽联合计算与通信合作协议,辅助器不仅能计算用户卸载的部分任务,还能作为中继节点将任务转发给 MEC 服务器。另一项最新研究[126]探讨了点对点合作计算系统中的最优卸载策略,在该系统中,计算助手拥有随时间变化的计算资源。具体来说,研究人员根据助手的 CPU 配置文件和缓冲区大小构建了一个卸载可行性隧道。给定隧道后,众所周知的 "拉绳子 "策略(图解为拉一根绳子穿过隧道)就能实现最佳卸载。最后,Chen 等人在论文[127]中提出了一种基于 Lyapunov 优化和博弈论方法的在线对等卸载框架,它能使小型 BS 合作处理网络中空间不均衡的计算工作量。
4) 总结与启示:
表 V 对多用户移动多媒体中心系统的资源管理方案进行了比较。我们就资源分配、多用户移动多媒体中心服务器调度和移动协同计算得出以下结论。
-
考虑具有有限无线电和计算资源的多用户 MEC 系统。对于系统级目标,例如最大限度地减少移动能耗总和,信道增益大、本地计算能耗低的用户在卸载计算时具有更高的优先级,因为它们能节省更多的能耗。然而,过多的卸载用户会造成严重的用户间通信和计算干扰,进而降低系统收益。
-
为了有效减少多个用户的计算延迟总和,MEC 服务器的调度设计应为延迟要求更严格、计算负荷更重的用户分配更高的优先级。此外,并行计算可以进一步提高服务器的计算速度。
-
回收大量分布式计算资源不仅能缓解网络拥塞,还能提高资源利用率,实现无处不在的计算。点对点移动合作边缘计算可以实现这一愿景。其主要优势包括通过 D2D 技术进行短距离传输,以及计算资源和结果共享。
C. 配备异构服务器的 MEC 系统
为了实现无处不在的边缘计算,文献[128]提出了由一个中心云和多个边缘服务器组成的异构 MEC(Het-MEC)系统。多级中央/边缘云的协调和交互引入了许多新的研究挑战,最近吸引了大量关于服务器选择、合作和计算迁移的相关研究,下文将对此进行讨论。
1) 服务器选择:
对于由 Het-MEC 系统提供服务的用户,一个关键的设计问题是确定计算卸载的目的地,即边缘服务器还是中央云服务器。文献 [129] 研究了由单个边缘服务器和单个中心云组成的多用户系统的服务器选择问题。为了最大限度地提高总的成功卸载概率,提出了一种启发式调度算法,既能利用 MEC 服务器邻近带来的低通信延迟,又能利用中央云服务器丰富的计算资源带来的低计算延迟。具体来说,当 MEC 服务器的计算负载超过给定阈值时,延迟容忍任务会被卸载到中央云,从而在边缘服务器上腾出足够的计算资源来处理延迟敏感任务。此外,[130] 还探讨了在多个 MEC 服务器上选择服务器的问题。主要挑战来自于卸载的计算量与为多个用户选择的边缘服务器之间的相关性。 为了解决这个问题,有人提出并解决了一个拥塞博弈问题,以最小化移动用户和边缘服务器的能耗总和。最近,[131] 提出了一种计算卸载框架,允许移动设备将任务卸载到多个 MEC 服务器上,并提出了基于半无限松弛的算法来确定任务分配决策和 CPU 频率缩放。
2) 服务器合作:
通过服务器合作实现资源共享,不仅能提高资源利用率,增加计算服务提供商的收入,还能为移动用户提供更多资源,提升用户体验。该框架最初是在文献[132]中提出的,包括资源分配、收益管理和服务提供商合作等部分。首先,在用户信息具有确定性和随机性的情况下优化资源分配,以实现总收入最大化。其次,考虑到自利的云服务提供商,提出了一种基于博弈论的分布式算法,以实现服务提供商自身利润的最大化,结果表明该算法实现了纳什均衡。该研究在 [133] 中得到了进一步扩展,考虑了本地和远程资源共享。前者指同一数据中心内不同服务提供商之间的资源共享,后者指不同数据中心之间的合作。为实现不同服务器之间的资源共享与合作,提出了一种联盟博弈,并通过博弈论算法求解,该算法具有稳定性和收敛性保证。此外,最近的研究[134]提出了一种新的服务器合作方案,边缘服务器通过主动缓存计算结果来利用计算和存储资源,从而最大限度地减少计算延迟。相应的任务分配问题被表述为匹配博弈,并通过基于延迟接受算法的高效算法加以解决。
3) 计算迁移:
在[135]-[137]中,除了优化卸载决策,作者还研究了不同远程服务器之间的计算迁移。具体来说,MEC 服务器上的计算迁移是由卸载用户的移动性引起的。当用户移动到新的 MEC 服务器附近时,网络控制器可以选择将计算迁移到该服务器,或者在原服务器上计算任务,然后通过新服务器将结果转发回用户。计算迁移问题在 [135] 中被表述为一个基于随机行走移动模型的 MDP 问题。研究表明,最优策略具有基于阈值的结构,即只有当两台服务器的距离以两个给定阈值为界时,才应选择迁移。这项工作在 [136] 中得到了进一步扩展,边缘服务器的工作负载调度与服务迁移相结合,利用 Lyapunov 优化技术使平均总体传输和重新配置成本最小化。另一个计算迁移框架是在 [137] 中提出的,MEC 服务器可以在本地处理卸载的计算任务,也可以将其迁移到中央云服务器。提出了一个优化问题,以最小化移动能耗和计算延迟之和。该算法首先通过半无限松弛和随机化技术确定每个用户的卸载决策,然后对所有用户进行资源分配优化。
4) 总结与启示:
表 VI 提供了异构服务器 MEC 系统的资源管理方案摘要。文献提供了一系列关于服务器选择、合作和计算迁移的见解,具体如下。
-
考虑具有多个计算任务和异构服务器的 MEC 系统。为了减少计算延迟总和,最好将对延迟不敏感但计算密集的任务卸载到远程中央云服务器,将对延迟敏感的任务卸载到边缘服务器。
-
服务器合作可以大大提高 MEC 服务器的计算效率和资源利用率。更重要的是,它可以平衡网络上的计算负载分布,从而在更好地利用资源的同时减少计算延迟总和。此外,服务器合作设计应考虑计算任务到达的时空性和服务器的计算能力、时变信道和服务器的个人收益。
-
计算迁移是 MEC 移动性管理的有效方法。是否迁移取决于迁移开销、用户与服务器之间的距离、信道条件和服务器的计算能力。具体来说,当用户远离原来的 MEC 服务器时,最好将计算迁移到附近的服务器上。
D. 挑战
在前面的小节中,我们对 MEC 系统最先进的资源管理技术进行了全面调查。然而,目前的进展仍处于起步阶段,许多关键因素因过于简单而被忽视,需要在今后的研究工作中加以解决。在下文中,我们将指出 MEC 中资源管理仍有待解决的三个关键研究挑战。
1) 双时标 Two-Timescale 资源管理:
在大多数现有研究中,例如 [85]、[86]、[94]、[117]、[119] 和 [138],为了简单起见,假定无线信道在整个任务执行过程中保持静态。然而,当信道相干时间远远短于延迟要求时,这种假设可能就不合理了。例如,在载波频率为 2GHz 时,当速度为 100km/h 时,信道相干时间可短至 2.5ms。对于一些移动应用,如 MMORPG 游戏《PlaneShift》4,可接受的响应时间为 440 毫秒,而最佳延迟为 120 毫秒[139]。在这种情况下,任务卸载过程可能会跨越多个信道块,因此需要对 MEC 进行双时标资源管理。即使对于任务到达具有确定性的单用户 MEC 系统来说,这个问题也非常具有挑战性 [79]。
2) 在线任务分配:
为了便于优化,现有文献在处理任务分配问题时忽略了无线信道的波动,在执行过程开始前就获得任务分配决策。在这种离线任务分配决策下,信道条件的变化可能会导致低效甚至不可行的卸载,从而严重降低计算性能。要开发在线任务分配策略,应将信道统计数据纳入所制定的任务分配问题中,而即使在静态信道条件下,该问题也很容易属于 NP 难问题。在 [97] 和 [140] 中,分别针对具有串行和树状拓扑任务调用图的应用推导出了近似在线任务分区算法,而针对一般任务模型的解决方案仍未得到开发。
3) 大规模优化:
多台移动多媒体中心服务器的协作允许对其资源进行联合管理,以便同时为大量移动设备提供服务。然而,随着网络规模的扩大,资源管理成为一个涉及大量卸载决策以及无线电和计算资源分配变量的大规模优化问题。将传统的集中式无线电和计算资源联合管理算法应用于大规模 MEC 系统时,需要大量的信息和计算,这将不可避免地导致严重的执行延迟,并可能削弱 MEC 范例带来的潜在性能改进(如延迟减少)。为了实现高效的资源管理,需要设计信令和计算开销较小的分布式低复杂度大规模优化算法。虽然最近在大规模凸优化[141]方面取得的进展为无线电资源管理提供了强大的工具,但由于其组合性和非凸性,无法直接应用于计算卸载决策的优化,这就需要新的算法技术。
IV. 问题、挑战和未来研究方向
如上文所述,近年来,有关多能效应中心资源管理的研究取得了长足的进步。然而,MEC 的许多新兴研究方向在很大程度上仍处于未知状态。如图 7 所示,本节将确定并讨论技术问题、挑战和研究机会,包括大规模 MEC 系统部署、支持缓存的 MEC、移动性管理、绿色 MEC 以及 MEC 中的安全和隐私问题。
A. MEC 系统的部署
MEC 的主要动机是将云计算功能转移到网络边缘,以减少核心网络拥塞和传播延迟造成的延迟。然而,目前还没有关于 MEC 服务器的正式定义,也没有规定系统中的服务器位置。这就产生了 MEC 服务器的选址问题,它与传统的 BS 选址问题有很大不同,因为边缘服务器的最佳位置与计算资源的供应是耦合在一起的,而且两者都受到部署预算的限制。此外,MEC 系统的效率在很大程度上取决于其架构,该架构应考虑工作负载强度和通信速率统计等多方面因素。此外,MEC 供应商还必须确定满足服务需求所需的服务器密度,这与基础设施部署成本和营销策略密切相关。然而,MEC 系统的大规模特性使得传统的模拟方法无法适用,因此基于网络规模分析的解决方案成为首选。在本小节中,我们将讨论与 MEC 部署相关的三个研究问题,包括 MEC 服务器的选址、MEC 网络架构和服务器密度规划。
1) 为多能环境中心服务器选址:
为 MEC 基础设施(尤其是 MEC 服务器)选址是建立 MEC 系统的第一步。为了选择具有成本效益的服务器站点,系统规划者和管理员应考虑两个重要因素:站点租金和计算需求。一般来说,在系统部署预算允许的情况下,应在计算需求较高的区域(如商业区、商务区和人口稠密区)安装更多的多用途多媒体中心服务器。然而,这与成本要求相矛盾,因为这些地区的场地租金可能很高。幸运的是,由于电信网络部署完善,在现有基础设施(如宏基站)的同一地点安装 MEC 服务器是一个很有前景的想法,这对希望参与 MEC 市场的电信运营商来说更具吸引力。
然而,这并不能解决所有问题。一方面,由于对计算质量的要求不断提高以及智能设备无处不在,宏蜂窝中的信号质量差和拥塞无法保证令人满意的用户体验。对于某些应用,如智能家居 [142],最好能将计算能力更靠近终端用户。这可以通过在小蜂窝基站注入一些计算资源来实现 [70],[71],小蜂窝基站成本低、体积小。尽管有潜在的好处,但前进的道路上仍有障碍:
-
首先,由于物理限制,这类 MEC 服务器的计算能力远小于宏基站,因此处理计算密集型任务具有挑战性。一个可行的解决方案是为 MEC 系统建立一个分层网络架构,由具有异构通信和计算能力的 MEC 服务器组成,详见下文。
-
其次,一些小蜂窝 BS 可能由家庭用户自行部署,许多微微蜂窝 BS 所有者可能没有与 MEC 供应商合作的动力。为解决这一问题,MEC 厂商需要设计适当的激励机制,以刺激小蜂窝 BS 所有者租用站点。
-
此外,在小蜂窝 BS 上部署 MEC 服务器可能会产生安全问题,因为这些服务器易于接近,容易受到外部攻击,从而降低可靠性水平。
另一方面,计算热点并不总是与通信热点重合。换句话说,有些计算热点没有可用的通信基础设施(宏蜂窝或小蜂窝基站)。在这种情况下,我们需要通过适当选择新地点来部署带有无线收发器的边缘服务器。
此外,MEC 服务器的选址取决于计算资源的分配策略,这与传统的 BS 选址相比带来了额外的挑战。直观地说,将计算资源集中在少数 MEC 服务器上有助于节省站点租金。然而,这样做的代价是可能会降低服务覆盖范围和通信质量。此外,最佳计算资源分配应同时考虑站点租金和计算需求。例如,对于位于高场地租金场地的 MEC 服务器来说,为了获得高收益,最好分配大量计算资源,从而为大量用户提供服务。因此,在部署 MEC 系统之前,需要解决站点选择和计算资源供应的联合问题。
2) MEC 网络架构:
MEC 的推广并不意味着数据中心网络 (DCN) 的消亡。相反,未来的移动计算网络设想由三层组成,如图 8 所示,即云、边缘(又称雾层)和服务用户层 [128], [143]。虽然云层已经成熟且部署良好,但在设计边缘层时仍存在一定的灵活性和不确定性。
通过类比蜂窝系统中的异构网络(HetNets),我们可以直观地设计出由多个层级组成的 Het-MEC 系统。具体来说,不同层级的 MEC 服务器具有不同的计算和通信能力。这种分层的 MEC 系统结构不仅能保留 HetNets 提供的高效传输优势,还能通过将计算工作量分配到不同层级来处理峰值计算工作量,从而具备强大的处理能力 [144]。然而,计算能力调配问题极具挑战性,至今仍未解决,因为它需要考虑许多不同的因素,如工作负载强度、不同层之间的通信成本、工作负载分配策略等。
研究工作的另一个重点是挖掘服务用户层的潜力,利用未专用的计算资源,如笔记本电脑、智能手机和车辆,并与专用边缘节点相叠加。文献[145]-[148]将这种模式称为 "Ad-hoc 移动云"。ad-hoc 移动云具有摊销 MEC 系统压力、提高计算资源利用率和降低部署成本等优点。然而,由于其临时性和自组织性,它也给资源管理和安全问题带来了困难。
如第 IV-A2 节所述,MEC 基础设施可能由不同类型的边缘服务器组合而成,它们提供不同级别的计算体验,并产生不同的部署成本。因此,在给定部署预算和计算需求统计数据的情况下,确定边缘节点的数量以及不同类型 MEC 服务器的最佳组合至关重要。传统上,这个问题只能通过数值模拟来解决,既耗时又缺乏可扩展性。幸运的是,由于近年来随机几何理论的发展及其在无线网络性能分析中的成功应用[149]-[152],以及 Het-MEC 系统与 HetNets 之间的相似性,利用随机几何理论的技术对 MEC 系统进行性能分析是可行的。对 MEC 系统的这种分析应解决以下难题:1) 计算的时间尺度和无线信道的相干时间可能不同[79], [102],这使得现有的无线网络结果无法轻易应用于 MEC 系统。一种可能的解决方案是结合马尔可夫链和随机几何理论来捕捉计算的稳定行为。2) 计算卸载策略会影响无线电资源管理策略,这一点应加以考虑。3) 计算需求通常是非均匀分布和群集的(见图 9),因此边缘服务器和服务用户无法使用均质泊松点过程(HPPP)模型。因此,需要研究更先进的点过程,如 Ginibre α-决定性点过程(DPP),以捕捉边缘节点的聚类行为[153]。
B. 支持缓存的 MEC
据思科预测,到 2019 年,移动视频流将占据整个移动数据流量的 72% [154]。这类服务的一个独特特性是内容请求高度集中,一些热门内容会被异步重复请求。在这一事实的推动下,无线内容缓存或 FemtoCaching 在文献 [155] - [158] 中被提出,通过在 BS 上缓存相同的内容来避免频繁复制。由于该技术在减少内容获取延迟以及减轻网络回程的沉重开销负担方面具有显著优势,因此引起了学术界和产业界的广泛关注。缓存是将热门内容转移到终端用户附近,而 MEC 则是部署边缘服务器,为边缘用户处理计算密集型任务,以提高用户体验。需要注意的是,这两种技术似乎针对不同的研究方向,即一种用于流行内容的传输,另一种用于单个计算的卸载。不过,它们将在本小节中无缝整合,并设想创建一个新的研究领域,即支持缓存的 MEC。
请看图 10 所示的新型高速缓存 MEC 系统。在这种系统中,MEC 服务器可以缓存多个应用服务及其相关数据库,分别称为服务缓存(或服务放置 [159])和数据缓存,并处理来自多个用户的卸载计算。要有效减少计算延迟,需要解决几个关键而有趣的问题,下文将介绍这些问题及潜在的解决方案。
1) 用于 MEC 资源分配的服务缓存:
不同于中央云服务器总是假定拥有巨大而多样的资源(如计算、内存和存储),当前的边缘服务器拥有的资源要少得多,因此无法满足所有用户的计算请求。另一方面,不同的移动服务需要不同的资源,因此可将其分为对 CPU 要求高的应用(如云象棋和 VR)、对内存要求高的应用(如在线 MATLAB)和对存储要求高的应用(如 VR)。资源与需求之间的这种不匹配给如何为服务缓存分配异构资源带来了关键挑战。
传统云计算系统[160]-[163]和 MCC 系统[159]也曾研究过类似问题。具体而言,Tordsson 等人[160]提出了一种新颖的虚拟机管理架构,并在硬件配置、虚拟机数量和负载平衡等限制条件下,优化了多个云上的虚拟机放置,以降低部署成本并改善用户体验。文献[161]和[162]也研究了类似的虚拟机放置问题,以最大限度地节约云服务器的能源,文献[163]还研究了不同的云调度策略。最近,Yang 等人[159] 将虚拟机放置思想扩展到了 MCC 系统,研究了多个云上的服务缓存/放置和终端用户请求的负载调度的联合优化问题。结果,他们提出了一种高效算法,可最大限度地减少计算延迟和服务放置转换成本。然而,这些工作并不能直接应用于为 MEC 系统设计高效的服务缓存策略,因为它应考虑到更精细的信息,包括用户的位置、偏好、经验以及边缘服务器在内存、存储和虚拟机实例方面的能力。为此,下文介绍了两种可能的方法。
第一种是空间流行度驱动的服务缓存,指的是根据不同 MEC 服务器的具体位置和周围用户的共同兴趣,在不同的 MEC 服务器中缓存不同的服务组合和数量。这一想法的动机是,一个小区域内的用户很可能会请求类似的计算服务。例如,博物馆的参观者倾向于使用 AR 来获得更好的感官体验。因此,最好在该地区的 MEC 服务器上缓存多个 AR 服务,以提供实时服务。为了实现最佳的空间服务缓存,必须构建一个空间应用流行度分布模型,以描述每个应用在不同地点的流行度。在此基础上,我们可以利用各种优化算法(如博弈论和凸优化技术)设计资源分配策略。
另一种方法是时间流行度驱动的服务缓存。其主要思想与空间方法类似,但它利用了时域中的流行度信息,因为计算请求也取决于时间段。举例来说,用户在晚饭后喜欢玩移动云游戏。这类信息将建议 MEC 运营商在这一典型时段缓存多个游戏服务,以处理巨大的计算负载。这种基于时间的方法的一个缺点是,由于流行度信息是随时间变化的,而 MEC 服务器的资源有限,因此频繁的缓存和删除操作会增加服务器成本。
2) 面向移动多媒体数据分析的数据缓存:
许多现代移动应用都涉及基于数据分析的密集计算,例如排名和分类。以 VR 为例。它通过生成逼真的图像、声音和其他感觉来创建一个与真实世界类似的想象环境,从而增强用户的体验。要达到这一目的并非易事,因为它要求 MEC 服务器在超短时间(如 1 毫秒)内完成多个复杂的过程,如通过模式识别识别用户的操作,通过数据挖掘 "理解 "用户的请求,以及通过视频流或其他感觉技术渲染虚拟场景[164]。上述所有基于数据分析的技术都需要综合数据库的支持,但这对边缘服务器的存储造成了极其沉重的负担。只保留常用数据库的智能数据缓存可以缓解这一难题。从另一个角度看,缓存可能被他人重复使用的部分计算结果数据可以进一步提高整个 MEC 系统的计算性能。一个典型的例子是移动云游戏,它通过将游戏计算引擎从移动设备转移到边缘服务器,并通过游戏视频流支持实时游戏,实现了快速、节能的游戏。因此,它成为下一代移动计算基础设施的领先技术[139]。由于某些游戏渲染的视频(如游戏场景)可被其他玩家重复使用,缓存这些计算结果不仅能显著减少具有相同计算请求的玩家的计算延迟,还能减轻边缘服务器的计算负担。研究 MEC 中协同多比特率视频缓存和处理的文献 [165] 也提出了类似的想法。
对于单个边缘服务器的 MEC 数据缓存而言,一个关键问题是如何在海量数据库和有限存储容量之间取得平衡。FemtoCaching 网络的内容(数据)缓存主要引入了一种新的多重访问机制,称为 "缓存支持的访问"[166],与此不同,MEC 系统中的数据缓存会对计算精度、延迟和边缘服务器能耗产生多方面影响,但现有文献尚未对这些影响进行描述。这就需要开展建模研究工作,以准确量化各种 MEC 应用中的上述影响。此外,建立一个实用的数据库流行度分布模型也很重要,该模型能够统计出不同 MEC 应用中每个数据库集的使用情况。在上述模型的基础上,可以通过解决优化问题来实现上述权衡,即在 MEC 系统中同时实现可达到的服务质量最大化和存储成本最小化。
上述框架可进一步扩展到具有多个服务器的 MEC 系统,其中每个服务器可为多个用户提供服务,每个用户可将计算卸载到多个边缘服务器。基本问题类似于启用缓存的 HetNets [167],即如何在存储和计算负荷限制下将数据库空间分布到异构边缘服务器上,以增加全网收入。直观地说,对于每个 MEC 服务器来说,最好能腾出更多的存储空间来缓存其单元中最受欢迎的应用的数据库,同时还需要利用部分存储空间来容纳不那么受欢迎的应用,这些应用的计算性能将通过在不同 MEC 服务器中的合作缓存得到进一步提高。此外,通过将附近的用户建模为群集,可以使用随机几何方法分析大规模缓存 MEC 网络的性能 [168]。
……
VI . 结论
MEC 是一种创新的网络范式,可满足空前增长的计算需求和不断提高的计算质量和用户体验要求。它旨在通过将丰富的计算和存储资源推向网络边缘,使云计算功能和 IT 服务更接近终端用户。移动设备与边缘服务器之间通过无线通信直接互动,可以支持超低延迟要求的应用,延长设备电池寿命,促进高效网络运行。然而,由于复杂的无线环境和 MEC 服务器固有的有限计算能力等原因,它们伴随着各种新的设计考虑因素和独特的挑战。
在这份调查报告中,我们从通信的角度全面概述了 MEC 并展望了其研究前景。为此,我们首先总结了 MEC 系统关键组件的建模方法,如计算任务、通信以及移动设备和 MEC 服务器的计算。这有助于描述 MEC 系统的延迟和能耗性能。在系统建模的基础上,我们对各种系统架构下 MEC 资源管理的最新研究成果进行了全面的文献综述,这些研究成果利用了计算卸载、无线电与计算资源联合分配、MEC 服务器调度以及多服务器选择与合作等概念。随后确定了一些潜在的研究方向,包括移动多媒体中心的部署问题、支持缓存的移动多媒体中心、移动多媒体中心的移动性管理、绿色移动多媒体中心以及移动多媒体中心的安全和隐私问题。我们详细阐述了每个方向的关键研究问题和初步解决方案。最后,我们介绍了业界近期的标准化工作以及几种典型的使用场景。希望本调查报告提供的有关 MEC 的全面概述和研究展望能为进一步深入研究 MEC 提供有用的参考和宝贵的指导。

浙公网安备 33010602011771号