从零学 mRNA 疫苗 | 全流程核心知识点总结(序列优化、LNP优化、作用机制)

最近正式踏入全新赛道,此前一直做科研服务工作,如今加入mRNA疫苗企业,一切都要从零开始系统学习。我始终相信,最好的学习方式就是持续输出,因此后续会在公众号定期更新mRNA疫苗相关的技术干货与学习笔记。
唠一句实在嗑,尽管mRNA算得上当下生物专业里最前沿、最热门、最具前景的方向,可实际收入却依旧低于深圳市平均工资,也让我越发觉得:选对行业、选对专业,真的太重要了。同样的能力与付出,在生物行业能拿到10万,换到其他行业往往20万都不止;即便生物行业里极少数顶尖技术大佬能做到30万,放在其他行业,收益早已突破百万。
后续依旧会一边学习一边分享,也和大家一起聊聊生物行业的真实现状与技术干货。交流合作可以私信加我微信。

mRNA结构组成及功能

结构区域 核心组成 主要功能
5’ 帽子结构(5’ Cap, m⁷GpppG) 7-甲基鸟苷帽 + Cap1 修饰 保护 mRNA 不被降解;提高翻译效率;帮助核输出/细胞内稳定
5非翻译区(5’UTR) 起始密码子上游序列 调控翻译起始;避免二级结构抑制翻译
编码区(CDS/ORF) 密码子串联序列 编码肿瘤抗原蛋白;决定疫苗表达的目标抗原
3’ 非翻译区(3’UTR) 终止密码子下游序列 增强 mRNA 稳定性;延长半衰期;协同提高翻译效率
poly(A) 尾(3’ poly(A) tail) 50~120 个连续腺苷 防降解;与 5’ 帽协同促进翻译循环;延长 mRNA 胞内寿命

mRNA如何发挥疫苗功能

  1. 新抗原:以肿瘤疫苗为例,筛选肿瘤新抗原,根据新抗原氨基酸序列反向推导、优化得到目标 CDS 对应的 DNA 序列
  2. DNA模板制备:化学法全合成 DNA 片段 → 连接质粒并大肠杆菌扩增 → 限制性酶切得到线性化 DNA 模板
  3. mRNA合成:以线性 DNA 为模板体外转录 (IVT) 合成 mRNA(m¹Ψ-TP 替代 UTP 实现核苷修饰)→ 酶法加帽 + poly (A) 加尾 → 磁珠纯化
  4. mRNA-LNP复合物:可电离阳离子脂质 + 辅助脂质 + 胆固醇 + PEG 脂质组装 LNP → 微流控技术包封 mRNA → 形成 mRNA-LNP 复合物
  5. **肌内注射*:上臂三角肌;主流为液体制剂直接注射,冻干剂型需复溶后注射
  6. 细胞内递送:mRNA-LNP 经胞吞进入细胞 → 内体酸性环境触发 LNP 电离 → 内体逃逸 → mRNA 释放至细胞质
  7. 抗原呈递:mRNA 翻译出抗原蛋白 → 被酶切为短肽 → 结合 MHC I/II 类分子呈递至细胞表面
  8. 免疫细胞激活:MHC I - 抗原肽激活CD8⁺ T 细胞,增殖分化为细胞毒性 T 细胞;MHC II - 抗原肽激活Th 细胞,进而辅助激活 B 细胞产生抗体
  9. 杀伤靶细胞:细胞毒性 T 细胞直接杀伤肿瘤细胞,特异性抗体协同清除靶细胞
    机制图

mRNA编码区优化

3.1 序列优化相关指标

指标 英文全称 核心定义 生物学意义 计算方法 实际使用方式
RSCU Relative Synonymous Codon Usage相对同义密码子使用度 某一同义密码子的实际观测频率与该氨基酸所有同义密码子的平均预期频率的比值,是衡量密码子使用偏好性的基础指标 1. 反映某一物种/宿主中同义密码子的使用偏倚程度,数值越大表示该密码子被使用的频率越高;2. 为CAI、tAI等后续指标提供计算基础;3. 筛选宿主高表达基因偏好的密码子,规避稀有密码子 综述原文公式:$\boldsymbol{RSCU_{ij}=\frac{X_{ij}}{\frac{1}{n_{j}} \sum_{1}^{n_{j}} X_{ij}}}$• $X_{ij}$:第$i$种氨基酸的第$j$个密码子的观测数量;• $n_j$:第$i$种氨基酸的同义密码子总数;通用规则:RSCU=1:无使用偏好;RSCU>1:偏好使用;RSCU<1:非偏好/稀有密码子 1. 作为密码子优化的基础分析工具,先通过RSCU分析目标宿主(如人、小鼠)高表达基因的密码子偏好;2. 优化时优先选择宿主中RSCU值高的密码子,减少尿苷富集的稀有密码子,降低mRNA先天免疫原性;3. 为CAI、tAI的计算提供原始数据
CAI Codon Adaptation Index密码子适应指数 衡量目标基因的密码子使用模式与宿主高表达基因的密码子使用模式的适配程度,取值范围0~1 1. 核心评估密码子优化后mRNA的翻译效率,数值越接近1,与宿主高表达基因的密码子适配性越强,翻译效率越高;2. 是目前mRNA疫苗密码子优化最常用的核心指标 综述原文公式:$\boldsymbol{CAI=\frac{CAI_{obs }}{CAI_{max }}=\frac{\left(\prod_{k=1}^{L} RSCU_{k}\right)^{1 / L}}{\left(\prod_{k=1}^{L} RSCU_{k max }\right)^{1 / L}}}$• $RSCU_k$:目标基因第$k$个密码子的RSCU值;• $RSCU_{kmax}$:该密码子对应氨基酸的最大RSCU值;• $L$:目标基因的密码子总数;• $CAI_{obs}$:目标基因观测CAI值;$CAI_{max}$:理论最大CAI值 1. mRNA疫苗优化的核心参考指标,如辉瑞BNT162b2、莫德纳mRNA-1273的疫苗序列CAI值均被优化至0.9以上;2. 单独优化CAI不足以实现最优蛋白表达,需与GC含量、mRNA二级结构结合;3. 适用于整体编码区的翻译效率评估,是高通量序列筛选的快速指标
tAI tRNA Adaptation IndextRNA适应指数 从tRNA的可用性/丰度角度,衡量密码子与宿主tRNA库的匹配程度,反映翻译过程中核糖体的延伸效率 1. 比CAI更贴近实际翻译过程,因为翻译效率不仅取决于密码子偏好,还受对应tRNA的丰度限制;2. 解释“翻译斜坡假说”:基因前30~50个密码子的稀有密码子(低tAI)可减缓翻译起始,提升蛋白折叠正确性;3. 补充CAI的局限性,更精准评估翻译效率 通用标准方法(综述原文补充):1. 先获取宿主tRNA基因拷贝数(常用)或tRNA-seq检测的实际丰度,作为tRNA可用性的替代指标;2. 引入摆动配对修正系数(考虑tRNA反密码子与密码子的非标准配对);3. 计算每个密码子的tAI值,再对整个基因的密码子tAI值取几何平均,得到基因整体tAI值 1. 与CAI联合使用,弥补CAI仅考虑密码子偏好、忽略tRNA丰度的缺陷;2. 优化时弱化编码区前30~50个密码子的tAI要求,保留适量稀有密码子,符合“翻译斜坡假说”;3. 针对不同宿主(如人、CHO细胞)定制化优化,需匹配对应宿主的tRNA库数据;4. 提升tAI可增加核糖体延伸速率,减少翻译停滞
CSC Codon Stabilization Coefficient密码子稳定系数 基于单个密码子的使用频率与mRNA体外/体内半衰期的实验相关性,衡量单个密码子对mRNA稳定性的贡献程度,基因整体CSC为其所有密码子的平均CSC 1. 唯一直接关联密码子使用模式与mRNA稳定性的指标,填补了CAI、tAI仅关注翻译效率、忽略mRNA半衰期的空白;2. 揭示规律:多数内源性mRNA倾向于使用非最优密码子(低CAI/tAI,高CSC),平衡翻译效率与mRNA稳定性;3. 优化CSC可提升mRNA的体内半衰期,减少降解,延长蛋白表达时间 通用标准方法:1. 通过高通量实验检测大量基因的mRNA半衰期,同时统计其密码子使用频率;2. 构建密码子频率-mRNA半衰期的相关性模型,计算每个密码子的CSC值(正相关为高CSC,负相关为低CSC);3. 目标基因的整体CSC = 基因中所有密码子的CSC值的算术平均值 1. 与CAI、tAI协同优化,实现“翻译效率(CAI/tAI)+ mRNA稳定性(CSC)”的双重提升,是mRNA疫苗优化的重要补充指标;2. 针对需长效蛋白表达的mRNA疫苗/疗法(如癌症疫苗、罕见病疗法),优先提升CSC;3. 规避高CAI但低CSC的密码子组合,防止翻译效率提升但mRNA快速降解;4. 结合GC含量优化(高GC提升稳定性),进一步增强CSC的优化效果

3.2 mRNA二级结构优化

对比维度 最小自由能(MFE) 平均未配对概率(AUP)
英文全称 Minimum free energy Average unpaired probability
核心定义 mRNA序列形成特定二级结构时释放的自由能最小值,反映RNA二级结构的热力学稳定性 mRNA序列中每个核苷酸处于未配对状态的概率平均值,反映RNA二级结构的整体解折叠程度
取值/单位特征 单位:kcal/mol;数值越负,结构热力学越稳定 取值范围:0~1;数值越接近1,核苷酸未配对程度越高,结构越松散
生物学意义 衡量mRNA二级结构的经典热力学指标,决定结构自发折叠的趋势,二级结构过稳定会阻碍核糖体结合与移动 从统计学概率维度量化RNA结构动态性,更贴近生理条件下RNA折叠-解折叠的动态平衡,弥补MFE仅反映单一最优结构的缺陷
优化逻辑 编码区:升高数值(减小负值),降低二级结构热力学稳定性,消除核糖体翻译的空间阻碍;非编码区:可适度降低数值(增大负值),提升mRNA整体抗降解能力 全编码区:提升数值(趋近1),增加核苷酸未配对比例,降低二级结构紧密程度,减少对核糖体延伸的阻碍,同时降低核酸酶降解风险
核心优化策略 通过同义密码子替换,消除编码区(尤其翻译起始位点AUG附近)的强稳定二级结构(如发夹结构),调整碱基配对可能性,使MFE向负值减小方向优化 通过同义密码子替换调整碱基组成,提高编码区各核苷酸的未配对概率,整体提升AUP平均值,让RNA结构保持松散的动态状态
优化工具 1. CDSfold:专为编码区设计,适用于短序列优化,计算复杂度为序列长度立方;2. LinearDesign:综述重点推荐,适配长序列,兼顾MFE与密码子偏好,可快速找最优/近优解;3. DERNA:联合MFE与CAI优化,平衡结构与翻译效率 1. RiboTree:综述重点提及,基于随机算法,专为mRNA结构优化开发,精准提升未配对概率;2. PERSIST-seq:高通量实验平台,为AUP优化提供实验数据支撑,提升优化实际有效性

3.3 UTR优化

uAUGs、uORFs是目的CDS上游的其他翻译区域,需要避免CDS外的其他可转录区域

优化维度 5′UTR(翻译起始调控区) 3′UTR(稳定性调控区)
核心功能 调控核糖体结合、启动翻译,决定翻译起始效率 调控mRNA半衰期、核输出,辅助优化翻译延伸/终止效率
优化核心目标 消除翻译起始阻碍,提升核糖体识别与结合效率 增强mRNA结构稳定性,减少体内降解,延长表达时间
核心优化策略 1. 清除抑制元件:删除/弱化uAUGs、uORFs,避免核糖体分流2. 引入增强元件:插入经典Kozak序列(GCCACCAUGG),强化起始AUG识别3. 降低二级结构:优化AUG附近结构(MFE/AUP调控),保持区域松散4. 选用天然序列:截取人源高表达基因(如β-肌动蛋白)的5′UTR5. 适配修饰:针对m¹Ψ修饰mRNA,选用Smart5UTR定制序列 1. 引入稳定元件:融入AU-rich元件(ARE),减少miRNA结合位点2. 选用天然序列:截取人源高表达基因(如珠蛋白)的3′UTR3. 优化衔接区:保证与3′poly(A)尾衔接序列无异常二级结构4. 协同修饰:富集m⁶A修饰(DRACH基序),强化稳定性调控
关键注意事项 1. 核心优先清除uORFs(抑制作用强于单独uAUGs)2. 二级结构优化聚焦起始AUG周边区域 1. poly(A)尾(10~250个A)是功能基础,需保证衔接区完整2. m⁶A修饰位点优选终止密码子附近及3′UTR富集区
主流计算工具 Optimus 5-Prime、Smart5UTR、iDRO(整合优化)、RNAid(自定义) 3UTRBERT、iDRO(整合优化)、RNAid(自定义)
高通量实验手段 MPRA(大规模平行报告分析)+ 深度学习,挖掘高效调控元件 MPRA(大规模平行报告分析)+ 深度学习,验证稳定性调控效果

3.4 mRNA修饰

mRNA修饰是通过对核苷酸进行化学修饰,解决天然mRNA稳定性差、先天免疫原性过高、翻译效率不足三大核心问题的关键手段,修饰位点覆盖整个mRNA分子,不同修饰类型分工明确、可组合使用。

  • mRNA修饰检测方法:高通量测序(mi-CLIP/GLORI/DART-seq)为核心,可实现单核苷酸分辨率的修饰位点检测;传统方法(HPLC-MS/薄层层析)用于修饰含量定量;
  • 修饰类型和位点计算预测:通过MRM-BERT、TransRNAm、DeepMRMP等AI模型,预测最优修饰位点与组合,减少实验试错,加速修饰方案的设计(如预测编码区m¹Ψ的最优替换比例)。

(1)甲基化修饰(最主流的碱基修饰,分腺嘌呤/鸟嘌呤/胞嘧啶甲基化)

修饰类型 符号 核心作用位点 核心生物学作用 应用价值
N6-甲基腺嘌呤 m⁶A 全序列分布,富集于终止密码子附近、3’UTR(保守基序DRACH) 提升mRNA稳定性、调控翻译效率;参与T细胞分化等免疫调控 平衡mRNA稳定性与翻译效率,适配免疫细胞靶向的mRNA疫苗
N1-甲基腺嘌呤 m¹A 全序列 改变RNA碱基配对方式,调控mRNA二级结构;促进翻译起始 优化mRNA结构,间接提升翻译效率,可与其他修饰联用
N7-甲基鸟嘌呤 m⁷G 5’帽核心位点(mRNA 5’端) 构成5’帽的核心结构,保护mRNA 5’端不被核酸酶降解;被帽结合蛋白识别,启动帽依赖的翻译合成;调控mRNA核输出 所有mRNA疫苗的必备修饰,是5’帽发挥功能的结构基础,无m⁷G修饰的mRNA易降解且翻译效率极低
5-甲基胞嘧啶 m⁵C 编码区、UTR 稳定mRNA二级结构;促进mRNA核输出、提升翻译效率 增强mRNA整体稳定性,减少体内降解,延长蛋白表达时间

(2)核苷异构/取代修饰

这类修饰是新冠mRNA疫苗的核心修饰策略,通过替换尿苷等核苷酸,规避人体先天免疫受体对病毒RNA的识别,同时提升mRNA性能。

修饰类型 符号 替换对象 核心生物学作用 应用价值
假尿苷 Ψ 天然尿苷(U) 显著降低mRNA的先天免疫原性(避免被TLR7/8等PRR识别);提升mRNA稳定性与翻译效率 首款新冠mRNA疫苗的核心修饰,大幅降低疫苗的发热、炎症等不良反应
N1-甲基假尿苷 m¹Ψ 天然尿苷(U) Ψ的升级版修饰,免疫原性抑制效果更强;进一步提升翻译效率,且修饰后mRNA的结构更稳定 辉瑞BNT162b2、莫德纳mRNA-1273采用的核心修饰,目前mRNA疫苗的主流选择
2-硫代尿苷 s²U 天然尿苷(U) 抑制RIG-I通路的免疫激活,降低先天免疫原性;轻度提升mRNA稳定性 作为Ψ/m¹Ψ的补充修饰,适用于对免疫原性要求极高的mRNA疗法

(3)其他关键修饰

修饰类型 符号 作用位点 核心生物学作用 应用价值
腺苷-次黄嘌呤编辑 A-to-I 编码区(少量)、UTR(主要) 编码区:改变密码子,微调蛋白结构;UTR:调控mRNA运输、降解与翻译 个性化优化mRNA功能,适用于肿瘤疫苗的抗原微调
N4-乙酰胞嘧啶 ac⁴C 编码区、5’UTR 编码区:稳定mRNA,提升翻译效率;5’UTR:位点特异性调控翻译起始(弱AUG旁增强,强AUG旁抑制) 精准调控翻译起始效率,避免翻译过强/过弱,适配不同抗原的表达需求
2’-O-甲基化 2’-O-Me 核糖环2’位(全序列核苷酸) 屏蔽mRNA被核酸酶降解;增强mRNA疏水性,优化与递送载体(如LNP)的结合;降低免疫原性 与5’帽修饰联用,强化mRNA的抗降解能力,提升疫苗在体内的存活时间

mRNA递送系统

  • 为什么要使用递送系统

mRNA自身存在负电难跨膜、易被核酸酶降解、内体逃逸效率低三大递送障碍,

  • 递送系统的作用

保护mRNA、实现靶向递送、促进胞内释放

4.1 mRNA递送系统主要类型

递送系统分类 核心载体类型 代表形式 核心组成/特点 优缺点 应用场景/研发阶段
天然来源纳米颗粒 天然生物材料衍生的纳米载体 病毒样颗粒(VLPs)、细胞外囊泡(EVs)、SEND系统 基于天然蛋白/核酸结构组装,适配生物体内环境 优点:生物相容性好、转染效率高、靶向性天然;缺点:易引发非特异性免疫反应、存在基因组整合风险、量产难度大 多为预临床研究,SEND系统因低免疫原性成为研发热点
无机递送系统 无机纳米材料 金纳米颗粒(AuNP)、铁氧化物纳米颗粒、量子点 无机非金属/金属纳米结构,理化性质稳定 优点:无免疫原性、结构稳定、易表面修饰;缺点:合成/修饰工艺复杂、体内代谢难、生物安全性待验证 基础研究/预临床,多用于局部递送研究
有机载体 脂质/聚合物基人工合成载体 脂质纳米颗粒(LNP)、聚合物纳米颗粒、杂化纳米颗粒 人工设计合成,可精准调控理化性质,适配mRNA包封 LNP优点:包封效率高、内体逃逸能力强、量产成熟、临床验证充分;LNP缺点:易肝富集、靶向性有限;聚合物/杂化:结构可调但临床数据少 LNP:新冠/RSV疫苗临床获批,为mRNA递送金标准;聚合物/杂化:预临床/早期临床

4.2 LNP递送系统

LNP是目前mRNA疫苗的首选递送载体(辉瑞/莫德纳新冠疫苗均采用),经典配方为四组分

(1)LNP经典四组分及核心功能

LNP组成成分 核心代表 核心生物学功能
可电离阳离子脂质 MC3、SM-102、ALC-0315(FDA获批)、4N4T pKa可调控,酸性条件下带正电促进内体逃逸;结合负电mRNA实现包封,是LNP功能核心
胆固醇 天然/修饰胆固醇 填充脂质膜间隙,增强LNP结构稳定性;促进膜融合,辅助内体逃逸
辅助脂质 磷脂类(如DSPC) 维持LNP双层膜结构,提升胶体稳定性;降低LNP毒性,增强生物相容性
PEG化脂质 PEG2000-DMG 调控LNP粒径,防止颗粒聚集;延长体内循环时间;降低非特异性免疫反应

(2)LNP合成工艺

通过组合化学方法,系统性生成多样化可电离阳离子脂质(LNP的核心功能成分),构建大规模脂质文库,为LNP的高效筛选与优化提供物质基础,是连接“脂质分子设计”与“计算筛选/实验验证”的关键环节。

合成方法 英文缩写 核心原理 优势 应用成果
双组分反应 2-CR 直接将“脂质尾部”与“含氨基的头部基团”通过迈克尔加成、环氧化物开环等反应连接,生成可电离阳离子脂质 工艺最简单、成本最低,适合快速构建基础脂质文库 早期LNP研发的核心合成手段,奠定脂质文库基础
三组分反应 3-CR 在2-CR基础上增加“连接体组分”,通过Ugi反应、迈克尔加成串联等方式,将“头部-连接体-尾部”三部分组合,扩展脂质结构多样性 化学空间覆盖更广,可设计含特殊官能团(如酰胺、脒基)的脂质 合成含1080种脂质的文库,筛选出能激活STING通路、增强疫苗免疫原性的脂质;生成700+种脂质的肺部递送文库
四组分反应 4-CR 基于Ugi反应扩展,将脂质结构拆分为“氨基头部、连接体、尾部1、尾部2”四个独立组分,通过四组分一锅反应组合生成脂质 结构调控更精细,可独立优化头部电荷、尾部疏水性、连接体稳定性 开发出高活性脂质119-23,可实现多器官、多细胞类型的高效mRNA递送
串联多组分反应 T-MCR 基于“胺-硫醇-丙烯酸酯”的理性设计反应,一锅法合成含脒基的可降解脂质(AID脂质) 合成效率高,脂质含可降解结构,生物安全性更优 快速生成可降解LNP,降低体内蓄积毒性

(3)LNP核心优化维度与策略

优化维度 关键指标/方向 核心优化策略
成分设计 可电离阳离子脂质结构、组分比例 1. 合成新型阳离子脂质(如4N4T)提升递送效率;2. 调整四组分比例,适配不同mRNA序列/靶细胞;3. 开发三组分LNP,规避肝富集问题
理化属性 粒径、zeta电位、包封效率 1. 调控粒径至50~200nm(最优胞吞范围);2. 优化zeta电位,保证包封效率的同时降低毒性;3. 提升包封效率,减少游离mRNA降解
靶向性 组织/细胞特异性递送 1. 引入SORT分子构建五组分LNP,实现肝外靶向(肺/脾等);2. 表面修饰靶向配体(如抗体/多肽),精准结合靶细胞受体;3. 优化给药途径(如肌内/鼻腔/静脉),辅助靶向
安全性/稳定性 免疫原性、体内循环时间、储存条件 1. 优化PEG化脂质类型,降低免疫原性;2. 修饰脂质结构,提升LNP体内稳定性;3. 开发可冻干LNP,降低冷链依赖

总结

通过对本篇综述的深入学习,我系统掌握了 mRNA 肿瘤疫苗从新抗原筛选、DNA 模板制备、mRNA 体外合成与修饰,到 LNP 包封、体内递送、抗原呈递并激活特异性抗肿瘤免疫的全链条机制,同时明晰了CDS 序列、UTR 结构、核苷修饰、LNP 递送体系及制剂工艺等关键优化方向。后续我将持续更新、分享 mRNA 疫苗研发领域的最新工具、实操算法与研究资源。

参考文献:Accelerate the Highly Efficient Development of mRNA Vaccines Through Advanced Computational Methods
声明:本分享内容来自文献综述总结,不涉及公司机密内容。

posted @ 2026-03-03 10:00  生信探索  阅读(4)  评论(0)    收藏  举报