Nature Plants评论:植物基因编辑的未来
分享一篇近期发表在Nature Plants上题为“The future of genome editing in plants”的评论文章,这篇文章探讨了植物基因组编辑技术的未来发展方向,强调基因组编辑技术将超越目前简单的单核苷酸多态性和短缺失,转向模拟自然进化过程中塑造植物基因组的大型结构变异(如插入、重复、缺失、倒位和易位)以及控制植物重组和内源性转座元件。文章详细讨论了当前基因组编辑技术在植物中的应用,包括CRISPR–Cas系统的高效性和多功能性,并展望了未来基因组编辑技术在农业创新中的潜力,如编程染色体重组合、倒位和易位等,以实现更精准的作物改良和性状优化。
植物基因组编辑的未来与如今的使用方式截然不同。无论是用于研究还是产品开发,我们都不能仅仅局限于在基因中创造简单的单核苷酸多态性和短缺失。我们相信,植物基因组编辑的未来在于模拟自然进化过程中塑造植物基因组的机制,以及在作物驯化和改良过程中被人工选择的目标。这包括编程大型结构变异(插入、重复、缺失、倒位和易位)以及控制植物重组和内源性转座元件,这些自然因素会重塑植物基因组。关键在于,基因组编辑将被用于以一种自然可能发生的方式重塑植物基因组,但现在这些变化可以在实验室中迅速定向实现。
最后报名机会!植物基因组编辑高级培训班~0基础开讲(点击文字查看)
植物基因组精准工程的方法和工具
精准工程化植物基因组的方法和工具已经存在了30多年,从位点特异性重组酶(如Cre和Flp)的引入开始,到序列特异性可编程核酸酶的发展,如巨型核酸酶、锌指核酸酶和转录激活因子样效应物(TALE)核酸酶,再到如今几乎独家使用的CRISPR–Cas系统。CRISPR–Cas成为当前基因组编辑的首选工具,主要有三个关键特性:首先,高度的序列特异性,识别序列足够长,即使在大型植物基因组中也能作用于独特位点;其次,相对容易编程;第三,能够添加多种功能,包括脱氨酶(碱基编辑器)、逆转录酶(Prime编辑器)、转录增强子或抑制子以及多种染色质重塑功能。
当前基因编辑的应用
目前植物科学中大多数基于CRISPR的应用涉及靶向单个基因,利用Cas相关蛋白的核酸酶功能产生DNA双链断裂(DSB),或者利用Cas连接的碱基编辑器以非模板方式改变碱基。DSB通过非同源末端连接(NHEJ)修复,在基因附近或基因内部产生小的插入-缺失(indel)编辑,有时可能表现为单核苷酸多态性(SNPs)(图1a)。NHEJ和碱基编辑产生多态性,通常靶向蛋白编码基因、微RNA、长非编码RNA或启动子调控单元(如增强子)。通过多重化引导RNA(gRNA)的生产,可以同时靶向多个基因(图1b)。此外,针对同一启动子的多重gRNA可以产生序列变异,包括SNPs、小indels和更大的缺失(图1c),从而产生表达多样性。靶向这些多态性的目的是产生影响目标基因、遗传途径或性状的突变。尽管这些小indels并非本文的重点,但它们在植物研究和产品开发中仍将发挥重要作用。
图1 | 当今CRISPR–Cas在基因附近或基因内产生小规模indels的用途 a:由CRISPR gRNA引导的Cas蛋白进行基因组切割。在植物中,产生的DSB通常通过NHEJ修复,导致1–10 bp的短非模板缺失。 b:在多个位点同时进行多重基因组编辑(在不同基因上)。 c:针对同一基因组区域(如基因启动子)进行多重基因组编辑,通常在gRNA靶点之间产生较大的缺失。
未来基因编辑技术的应用
植物基因组中的结构变异(SV)自然和人工选择产生了许多最重要的农业创新。自然发生的SV是育种所依赖的表型变异的基础。这些通常被称为内在性状,因为植物种质已经具备这种期望的能力,对这些性状(如开花时间和植物结构)的逐步调节最初被选择,随后被育种,现在可以通过基因组编辑直接工程化。对基因组编辑的一个常见批评是它只能调节内在性状,而外在性状则被经典定义为植物本身不具备且必须添加的性状。经典的外在性状的一个关键例子是工业最有价值的性状:除草剂耐受性。然而,也存在一些例子,植物通过其自身基因组中的SV自然进化出这种“外在”性状,完全模糊了经典定义的内在和外在性状之间的界限。在强烈的自然选择压力下,农业杂草通过基因组中目标基因的拷贝数增加迅速进化出对除草剂的耐受性(图2a)。拷贝数的增加导致蛋白质水平过高,使除草剂无法抑制。因此,通过人工选择利用SV改善了经典的外在性状,这表明未来可以通过基因组编辑和顺基因(在育种池内)基因移动的结合来产生任何性状(图2b)。多篇最近的综述文章总结了在基因水平上产生小编辑的最新技术,包括高度多重化的编辑,以产生特定的表型性状。除了产生SNPs和indels之外,我们认为基因组编辑的未来在于模拟植物基因组中自然存在的较大SV。SV包括大于50个碱基对(bp)的较大缺失、插入、重复、倒位和易位,这些在植物基因组中迅速进化,并且在同一物种的不同品系之间被观察到。基因组编辑可以通过形成DSB以靶向方式触发这些过程,同时操纵和/或招募修复途径,并筛选出特定结果,而不仅仅是SNPs和短缺失。在本观点文章中,我们专注于新型编辑方法和工具的优势和局限性,以创造精确的SV、存在-缺失变异和染色体重组合。尽管自然发生的SV是作物育种和驯化所依赖的表型变异的基础,但精确工程化SV的工具和方法才刚刚开始出现。
当前技术用于编程SV
Cas核酸酶产生的DSB的效率和精确性可以应用于工程化广泛的SV。由两个或多个同时DSB产生的末端可以通过NHEJ修复(或者如果序列两侧有同源序列,则可以通过同源定向修复HDR),从而产生所有可能的染色体内和染色体间的SV(图1)。与任何自然发生或由诱变剂诱导的新的大基因组变化一样,并非所有工程化的SV都将具有活性或稳定性,但它们可以被精确设计以产生期望的结果。
编程染色体缺失
在植物基因组中,由Cas相关蛋白在单个位点产生的DSB通常会生成短(<10 bp)缺失,但当gRNA多重化时,会在同一染色体上产生两个或多个DSB,从而观察到更大的缺失(图2b)。这种方法已被用于产生约1 kb的番茄启动子缺失,从而产生一系列表达模式;从Physcomitrium patens基因组中去除富含转座元件的大区域;以及在水稻中去除>100 kb的多个基因(图2b)。这些缺失可用于简化基因组,去除串联重复基因以及去除由生物合成基因簇编码的整个途径。
靶向插入方法
在缺失之后,编程SV的最简单情况是插入转基因,这历史上是通过随机整合实现的。精确编程DNA插入靶点的技术被用于植物蛋白研究的表位标签整合,以及工业中转基因编码性状的放置,例如除草剂耐受性基因(图2c)。靶向转基因插入的好处在于,转基因货物可以被放置在基因组的“安全港”区域,这些区域不会中断内源基因并允许可预测和持久的基因表达(通常期望高表达)。此外,性状可以被堆叠在一起或与彼此连锁(图2d),从而减少了下游育种的复杂性。通过Cas9介导的frt重组位点的插入,随后通过Flp重组酶介导的盒式交换,可以实现基因插入。
编程重复以改变拷贝数变异
基因重复可能导致基因获得新功能(新功能化),或者基因可以保留其原始用途,但以更高的剂量和表达水平存在。拷贝数变异(CNVs)是包括基因重复和扩增的结构变异。CNVs已在大多数主要作物物种中被描述,并被认为在选择重要农艺性状方面发挥了关键作用,包括病害抗性。例如,CNVs常见于参与植物防御的核苷酸结合亮氨酸重复(NB-LRR)基因。NB-LRR病害抗性基因通常聚集在高度可变的串联重复基因岛中,这使得重排、存在-缺失变异和自然易位的频繁产生成为可能。通过在串联阵列中基因的保守序列中创建靶向Cas DSBs,可以精确地模拟这种自然CNV,从而改变拷贝数并产生新的等位基因。育种计划还可以利用NB-LRR易位创建病害抗性基因的连锁群,将多个位点聚集在基因组中,使它们作为单一位点遗传(图2b)。基因重复的进化过程在植物基因组中产生了大量的基因和蛋白质家族,并可能导致性状增强和快速进化,例如上述农业杂草中除草剂耐受性的例子。基因重复导致CNV、表达增加和自然性状增强,以克服干旱等胁迫,例如在禾本科植物中克服干旱耐受性的重复趋同进化。重复的基因拷贝可以位于原始基因的相邻位置(如图2a所示),在同一染色体上但距离较远,位于不同的染色体上,甚至位于染色体外的游离体上。转座元件是自然的基因复制器,未来可用于工程化CNVs。除了基因,更大的染色体片段、整个染色体或整个基因组(自身多倍化)也可以自然重复。当CRISPR–Cas用于编程染色体缺失时,副产品可能是姐妹染色体或同源染色体上相应区域的重复。例如,通过在重复区域的两侧诱导DSBs,在水稻中获得了300 kb的染色体重复。然而,与其他通过基因工程编程的SV相比,重复的利用还远远不够,代表了未来工程化的一个目标。
图2 | 通过基因组编辑诱导的关键中等规模SV示例 a:编程基因或调控单元的串联重复。重复区域增加拷贝数,可能导致蛋白质水平和性状的增强。 b:从不同染色体移动和插入不同基因或性状(彩色线条)到一个位点,这对于育种管道非常有益。 c:使用位于缺失边界的gRNA编程大缺失。 d:通过多种方法将转基因或顺基因靶向插入,这些方法结合了CRISPR–Cas与重组酶、逆转录酶或转座酶蛋白。 e:通过重复靶向插入堆叠基因和性状。靶向插入目前用于聚集有益性状,并且将来可以用于创建携带从整个基因组移动而来的性状的定制染色体。这些新的连锁群在育种管道中很有用,可以加速这些性状向新的种质的引入。
编程染色体重组合
个体变异的主要来源,育种所依赖的,是在减数分裂过程中通过染色体的独立分配和减数重组(尤其是交叉)产生的。能够精确设计交叉的位置将使育种者能够更精确地设计和产生所需的变异(图3a)。交叉的位置由DSB决定,其位置和频率在基因组中各不相同。通过将Spo11与序列特异性核酸酶(包括Cas9)融合,已经在酵母中靶向减数交叉的位置。是否这种方法能在植物中奏效将是一件有趣的事情。减数重组的替代靶向方法是在植物转化过程中在有丝分裂(体细胞)中创建交叉。从体细胞中再生的植物,其中同源染色体之间发生了互惠重组,可以通过生殖细胞将重组事件传递给下一代。此外,在体细胞中创建的靶向交叉可能不受减数分裂中交叉干扰现象的影响,从而有可能相对精确地实现双交叉,以在育种中精确转移有益的单倍型。通过单个gRNA靶向一对同源染色体上的特定位置,可以在体细胞中同时在两条染色体上创建DSB,从而在玉米和番茄中实现了模拟减数交叉的互惠重组。
生成阻止重组的倒位
长读长测序技术在植物基因组中的应用揭示了自然存在的Mb级倒位在作物品种中令人惊讶地丰富。这可能是因为倒位不会导致遗传信息的丢失,因此比缺失的破坏性要小得多。倒位可以通过两个CRISPR靶点以类似于大缺失的方式进行编程,但需要增加对结果群体中中央DNA片段倒位的筛选(图3b),而不是缺失。在一个来自水稻的例子中,通过0.9 Mb的倒位实现了启动子交换,增强了目标基因的表达。除了增强单个基因的表达外,倒位还可以用来影响重组,从而影响染色体相应部分的遗传交换,如果交配伙伴缺乏相应的倒位。通过逆转自然倒位,可以重新打开重组死亡区域以进行遗传交换和育种,这一点在拟南芥的概念验证实验中得到了证明。通过结合Cas9诱导的DSB和高效的筛选方案,可以获得许多携带Col-0中1.1 Mb节倒位逆转的重组体。通过将逆转系与缺乏倒位的品系杂交,经过五千年的时间后,遗传交换得以恢复。这种方法也已应用于作物:玉米中一个自然存在的75.5 Mb倒位被逆转,该倒位占据了2号染色体的约三分之一,从而能够与其他玉米品种进行遗传交换。
与促进重组相反,也可以利用基因组工程来阻碍遗传交换。这一点最近通过在Col-0拟南芥的2号染色体上诱导一个17 Mb的倒位得到了证明,该倒位覆盖了其长度的9/10。与生态型Ler-1杂交后,标记分析显示,在倒位区域内抑制了后代中带有交叉的恢复。因此,诱导倒位是一种强大的工具,可以在染色体水平上重新定向遗传交换。
染色体之间的易位
易位在植物基因组进化中也扮演了重要角色,也可以通过基因组编辑来实现(图3c)。利用Cas9,拟南芥中染色体臂的部分被交换,包括几乎在Mb大小范围内的染色体之间的互惠交换。如果基因紧密连锁,将它们分离以打破它们的遗传连锁可能是有益的。实现这一目标的一种方法是诱导基于NHEJ的互惠易位,将基因定位在不同的染色体上。尽管报告的频率低于倒位,但易位是重组植物基因组的最有效手段。通过连续的染色体臂易位,可能改变作物物种中染色体的数量,从而改变连锁群的数量。易位也有望成为缩小单个染色体以将其转化为迷你或人工染色体的有效手段。相反,染色体也可以被扩大以结合多个有益性状(如图3c所示)。在任何一种情况下,都需要考虑确保染色体结构的重大变化产生的品种在杂交时具有减数分裂稳定性,并且因此与下游育种策略兼容。
图3 | 通过基因组编辑诱导的大规模SV示例 a:通过CRISPR–Cas基因组编辑选择重组事件的位点,可用于打破不想要的性状连锁(未显示)或将有益等位基因聚集在单个染色体上。 b:染色体大段的倒位可用于抑制重组,或者通过逆转过去的倒位重新启用一个区域的重组。 c:与重组(a)类似,易位可用于打破两个或多个因素之间的遗传连锁,或将有益性状聚集在一起(如图所示)。与同源染色体之间的重组不同,易位发生在不同染色体之间(用不同颜色显示)。
所需的新技术
常规编程植物SV将需要在上述技术的重要增量改进以及目前尚不存在的新技术。关键编辑特性,如货物大小、编辑速率以及减少非靶标意外突变,是这些技术目前关注的焦点。这包括改善植物中的同源重组,可能通过影响修复途径以避免DSB后的NHEJ。此外,由于重组酶、整合酶、DNA转座酶和逆转录酶都已成功与CRISPR–Cas结合用于植物SV工程,一个值得注意的、可能非常有用的尚未被驯化的蛋白是滚环螺旋菌转座元件产生的复制酶/解旋酶功能。螺旋菌转座元件以高频率复制植物基因,并且留下非常小的痕迹,它们是自然的基因组工程师,目前尚未开发的潜力可用于未来的工程。另一个技术改进将是可编程的重组酶。目前版本的重组酶作用于特定的重组序列,这些序列首先需要被添加到基因组的特定位点,然后才能参与DNA移除、DNA添加和/或介导染色体易位。最初,这些重组位点是通过传统转基因技术添加到基因组中的,但现在PrimeRoot、Twin Prime、PASTE等方法可以用来插入这些短序列。未来,我们或许能够指导重组酶蛋白以类似Cas相关蛋白与gRNA编程的方式作用于内源序列(无需首先整合重组位点),这将是工程化植物基因组的有力工具,因为它们能够避免植物对NHEJ的自然偏好。
将大片段DNA添加到植物细胞中,仍然是植物基因组工程的一个主要障碍,与其他生物体相比。这种技术对于整合或移动数量性状位点或正单倍型尤其有吸引力。尽管在哺乳动物细胞中可以通过酵母细胞融合转移Mb大小的DNA,但这种技术在植物中仍然缺乏。只有在模式苔藓Physcomitrium patens中,通过PEG转化较短片段并由同源重组组装,才可能用合成DNA替换155 kb的染色体片段。一种间接改进将有助于所有植物基因组工程,即开发更高通量的方法来筛选稀有编辑事件。长读长测序非常适合检测SV,但目前无法对筛选群体进行从头基因组组装以识别稀有编辑。大规模长读长筛选的额外好处是能够同时检测非靶标变化,目前这只能在检测到主要编辑后作为二次筛选进行。一个关键的创新将是编程植物SV而不整合产生编辑的工具(如CRISPR–Cas和其他)。通常,这种工具是通过转基因添加到植物基因组中以产生编辑,但随后需要通过另一次编辑、重组或分离来移除。对于无性繁殖植物来说,分离不是一个选项或极其困难,这尤其繁琐。非整合瞬时转化是通过几种不同的方法寻求的,包括基于纳米材料的瞬时植物转化、非整合型农杆菌菌株的使用以及感染植物但不会传递给下一代的病毒。使用病毒来编码植物基因编辑所需的工具特别有吸引力,因为它避免了繁琐且昂贵的基于组织培养的植物转化,但到目前为止,这些CRISPR–Cas系统仅限于创建小indels。在任何上述SV被编程之前,我们需要了解哪些SV将提供期望的结果。现在比以往任何时候都更需要对基因组学和性状发现的基础研究,以了解要靶向的SV变化。有益SV的身份可能来自作物种质库的长读长测序以及有益性状的筛选。然后,这些自然发生的SV(甚至是诱导的SV)可以在目标种质中以靶向方式再生。性状发现管道将需要调整到编程大型SV的心态,而不仅仅是单个基因的突变。最后,监管机构将不得不制定基于科学的政策,以应对目前越来越可能实现的广泛SV编辑。这些SV编辑超出了监管机构目前对单个基因中一次一个indel突变的范围。最近在北美和欧洲对接受诱导SV和顺基因方法有积极的建议。由于自然SV一直是通过筛选和育种进行传统作物改良的基础,我们相信诱导和编程SV是下一步,也是植物基因组编辑的未来。
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/18930005。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。