未来500年:迈向太空的生命工程之旅
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

疾病和表观基因组编辑

我们刚刚打开了进化慷慨赠予我们的遗传工具箱。这些工具需要进行改进,而这种改进并不仅仅是为了提高其安全性,也是为了确保它们在哺乳动物的复杂细胞中起到应有的作用。也许,在500年计划的第三阶段和第四阶段中,最重要的一个假设是,21世纪初,基因工程不会是最后被发现、开发和部署的。未来,新的基因组技术,将把我们从一个基因组编辑和嵌入的时代,带入一个纯粹的基因组编辑时代。据估计,目前地球上约有1万亿个物种,而我们只发现了其中的几十万个。此外,基因数据的数量(如被测序的碱基,见图4.2)正呈指数级增长。因此,从2020年到2040年,更多的CRISPR方法,细菌、真菌的编辑、免疫和基因组修改机制,可能会以指数级的速度被发现。不过,利用目前尚未完善的基因编辑工具箱,我们确实可以真正治愈一些疾病。

图4.2 DNA数据的增长:1982年以来,测序的碱基数量每年都在持续增长,图中是Genbank(灰色)和WGS(黑色)的可视化碱基测序情况

现在,基因工程的作用在临床试验中得到体现。从2018年起,使用ZFN、TALEN和CRISPR的临床试验创下了新纪录(见图4.3)。2019年,利用基因编辑,人们首次治愈了两名镰刀型细胞贫血症和β-地中海贫血症患者。在治疗开始前,这两名患者都需要通过输液补充红细胞,保证氧气充足。CRISPR Therapeutics公司与Vertex制药公司合作,研发了一种自体疗法来治疗这种疾病(细胞来自同一患者称为“自体”,而“异体”意味着细胞来自捐赠者)。他们从患者身上取出造血干细胞,利用CRISPR对其进行改造,移除阻止产生胎儿血红蛋白的基因,从而使该基因复苏,然后将细胞输给患者。在接受自体干细胞移植后,两名患者血液中的胎儿血红蛋白含量,比临床医生所希望的还要高(超过30%,而之前至多只有10%)。然而,患者所接受的治疗并不轻松,需要通过多次化疗,杀死自己的干细胞,从而使工程改造细胞进入免疫系统。不过,镰刀型细胞贫血症患者并不是唯一可以从中受益的人群。

图4.3 美国临床试验数据库中的基因编辑临床试验类型:使用基因工程的临床试验始于2008年,包括CRISPR、ZFN、TALEN及基因编辑等。左图:按年份划分的试验。右图:按国家分类的试验

我们计划通过基因编辑让患者摆脱疾病的痛苦,中国的科学家为我们提供了很多帮助。在短短4年内(2012年至2016年),中国从没有开展嵌合抗原受体(CAR)临床试验(一种基因工程疗法,能够精确地靶向身体中原本无法靶向的细胞),变为开展CAR试验次数最多的国家之一。2015年,中国首次宣布对人类胚胎进行编辑,2018年,贺建奎表示,第一批CRISPRed人类婴儿诞生。贺建奎想帮助一对年轻的艾滋病毒携带者生下对该疾病有免疫力的孩子。因此,他设计了一个CCR5的基因缺失,这是T细胞上的一个重要受体。CCR5是大多数HIV病毒株的细胞门,在那里,HIV可以进入细胞,但是如果没有这个受体,大多数病毒毒株就无法进入其中。

CCR5缺失是由柏林的医生发现的,当时他正在治疗一名接受骨髓移植的HIV患者。出乎意料的是,这名患者的HIV病毒载量在几个月后大幅下降,以至于检测不到。随后,医生停止了对他使用抗逆转录病毒药物。更加令人惊讶的事情出现了,患者体内的病毒载量在几个月内一直保持在相当低的水平,这种状态持续了数年。这名患者被称为“柏林患者”,他是个幸运儿。之所以产生令人难以置信的结果,是因为他的捐赠者的骨髓细胞发生了意外突变——CCR5缺失。

CCR5缺失的优点取决于细胞、时间和具体情况。CCR5在细胞内可以做许多事情,这使得它具有多态性(像大多数人类基因一样),而且它所产生的作用可以根据细胞类型、时间,甚至感染类型而改变。罗宾·克莱因(Robyn Klein)和其他研究人员的研究表明,拥有一个功能齐全的CCR5受体,人体就更有可能感染HIV,但是,CCR5受体能大大降低感染西尼罗河病毒(WNV)的概率。这是由于CCR5限制了WNV感染T细胞的能力,并防止神经元和体内其他细胞受到感染。换句话说,CCR5的工作副本在WNV中可以保护人体不受损害,但在HIV中会带来致命风险。在2020年至2040年,研究的重点是,确定所有人类基因的多态性,找到基因编辑在不同情况下产生的具体结果(无论为了预防HIV还是为了提高在太空中生存的能力)。

我们可以从如今的人类基因组中获得经验教训。在一项名为“复原力项目”的大规模调查中,人们试图找到那些本应死亡却仍然活着的人。基因“超级英雄”很可能发生突变,导致重大疾病,但这些人不知以何种方式避免了患上疾病。纽约西奈山伊坎医学院的陈荣、杰森·博比(Jason Bobe)、斯蒂芬·弗兰德(Stephen Friend)和埃里克·沙德特(Eric Schadt)收集到了这些人的信息。在理想情况下,如果这些新发现的突变可以保护人们免受疾病的侵害,而不仅仅是纠正致病的突变,那么这些突变也可能成为基因编辑的候选基因。从理论上讲,只要不是太迟,我们就有机会对胚胎进行编辑。

目前,博比、弗兰德和沙德特发现了新一类抗HIV的“超级英雄”。这里有“控制精英”,他们被感染也能将HIV维持在非常低的水平;有“长期共存者”,他们已经被感染,但并未丧失免疫功能,身体状态良好;还有“中和精英”,他们对HIV产生了有效的中和抗体,但这种情况并不寻常。虽然目前基因组测序和基因组工程仍处于早期阶段,但从长远来看,这些数据十分有用,不仅可以用来修复出错的地方,还可以改进已有的东西。利用不同患者的基因组,我们可以找到治疗未来的患者的方法,无论患者位于地球上还是在地球之外。

关于我们是否可以编辑人类胚胎,并产生基因设计的孩子之类的问题是没有意义的,在技术层面,这些完全能够实现。现在,我们的主要问题是,我们应该如何进行基因编辑,何时开始这项任务,或者我们是否永远都不应该做这件事。日本在2018年发布声明,允许对人类胚胎进行基因编辑,其对彻底治愈疾病的技术拥有浓厚兴趣。

调控DNA甲基化

选择性激活和抑制相同的遗传密码,这种奇妙的能力使细胞在发育过程中具有非凡的可塑性。表观基因组是细胞生物学的电子控制箱,当出岔子时,后果可能不堪设想。与大多数复杂系统一样,错误可能会出现,表观遗传的变化可能致病。一些疾病主要根据其表观基因状态而不是遗传变化来分类,这些疾病可能显示出较高的DNA甲基化(*译者注:DNA甲基化为DNA化学修饰的一种形式,能够在不改变DNA序列的前提下,改变遗传表现。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达)水平(CH3),DNA装配方式会发生改变(开放与封闭),也可能只是装配染色质内的蛋白质产生变化。白血病、胶质母细胞瘤和结肠癌可以表现出“超甲基化”的表型,会导致侵略性癌症出现。值得注意的是,即使我们没有观察到已知的致病基因发生改变,这种情况依旧会发生。

就像上述的基因组编辑方法一样,表观基因组也可以成为编辑、调整和设计的目标。我们对候选位点的了解来自那些已知的在正常发育、压力或疾病期间会发生变化的区域。从胚胎开始,几乎所有的表观遗传标记都被重置了,也就是说,几乎所有的甲基化水平都被设置为零,从而使它们能充分发挥潜力。然后,一个接一个的位点被甲基化,基因被设置为静默状态,以创建一个其感兴趣的特定细胞类型。如果你想把一个细胞,如神经元,变成另一个细胞,如心脏组织,理论上来说,你只需要知道所有需要改变的部位就可以实现。我们可以通过两种主要方式来实现:一是修改DNA碱基的类型(如胞嘧啶与5-甲基胞嘧啶),二是调整染色质的状态和类型(赖氨酸的单甲基化与三甲基化,开放的染色质与封闭的染色质)。

鲁道夫·雅尼什(Rudolf Jaenisch)在2018年表明,表观基因组编辑可以应用于脆性X综合征的治疗,甚至可能治愈这种疾病(至少对小鼠来说是这样的)。脆性X综合征是男性智力障碍最常见的遗传形式,它是由FMR1基因的高甲基化引发的,会使基因保持抑制状态(关闭基因活动,就像你拨动收音机开关来关机)。过度甲基化的部位主要在CGG重复序列内(特别是5'UTR)。为了应对这种疾病,雅尼什的团队打算用一种方法来拨转表观遗传的开关——逆转甲基化,并重新激活基因表达。

要想拨转表观遗传的开关,就需要发明一个新的表观遗传编辑工具箱。但是,正如前文讨论的DNA编辑和CRISPR,我们可以从生物学中获得经验,而不需要凭空发明新事物。在通常情况下,胞嘧啶甲基化由一种叫作DNA甲基转移酶(DNMT)的酶控制,该酶将胞嘧啶(C)转化为甲基胞嘧啶(mC),将mC变为hmC,细胞的“内部审计程序”所需的“文本工作”将碱基转化为原来的C,去除DNMT最初添加的静默口令。这是表观基因组中改变碱基的正常循环的一部分,它控制着基因及其调控区域何时及如何被使用。TET1和其他TET基因(TET2、TET3)的突变与白血病、心血管疾病有关——这一关联突显了它们在表观遗传调节中的重要作用。

为了编辑表观基因组,TET1酶可以与改良的CRISPR系统相结合,来靶向特定位点并控制甲基化。在这种情况下,雅尼什和他的同事将失活的Cas9(dCas9)蛋白与TET1酶合并,使用单导引RNA将FMR1基因改为活性状态,恢复了FMR1在诱导多能干细胞(iPSC)中的表达。然后,他们从修饰过的诱导多能干细胞中创建了神经元,这些神经元表现出有效的正常电生理模式(野生表型)。这些编辑过的神经元被移植到小鼠的大脑中,以测试它们一旦回到原来的微环境中,那些变化是否会被保留——就像有人在增强重力的火星环境中训练,希望回到地球时可以在马拉松比赛中取得更好的成绩。

这些细胞能够进行自我控制——编辑工作成功了!在接受移植的小鼠大脑中,经过编辑的神经元保持了FMR1的表达。但是,这个高难度移植过程说明,这种方式很难应用于患有脆弱X综合征的患者身上,因为需要切除、编辑和替换患者体内的所有神经元。患者的大脑一刻不停地运转,并且其中还存有他们喜欢的回忆,患者们肯定不会接受这个方法。尽管如此,雅尼什和他的同事表明,在已建立的大脑神经元(有丝分裂后)中,有可能实现CGG重复序列的直接去甲基化,FMR1表达有可能重新被激活。这意味着无论患者的疾病是由什么导致的,可能是遗传或表观遗传,都可以被治愈。

EPI-EPIOME表观-表观组

表观基因组位于基因组的上层,用于控制DNA的功能;表观转录组同样位于转录组的上层,主要控制RNA的功能。随着基因工程工具的完善,在所有表观组学的控制之上产生了一个新层次,我们可以称之为表观-表观组(*译者注:表观-表观组是真核生物基因的一部分,在剪接后会被保存下来,可在蛋白质生物合成过程中被表达为蛋白质。外显子是最后出现在成熟RNA中的基因序列,又称表达序列,既存在于最初的转录产物中,又存在于成熟的RNA分子的核苷酸序列中)。编辑表观基因组并不局限于胞嘧啶甲基化,我们甚至可以编辑支撑DNA的支架——染色质。染色质是DNA和蛋白质的混合结构,它能够将30亿个碱基的DNA压缩到只有几微米那么大。如果你把一个细胞的DNA拉长,长度大概能达到两米。这么长的DNA不仅被塞进了每个细胞内,还留出了足够的空间,以便分子在必要时能够进行访问和读取。这好比把一根长度相当于世界上最高建筑(828米高的哈利法塔)的绳子,压缩到能够放入手心中。

这种非凡的包装不仅对保护DNA很重要,而且对调节也起到关键作用。这种调节是由创造染色质的蛋白质介导的,染色质像DNA一样被修改和调整。如同其他蛋白质,组蛋白在基因组中被编码为DNA,然后转录成RNA,再由核糖体翻译成独特的蛋白质。这些蛋白质被称为组蛋白,它们以两组二聚体(H2A-H2B)和一个四聚体(H3-H4)的形式聚集,然后合并在一起,在细胞核中形成一个八边形的蛋白质(H2A-H2A-H3-H4),其他组蛋白则作为连接物(H1、H5)。表观遗传学编辑工作的重点是,在H2、H3和H4中的基因调节核心“组蛋白代码”。这样的表观遗传学,就好比取三个冰激凌筒,每个冰激凌筒都有成对的口味(4,2,2),我们需要将它们合并成一个新的八勺甜点塔。

细胞发展出了多种控制基因表达的方法,例如,对DNA包裹组蛋白紧密程度的调节,改变了基因的可及性,也影响了基因调控。在组蛋白顶部进行修饰,使染色质的精确开放和关闭成为可能。就像DNA修饰的目录一样,有一系列转译后修饰(PTMs)可以在组蛋白和其他蛋白质上发生。尤其是H3和H4组蛋白,它们有长长的尾巴,而这是用PTMs进行调整和修改的肥沃土壤。这些修饰代表了细胞控制各种基因、蛋白质活性及作用的“组蛋白密码”和“表观遗传密码”的一部分。组蛋白修饰涵盖了许多我们熟悉的概念,如甲基化和乙酰化,还包括诸如磷酸化、瓜氨酸化、SUMO化、ADP-核苷酸化和泛素化等变化。正如基因、物种和许多生物学模式一样,新的修饰类型仍在不断被研究人员所发现。总有一天,新的PTMs或组蛋白将出现在新的星球上,我们可以将它们带回地球并进行使用。

组蛋白代码本质上是一个巨大的开关板,影响着基因组在细胞类型和细胞反应中的表现。就像驾驶舱中的一大片彩色开关,专业人士可以用它来控制飞机的高度、速度和方向,但如果让孩子来操控飞机,就会出现灾难性的后果。因此,我们必须十分谨慎地切换组蛋白和细胞的表观遗传状态。负责添加及去除修饰的酶(本质上是飞行员打开或关闭开关)的命名非常恰当,例如,组蛋白甲基转移酶,是将甲基转移到组蛋白上;组蛋白乙酰转移酶,是将乙酰基转移到组蛋白上。此外,组蛋白的修饰有自己的命名法,这种命名法十分直白。第一,组蛋白的名称,如H3代表组蛋白3;第二,修饰在组蛋白尾部的位置,如K4代表第4个赖氨酸(氨基酸字母K);第三,修饰的种类,如Me代表甲基化,Ac代表乙酰化;第四,添加的修饰数量,如1、2、3分别代表单甲基化、双甲基化、三甲基化。通过修改各种组蛋白尾部的特定位点,我们可以(在理论上)改变细胞的状态、类型。

在2015年之前,让这些酶服务于人类的构想仍然像科幻小说一般。蒂莫西·雷迪(Timothy Reddy)和查尔斯·格斯巴赫(Charles Gersbach)发表了关于组蛋白修饰的研究成果,其特点体现为一种全新的构造,这为雅尼什实验室的研究铺平了道路。他们构建了一个基于CRISPR-Cas9的乙酰化转移酶,使用了失活的Cas9(dCas9)蛋白,让其与人类乙酰化转移酶(p300)的活性部分融合。这种融合蛋白使组蛋白H3在赖氨酸27(H3K4Ac)处发生乙酰化,导致启动子的目标基因及远离这些目标位点的基因(近端和远端增强子)被显著激活。此前,人们尝试过其他基于dCas9的激活剂,但它们的乙酰转移酶只使用单一的引导RNA来锁定其感兴趣的区域,因此只改变了来自增强子区域的基因表达。

雷迪和格斯巴赫的研究表明,他们的系统是模块化的,只要将他们的p300结构域与其他DNA结合蛋白融合,基本上就可以编辑任何DNA或修饰组蛋白。理论上来说,通过调整各种修饰的组合,无论何时何地,你都可以用一个基因做任何事。有了这些工具,我们就如同拥有了一个有意识的调节层,它位于基因组、转录组、蛋白质组、表观基因组和表观转录组之上,也就是表观-表观组。