- Published on
MCED介绍
- Authors
- Name
- Cookie
自古以来,帝王通过练丹以求长生,然终究未能逃脱人死灯灭之命,这其中奥秘一直无人可解。
千年之后,帝王丹炉的朱砂已成尘烟; 与此同时,近代生物学的发展揭示出,生命的有限性正来源于其体内细胞的凋零。
这看似是一种无法避免的宿命,一个令人唏嘘的事实。
但命运总爱在看似既定轨迹中埋下意外的种子:有一种细胞它们跳脱出了生命周期,可以不受控制地生长。
有人认为这正是通往长生的钥匙,可更多人说它是凶险的杀手,它在体内扩散,破坏,最终把人带向死亡。
这就是癌细胞。要对抗它们绝非易事,往往一个人在体内发现它们的踪迹时已经为时已晚。
于是有一家名为Grail的公司开发了一种早期多癌症检测技术,旨在在可以治愈的时候就发现它们。
DNA的构成
我们知道人体内的组织器官尽管外观和功能迥然不同,但都由更小的组成部分—细胞构成,比如肌肉中的肌细胞,或是肾脏中的肾细胞。
再把视界放大,这些细胞又由更小的成分—蛋白质构成,不同细胞所对应的蛋白质不尽相同。
而蛋白质是由氨基酸组成的具有一定空间结构的物质。 不同的蛋白质之间在结构,氨基酸序列上都不同。
自然会有人问,是什么促成了蛋白质的这些差异呢?答案就是你的基因。
我们知道,人体内有23对染色体,它们携带了全部的遗传信息。每一条染色体都由一个很长的DNA分子组成。
这条DNA分子上分布着基因,在基因之间存在着间隔序列(Intergenic Regions),间隔序列不直接参与蛋白质的编码,但提供类似控制面板的功能。
比如启动子(Promoter)决定基因是否转录以及何时转录,这样就可以让如肌凝蛋白基因只在肌肉细胞里进行表达,而在神经细胞里保持关闭。
DNA整体呈一种双螺旋结构,两边链上有互补配对链接的碱基。
碱基分子共有四种:腺嘌呤A(adenine), 鸟嘌呤G(gaunine), 胞嘧啶C(cytosine)和, 胸腺嘧啶T(thymine) ,A的另一边一定是T,C的另一边一定是G。
这种性质意味着,若把两条链分开,各自配上另一边的碱基,就可以得到两条一模一样的DNA。
我们所说的基因实际上就是一段碱基序列。
蛋白质的生产
蛋白质在生物体内的产生主要是通过“基因表达”过程,这个过程大致可以分为两个主要步骤:转录和翻译。
转录就是利用这种互补的性质复制DNA上的一条链(DNA在复制时会暂时打开),得到一条mRNA单链。RNA分子的结构与DNA相似,但在关键方面有所不同。
首先,主链中的脱氧核糖(DNA中的D)被核糖(RNA中的R)所代替。
其次,该分子是单链的。最后,胸腺嘧啶(T)碱基被尿嘧啶(U)所代替,但配对保持不变。
mRNA进入细胞质,就会根据其上面的碱基以三联体的形式被转换成蛋白质(A、T/U、C和G可以组成64种可能的三字母密码)。
例如,在这个密码系统中,AUG的意思是“从这里开始”(称作“起始密码子”);UAG、UGA和UAA的意思是“在这里结束”;其余的部分都与特定氨基酸有关联——例如,半胱氨酸是UGU或UGC。
因为三联体密码有64种可能的组合,却只有20种氨基酸,所以某些氨基酸有不止一个三联体密码。
因此,显而易见,改变了单个碱基的突变可以从根本上改变最终的蛋白质。
例如,从UGC(半胱氨酸)变成UGA(停止信号)会让最终得到的蛋白质变短,其功能也可能发生重大的变化。
当错误的编码被翻译成了蛋白质,或者对编码的控制失灵,癌症就产生了。
肿瘤的特征
既然癌细胞是一些在转录翻译时出错的细胞,那正常的细胞,究竟要犯多少错误,才会成为癌细胞呢?2000年,Douglas Hanahan和Robert Weinberg表了一篇题为《肿瘤的特征》(“The Hallmarks of Cancer”)的开创性论文,总结了哪些变化是肿瘤产生的充分必要条件。
这些变化的特点是:
- 自给自足的生长信号(Self-sufficiency in growth signals)。
- 失去对生长抑制信号的敏感性(Insensitivity to anti-growth signals)。
- 无法进行“程序性的细胞死亡”,(Evasion of programmed cell death)。有机体用细胞凋亡来摆脱异常的细胞,癌症细胞的凋亡机制并不是完全关闭,化疗或放疗损伤的细胞并不是直接死亡,而是奄奄一息,随后细胞的死亡仍然由凋亡机制实现。
- 无限的复制潜力(Limitless replicative potential)。
- 能够在其他组织中生长并破坏性地侵袭后者(Tissue invasion & metastasis)。良性肿瘤和恶性肿瘤间一个重要的区分特征就是后者会扩散和侵袭。同时,良性肿瘤也会有严重的后果,比如压迫脑组织或神经。
- 能够通过产生新的血管来维持生长(Sustained angiogenesis)。任何直径大于0.1毫米的细胞的集合都需要血液供给。肿瘤的血管于正常血管来源于不同的基因,因此也常被作为肿瘤药物开发的靶子(靶向分子疗法)。如果能破坏供血,就能阻止它生长。
Galleri检测原理
在他们官网引用的文献中可以看到,癌症的早期检测基于血液中游离DNA的甲基化特征。
The MCED test investigated in this study detects cancer-specific DNA methylation patterns from cell-free DNA (cfDNA) shed by tumours into circulating blood.
游离DNA(Cell-free DNA)
细胞在死亡时会释放DNA碎片进入血液,游离DNA指得就是脱离了细胞而处于血液循环中的DNA。
尽管许多癌细胞逃避某些“程序性细胞死亡”途径,但肿瘤环境复杂而动态,导致足够的细胞周转、坏死和活性DNA释放,从而使cfDNA(包括肿瘤特异性DNA)出现在血液中。
DNA 甲基化(methylation)
DNA 甲基化是一种“表观遗传”修饰——这意味着它不会改变 DNA 序列中的碱基(A、T、C、G),而是在某些 DNA 碱基(通常是胞嘧啶)上添加小的化学标签(甲基)。
癌细胞通常表现出下面两个甲基化特征:
- 特定区域的高甲基化:当额外的甲基团在其启动子区域积累时,癌细胞抑制基因(通常控制细胞生长的基因)可能会异常沉默。
- 其他区域的低甲基化:特定区域高甲基化的同时,基因组中正常甲基化的部分可能会失去甲基,导致促进癌细胞生长的基因不适当激活。
不同的癌症具有不同的甲基化特征,这些特征就类似超市里的条形码,通过扫码你就能知道癌症是否存在,如果是的话,又是位于哪一个区域。
MCED检测流程
采血
与常规血液检测类似,使用含稳定剂的专用采血管采集10-20毫升血液样本。稳定剂可防止白细胞裂解释放额外DNA,避免稀释肿瘤特异性循环游离DNA(cdDNA)信号。
游离DNA分离
样本采集后需经30-60分钟离心处理,分离血浆(液态成分)与血细胞成分(红/白细胞),最大限度降低污染风险,所得产物称为"无细胞血浆"(cell-free plasma)。
接着通过商用试剂盒在特定化学条件下进行DNA结合,最终将cfDNA释放至50–100微升缓冲液中。实验室需精细分离血液中cfDNA片段与其他成分,所获cfDNA的纯度与完整性对MCED检测准确性至关重要。
手动提取全程耗时约1–2小时(视批次规模与试剂方案而异)。自动化平台虽能减少人工操作并提升通量,但总耗时仍相近。基础研究实验室中,单样本成本约50–150美元(含试剂+人工+耗材)。
亚硫酸氢盐转化(Bisulfite Conversion)或类似处理
甲基化标记在标准测序中是不可见的。需要通过简介的方法来识别。通过亚硫酸氢盐转化,非甲基化的胞嘧啶(C)会被转化成胸腺嘧啶(T),而甲基化的胞嘧啶则保持原状态。于是通过对比处理前后序列,就可找到甲基化位置。该步骤通常耗时3-6小时,单样本成本约30–50美元(含材料与人工)。
DNA 测序与机器学习分析
DNA测序的样本在业界被叫做文库(library)。就如同我们对图书进行索引和组织,以便日后可以通过编码进行快速查找, 文库的制备把原始的DNA转化成测序仪可以读取的特殊片段。
随后通过测序确定DNA碱基A/T/C/G的精确序列。商用MCED检测一般分析特定的基因组区域(与之相对的是全基因组测序),聚焦最具癌症指示性的甲基化位点以降低成本。此环节为全流程最昂贵步骤,单样本成本200–500美元。
测序仪软件将荧光信号转化为碱基序列后,机器学习系统对海量数据进行分析。根据数据量,此阶段计算耗时几分钟到数小时,单样本计算成本5–50+美元(另含人工费用)。