说到全基因组重测序, 听起来好似是那种特别高大上的实验室用语, 然而要是你把它拆开来看的话, 实际上就是将某一个个体的DNA自始至终全都读上一遍, 接着再跟原本的参考基因组做对照 , 这二者的样子跟做比对之间的关联呢, 就如同是你拿着一本标准模样呈现具体内容的《人类使用手册》, 要去比较一下你手里的那张经过定制后呈现别样模样的纸到底更改了哪些页码, 又多了哪些注解, 还删去了哪些章节。
那么, 问题出现了: 为一个样本做费用达几万块钱的重测序, 究竟能够挖掘出什么来呢?
谈论第一个价值, 那便是突变检测, 这并非如同那种“你相较于他人多存有一个基因”这般的童话故事那般简单, 实则是确切无疑的SNP、InDel、SV、CNV, 其中SNP恰似作文之中出现的错别字, InDel是书写之时存在漏写抑或是书写了多余的字的情况, SV是整段整段的内容被调换了位置, 而CNV则是某一段落被复印了几十遍或者干脆被丢弃了。一旦这些变异被定位, 就能够解释你为何比其他人更容易患上某种疾病, 为何你对某类药物不敏感, 为何某个性状在群体当中呈现得这般极端。
第二个维度是群体结构, 若你手中持有100个样本在其中能据此构建一棵, 且能够提出关于谁与谁存在亲属关系类似谁哪位的先辈源自何处这样一些并不浅显的疑问。这并非是毫无深意的闲聊内容, 而是育种以及医学领域的根基所在。举例来说, 要是你想要弄明白某一品系的植株之所以具备抗病能力的缘由, 那么你就得清楚它的“社交圈子”内部哪些成员抗病, 哪些不抗病, 进而寻得那个起到关键作用的共同变异。

有关第三个层次, 那便是功能注释, 测序仅仅是一种手段, 而解读才是最终的目的, 你所寻得的变异究竟是如同“哑巴符号”一般, 还是类似“说明书里的加粗警示描述”, 这就要求你将变异映射放置在已知的基因区域处, 抑或是调控元件范围里头, 还有非编码RNA之上, 到了这个时候, 你所从事的便不再是单纯的“对比差异”行为, 而是一种名为“翻译命运”式的操作了。
你觉得这样就结束了吗? 要记住时间维度哦。全基因组重测序能够让你得到一个群体的演化趋向, 举例来说, 在某类品种走向驯化之进程时, 哪些基因被选上了, 哪些基因被排除在外了。这就好似一位考古从事者, 不但挖掘出了骨骼架构, 还能将它生前食用过什么, 居住于何处, 以及与谁有过争斗告知你。
所以, 在你做出进行全基因组重测序的决定之际, 你所购置的, 并非仅仅只是数据, 而是一份针对样本的“家底档案”。这个档案会向你传达: 你在身份层面是怎样的、你源自哪里、你的能力范畴包括什么、你可能存在何种隐患。那些“行业内的隐晦术语”背后隐含的逻辑, 从本质上来说, 是一次严谨细密的推理——是要从数亿个碱基当中寻觅出那几个能够改写人命运走向的差异所在。
又来了一个问题: 你所拿到的这份报告, 真的能够“看懂吗”? 要是你的分析团队仅仅是知悉跑流程, 却不懂得生物学逻辑,那么这些数据就只会变为一堆数字垃圾。真正的价值, 隐匿于那些被挑选出来的变异背后的生物学解释之中——而这, 才是全基因组重测序的真正“重”点。

