2023年,有一台测序仪,它能在48小时内完成一个人的全基因组重测序,而且成本不足1000美元。
而在十年前,这个数字是100万美元。
数据的洪流汹涌而至,但智慧的航船却还在港口徘徊。
若是将人类基因组视作一本由30亿个“字母”所撰写而成的天书,那么重测序便是逐一核对不同版本的工作人员,他们起着校对作用。
咱手上持有一本官方所定的“标准版”,也就是参考基因组。当下,我们得去找出你那份、我这份、他那份私人版本当中存在的那些错别字,具体来说,像单个字母出现差别的情况,即SNP ,还有段落出现缺失或者重复,也就是InDel ,甚至是整页出现如同乾坤大挪移般的变动,即SV。
这听起来像一场精确的侦探游戏。
富有时尚感的从事科研工作之人挥动着着重于再度进行测序的旗帜之物看起来如果进行了测序那么真理就会自行现身出来。
然而,现实是残酷的,我们在发现差异这件事上颇为擅长,可对于差异的含义,却常常处于不懂的状态。
1. 疾病狩猎场
医生会去对比癌症患者肿瘤组织的重测序数据和正常血液的相关数据,尝试着去找到那个驱动细胞发生癌变的“主谋”突变。
然而具有讽刺意味的是,数量极为庞大的被捕获的变异皆为“乘客”,并无实质影响。我们投入了巨额资金以及强大算力,获取了成千上万条线索,其中百分之九十九仅仅是无意义的信息。
2. 人类迁徙图

科学家借助进行重测序,针对全球不同人群的基因组展开操作,进而能够去勾勒出相关祖先走出非洲的路线。
这着实浪漫,然而结论有时违背常理,两个非洲部落之间存在的基因差异,或许比一个中国人同一个英国人的差异还要大,“种族”这个社会概念,在基因面前脆弱得不堪一击。
3. 农业育种术
原先是耐盐水稻,后来是高产奶牛,因之重测序,育种过程从那种像瞎猫碰死耗子般的状况,转变成为有着定向导航的情形了。
在这样的情况下,我们得到了堪称完美的具有抗病能力的香蕉,其所有植株的基因近乎完全相同,然而,随后一种全新的病菌横空出世,致使整个产业在一夜之间化为乌有,重新进行测序给了我们如同放大镜般的工具,可我们却利用它将鸡蛋放置在了同一个篮子当中。
传统PCR技术,只能死死地盯着,那几个熟悉的基因片段,就如同,拿着手电筒,去寻找钥匙一般。
那全基因组重测序,就如同于正午时分阳光照耀下俯瞰一整片大陆的那般情形,每个角落都是清晰可见的,然而,你所要寻觅的那把钥匙,有可能是被淹没在了30亿个光点当中。
我们收集了数量极其庞大的A、T、C、G,然而对于生命语言自身的语法却全然知晓甚少。
测序仪在每分钟所吐出的数据量方面,已然超过了一个人终其一生能够阅读的文字总量。可是,能够真正去读懂“基因错别字”背后所蕴含含义的人,数量稀少如同清晨屈指可数的星星。
因此,在下一回你瞅见“全基因组重测序揭示XX奥秘”这般的新闻之际,不妨再多问上那么一句:
他们只是找到了差异,还是真的理解了差异?
或许,我们已然获取了天书的每一个字母,然而,距离讲出一个完整的故事,还差得极其遥远。

