出思疑人容颜,那我们得以从DNA复原一人的长相吧

(vicko238/编译)他有着褐色卷发,蓝色或绿色的双眼,以及近乎黑色的皮肤。这样的组合在现代并不常见,可基因信息却表明,一万年前居住在英国的切达人(Cheddar
Man)就是这幅面孔。

DNA技术破了一桩谜案,这则新闻在科技圈火了好一阵子,仅用DNA就“画”出了陌生人的相貌。

  1. Frentiu FD, et al. (2008) Pedigree-free animal models: the
    relatedness matrix reloaded. Proc Biol Sci / R Soc
    275(1635):639–647.

头发的颜色对于咱们中国的警察可能用处不大,不过在美国那种多种族的国家,如果警方可以从基因获得发色信息的话,对警方的抓捕,比如做罪犯心理画像,会起到极大的帮助。

新浦京www81707con 1自然历史博物馆(伦敦)复原出的切达人复原头像。图片来源:Channel
4

文丨饭范

动物模型通常需要已知的遗传家谱来估计定量遗传参数。在这里我们测试动物模型是否可以基于完全源自分子标记数据的相关性的估计。我们的案例研究是野生鸟类的形态,我们报告的遗传方差协方差矩阵(G)六个形态特征的使用三种方法:传统的动物模型;基于分子标记的方法基于Ritland成对回归法估计遗传率;以及使用布置在关联矩阵(R)中的分子系谱来替代动物模型中的谱系的新方法。使用传统的动物模型,我们发现所有六个性状和积极的遗传协方差性状的重大遗传变异。成对回归方法没有返回该群体中定量遗传参数的可靠估计,遗传方差和协方差的估计通常非常小或为负。相比之下,我们发现使用无血统动物模型的混合证据。与成对回归方法类似,当使用基于分子谱的全秩R矩阵时,无系谱方法表现不佳。然而,当我们降低R矩阵的维数以便最大化信噪比时,性能显着改善使用降序R矩阵产生的遗传方差的估计更接近那些从传统模型。然而,这种方法在估计协方差方面不太可靠,通常估计为负值。总之,这些结果表明无血统动物模型可以恢复定量遗传信息,虽然信号仍然相对较弱。仍然需要确定这个问题是否可以通过使用更强大的电池分子标记和改进的家谱重建方法来克服

发色藏在基因里

来自荷兰Erasmus大学医学研究中心的Manfred
Kayser以及他的研究小组通过对数以百计的欧洲人进行发色和DNA的研究,发现发色这一人类特征信息是“隐藏”在DNA中的。

研究小组从人类的11个基因中发现了13个决定发色的特殊“DNA标记”,他们认为只要对这些标记加以记录和识别,发色这个关键信息就可以从DNA信息中“脱颖而出”了。

目前这项研究对于红色和黑色头发的识别率高达9成,而对金发和棕发的探测率也超过了8成。更新奇的是,这项以基因为基础的探测手段甚至可以区分非常相近的发色,例如“发红的金色”以及“暗金色”这两种诡异的发色。

切达人不是什么新发现了。他曾是个20岁出头的年轻男人。1903年,这具英国最古老的完整人骨发现在英格兰西南部的一个山洞内。直到最近,科学家才有能力从他的核DNA内复原出外貌特征。模型推算告诉人们,切达人肤色是深棕甚至黑色,与之前想象的白皮肤相距甚远。

犯罪分子敢留下DNA,他将无所遁形。

1.引言

动物模型对野生种群的应用有可能彻底改变我们对自然环境中进化遗传学的理解(Kruuk
2004)。这是因为在最广泛的意义上,动物模型是简单的基于个体的混合模型,使用已知的谱系来估计个体之间的相关性,从而估计一定范围的定量遗传参数(Lynch&Walsh
1998)。动物模型为研究野生种群提供这样的前景的关键原因是,这种方法可以使用天然谱系在自然条件下提取定量遗传信息。相比之下,大多数定量遗传技术需要育种实验,因此主要限于实验室或农业研究(Falconer&Mackay
1996)。动物模型现已应用于许多人群,以解决各种问题,如健康遗传(Kruuk等人,2000),进化停滞(MerilaĄL等人2001;
Kruuk等人2002),性选择和着色Hadfield&Owens 2006;
Hadfield等人2006,2007),条件依赖(Gleeson等人2005),亲本关怀(MacColl&Hatchwell
2003),收获的遗传后果(Coltman等人2003)和进化反应气候变化(Brommer et
al。2005)。然而,对动物模型方法的这种广泛关注导致认识到对已知谱系的需要本身是一种限制。使用动物模型到目前为止的大多数研究关注的是已经成为长期项目主题的人群(Kruuk
et al.2000,2001,2002;MerilaĄL&Sheldon 2000;MerilaĄLet al.2001; Coltman
et al。 2003; Garant等人2004,2005; McCleery等人2004;
Charmantier等人2006a,b)。*对于个体交配和繁殖模式的长期信息的需要限制了可以使用动物模型的群体的范围和类型。克服这种限制的一种方法是使用分子标记数据来估计群体中个体之间的遗传关系,然后使用所得的相关性矩阵代替已知的谱系来构建动物模型\出思疑人容颜,那我们得以从DNA复原一人的长相吧。(Lynch&Walsh
1998; Garant& Kruuk 2005; Rodr
?sguez-Ramilo等人2007)。这种方法可以允许动物模型框架扩展到任何人口,有可能基于分子标记数据获得可靠的相关性估计(Moore&Kukuk
2002),这将大大扩展潜在应用范围,如果该方法被证明稳健。然而,这种方法尚未在任何人口中得到充分实施。因此,本研究的总体目的是测试动物模型是否确实可以基于完全源于分子标记数据的相关性的估计。

使用来自分子标记数据的相关性估计来估计定量遗传参数的想法已经被许多工作者研究(Mousseau等人1998;
Thomas&Hill 2000; Thomas等人2000; Thomas
2005)特别是由Ritland开发的(1996,2000a,b; Ritland&Ritland
1996)。虽然RitlandĄŚs方法在概念上类似于我们在这里讨论的无血统动物模型,但两者之间存在主要差异。其中最重要的是RitlandĄSs方法基于对遗传相关性的成对估计的表型相似性的回归成对估计(Ritland
1996)。这种方法的局限性包括由于相关性估计的非独立性而导致的估计显着性的困难,并且力矩相关性测量方法不提供在整个人群内部一致的估计。相比之下,我们在这里探讨的无血统动物模型方法是基于肯定的相关性矩阵(即多个个体之间的相关性是一致的),并且允许动物模型的全部功能(和方便性)应用于估计定量遗传参数。我们将无血统动物模型应用于在澳大利亚大堡礁上的小珊瑚礁Heron岛上的自由生活的摩羯座(Zosterops
lateralis
chlorocephalus)的例子。这个研究人群非常适合我们的需要,因为我们可以从行为信息构建已知的谱系(Kikkawa&Wilson
1983; Robertson et
al。2001),我们以前用来估计遗传力和遗传相关性的一系列形态性状基于谱系的动物模型(Frentiu
et
al。2007)。此外,我们有一个数据集,包括在交叉培育实验中使用的个人(Frentiu等人2007),最大限度地减少了共享基因的影响被共享环境的影响膨胀的程度。最后,这种鸟类群体的形态学的定量遗传基础是内在的兴趣,因为它是一个异常大的岛屿种族的例子,显示了岛屿雀形目鸟类的特征模式(Clegg&Owens
2002),演化到大约40% (Clegg等人2002a,b; Robinson-Wolrath&Owens
2003; Scott等人2003;
Frentiu等人2007)中大于其大陆对应物。研究的具体目的是:(i)开发一系列多态分子标记,并确定它们是否能够区分近亲(完全兄弟)和无关个体,(ii)估计六个形态性状的定量遗传参数,使用RitlandĄŚs成对回归方法,并将这些与基于谱系的传统动物模型的估计进行比较,(iii)使用分子谱系开发无系谱动物模型,(iv)确定无谱系与传统动物模型的有效性在估计定量遗传参数,和(v)探索增加分子谱系方法的力量的方法。

一滴血就可以重建整个人?

从DNA所提供的信息中推测人类的“表现型”(即一个人的外部特征,如头发或瞳孔的颜色)是法医学中一个刚刚兴起的领域。

利用基因识别,我们可以将在犯罪现场采集到的DNA与已知嫌疑人作对比,或者在数据库中寻找其他与信息相符的资料。但是如果这两种尝试都一无所获怎么办?

这时候,如果我们可以利用基因数据将这个人“重建”的话,那破案就可谓是信手拈来了。但是目前,只有少量的表现型可以通过DNA信息较为准确地识别并付诸实际应用(比如我们之前提到的年龄和发色)。不过一切都在有条不紊的发展中,
Kayser目前正在着力于研究如何从基因型中检测携带者瞳孔的颜色。

这项研究的创始人Kayser对这些新技术充满信心,他相信在不远的将来,一定会有一套完备的DNA发色检测的系统,用于法医调查。DNA将给法医帮更多的忙。

发色、年龄、瞳孔颜色,其实有了这三项就已经帮警方省去不少力气了。相信有一天,新技术一定会推出那种只要滴一滴血,你的三维图像就立马显示在屏幕上的超夸张装备……

这些信息来自于切达人颅骨较厚的侧部提取到的DNA。我们的基因像是一部代码脚本,而某些代码将指向特定的外貌特征,这称为遗传标记。而现在,部分遗传标记与外貌间的联系已被破译。

整容,DNA也能让ta“原形毕露

找回丢失的色彩

作为斯坦福大学的法医人类学家,布丽吉特·阿奇-赫威特(Bridget
Algee-Hewitt)的工作之一是鉴定美国与墨西哥边境线上的死者身份。边境线很长,有些遗体发现时已化成白骨。曾经的法医人类学技术只能得出死者的性别、年龄、身高等大体信息,光靠这些,你仍然不能确定死者是谁。

但加上DNA就不一样了。

通过遗传信息对瞳色、发色及肤色的推断,再对比失踪人口,确定边境线上死者身份的可能性就大多了。

“你收集的数据越多、分析的DNA越多,生成的统计模型就越好,成功率也会更高。这项技术已经是有效的,它的估算协议是有意义的,所以问题在于收集更多的数据来完善它。”布丽吉特这样说。

新浦京www81707con 2预测瞳色的IrisPlex系统与预测发色的HirisPlex系统。图片来源:参考文献1,
图八。

对外表特征的估算建立在统计模型的基础上,这一技术已能较准确的得出一个人的瞳色、肤色与发色。法医生物学家曼弗雷·凯瑟(Manfred
Kayser )与苏珊·沃什(Susan
Walsh)是这一领域的先驱。在2010年,他们研发了IrisPlex系统,这个系统可以用六个遗传标记来确定一个人眼睛是蓝色还是棕色的。到2012年,他们加上预测发色的标记,新模型对金发、棕发、红发、黑发的测算平均正确率分别达到了69.5%、78.5%、80%和87.5%。到2017年,他们把肤色按深浅分为5度,又研发出预测肤色的模型。他们的测试在网上公开,任何掌握遗传数据的人都可以上去一试(

苏珊·沃什现为印第安纳大学生物系助理教授,2016年接受采访时,她确定现有的DNA外貌复原技术并非无所不能。她认为,测算人是蓝眼睛还是棕眼睛的技术比较容易,把肤色分级后的预测成功率也能达到80%以上。至于下一步,她希望能够通过遗传信息复原瞳孔、头发和皮肤上更精准的连续色,但技术还没发展到那一步。同样地,她也认为现有技术不能复原出一个人的整张脸。

“现在,有些人向警方宣传他们可以制作面部复原图像,这太超前了。”沃什说,“色素(的预测)可以做,面部重建做不到。”

新浦京www81707con 3五度肤色预测。图片来源:参考文献1,图三。

想知道,未来孩子长什么样

能从一滴血算出整张脸吗?

虽然沃什认为用DNA复原全脸信息为时尚早,但市面上已经有公司提供收费的面部复原服务,并接受警方的委托。

对警方来说,这也许是没有办法的办法。犯罪嫌疑人留下的DNA如果无法在数据库中发现匹配的记录,那么警方依然对其所知甚少。而Parabon
Nano
Labs公司提供的“快照”服务(Snapshot),是根据遗传信息生成个人的面部肖像,从而帮助警方缩小搜查范围。

2016年,美国奥罗拉市警方购买了两张嫌疑犯“快照”,单张价格超过3600美元。这两张照片描绘了同一个男子不同时期的样貌,一张上是推测的作案年龄:25岁,另一张是55岁的样子。1984年1月的一天,警方接到报案:在家族经营的家具店工作的男子没有去上班,他的母亲驱车到家中探望,见到了无法想象的恐怖场景:这名男子头部遭受锤击,喉咙割开,妻子被刺身亡,两人七岁的大女儿死前遭到性侵,三岁的小女儿面部骨折但仍然活着。这个案子至今未破。根据遗留的DNA和作案手法推断,凶手至少要对该案在内的四起袭击负责,但数据库内找不到任何匹配的信息。

新鲜出炉的两张照片让奥罗拉市警方32年来第一次对嫌犯外貌有了概念:白人,浅色头发,蓝色或绿色眼睛,可能有少量雀斑。年轻的他就像个大学毕业生,看起来十分普通。警探康纳(
Steve Conner )承认这项服务并不便宜,但
“’快照’是最后手段了,我们已经用到了能用的一切。”他说,“这项技术让我们排除掉数百万人,但我们仍没有锁定嫌疑人。”

新浦京www81707con 4奥罗拉市警方公布的嫌疑犯25岁时的“快照”。
图片来源:Parabon

包括苏珊·沃什在内的一些人对Parabon系统抱有怀疑。由于这家公司未公开数据来源和算法,所以很难去评估它的预测能力。另外,他们的方法也没有在同行评议审查的情况下发表。目前,Parabon公司声明快照将与其他调查信息配合使用,缩小嫌疑人范围,而不会用于锁定嫌疑人。

两张快照发布后的几周里,奥罗拉市警方的电话被打爆,但真正的线索寥寥。“也许五年后,他们可以改进系统的功能。”警探康纳说。

新浦京www81707con 5 志愿者照片和Parabon系统生成的肖像。图片来源:Parabon

血统、瞳色、发色等快照提供的信息虽然有用,但对警方来说还不够。奥罗拉市警方寻找的嫌疑人也许已经秃顶,或是肥胖,也许是骨瘦如柴的瘾君子。快照也不能反映出身高。

那么,DNA能重建一张信息更丰富的全身照吗?

邮寄一份DNA

全身复原能做到吗?

2017年机器学习技术运用到了DNA外貌复原领域,研究快速深入发展。但现有能力的边界在哪里,还在激烈讨论中。

去年,美国人类长寿公司(Human
Longevity)声称可根据遗传信息重建全身肖像。公司创始人克莱格·文特尔(Craig
Venter)是基因研究领域的风云人物,曾领导与人类基因组计划竞争的商业研究,并在2010年宣称造出合成细胞。尽管如此,人类长寿公司的此次研究遭到许多著名学者的质疑。这项研究对约一千个人的生理特征进行了详细测量,并完成了全基因组测序。由这些数据构建出测算模型将可以预测三维面部结构、声音、生理年龄、身高、BMI指数、瞳色以及肤色。不过,批评声音认为研究结果言过其实。有人指出模型似乎是根据性别、血统等因素构建平均面孔,而不是每个人独特的样子。对于少数族裔混血人群的预测方法也遭到了批评。

新浦京www81707con 6人类长寿公司创始人克莱格·文特尔。图片来源:Wikimedia
Commons

被称为“染色体黑客”的雅尼夫·艾力西(Yaniv
Erlich)是质疑队伍中的一员,现为哥伦比亚大学计算基因组学实验室的负责人。即使存在准确的面部预测,艾力西认为,若要测算现实世界中的某个人,一个难题在于我们必须建立人口规模的数据库。这个数据库里,每个我们想鉴定的人的身高、面部形态、数字化声音特征等信息都要收录进来。没有详细的生物测量数据库,就不可能把生理测算精确到个人。

测给你看

那么未来呢?

只要看看同卵双胞胎,就知道DNA对人外貌的影响有多大。问题是我们能破解多少DNA与外貌间的关联,而这又需要多久呢?

有些特征是相对容易预测的。比如瞳色,影响这个性状的基因变异相对较少。而另外一些被众多基因影响的特征,预测起来就更难。以最近一项对发色的研究为例:研究者检测了30万欧洲血统者后,发现了110个与发色有关的新遗传标记,但是它们对黑发、红发的预测要比对金发、褐发的预测更靠谱。

另外,血统不同,DNA对我们生理特征编码的方式可能也存在差异。如今,对现代欧洲人的外表预测好于对其他族群,因为现有数据库中大部分遗传数据都来自欧洲血统者。

在未来,日益完备的机器学习技术将运用于DNA外貌预测领域,技术之外,我们同样需要更大的、能代表多个群体的数据库。虽然对现有技术的能力范围存在争议,但我们能破解的DNA与外貌间的关联,只会越来越多。(编辑:Ent)

参考文献

  1. Walsh, S., Chaitanya, L., Breslin, K.,Muralidharan, C. Bronikowska,
    A., Pospiech, E., Koller, J.,  Kovatsi, L., Wollstein, A., Branicki,
    W., Liu, F. And Kayse, M., 2017. Global skin colour prediction from
    DNA. Human Genetics, 136(7), pp. 847-863.
  2. Walsh, S.,Liu,F., Wollstein, A., Kovatsib, L., Ralf, A.,
    Kosiniak-Kamysz, A., Branickid, W. And Kayser, M., 2013. The
    HIrisPlex system for simultaneous prediction of hair and eye colour
    from DNA. Forensic Science International: Genetics. 7(1),
    pp.98-115.
  3. Cheddar Man: DNA shows early Briton had dark skin.
    .
  4. Could DNA phenotyping construct a likeness of the Gold Coast rapist?

题图来源:Parabon

德克萨斯州中部一起谋杀案,嫌疑人一年后向警察局自首

因为,无路可逃

本案于2017-11-16告破,由美国德州布朗县(Brown
County,TX)警方向媒体通报。事情是这样子的,据外媒报道,美国德州的一名男子,日前向警方自首,承认自己曾犯下了谋杀恶行,而促使他自首的,不仅仅是“未灭的良知”,还有科学的强大力量—DNA画像

而案子本身,则发生在2016年的五月,案发之时,一名叫做朗达·金黛·布兰克西普(Rhonda
Chantay
Blankinship)的女孩失踪了。几天后,她的家人在自家地下室里找到了她的遗体,仅25岁。

案发之后,当地警方展开了积极的排查工作,但一直都没有可用的线索,案子侦查一度陷入僵局,眼看就要成为一庄谜案。

新浦京www81707con ,图:朗达·布兰克西普小姐芳容

黑科技:DNA画像,协助警方破解谜案

科技,让社会更安全

警方手里还有一张“王牌”,那就是在现场提取到的凶手的DNA。遗憾的是,这个DNA放到FBI的全国数据库里比对,并未发现匹配的结果。

也就是说,这个凶手之前从未犯过事,库里没有他的记录。如果要把这个DNA和附近所有男性的DNA比对,一个是工作量太大,二来其他人也没有义务配合啊。

警方联系了一家叫“Snapshot”的公司,这家公司用DNA“画”出了犯罪嫌疑人。原理也不复杂:既然我们每个人的外貌特征,基础都是遗传信息,那只要解读某人DNA,就能大致还原出此人的外貌特征,比如脸型、发际线、肤色、虹膜颜色、发色等信息,从而“画出”一张该DNA主人的面部模拟画像来。当然,随着人的成长,外貌也会受到许多和DNA无关的东西的影响,但大体的框架应该还是比较稳定的。

而在本案之中,该公司实验室经过反复测算,就推测出了凶手的面容,大概就是下面这个样子:

图:本案凶手的模拟画像

警方随即把这张画像公布在社交媒体上,呼吁广大群众协助警方调查,有没有见过长得类似的人?

还好这个城市并不大,周围大家都是邻里关系,抬头不见低头见,犯罪分子很难不被人认出来。

年轻俊美的年轻人,自首承认罪行

DNA检测立了大功

图:犯罪嫌疑人真容

不出所料,这张模拟画像效果拔群:11月9日,一名嫌疑人向警方自首了。这个嫌疑人名叫瑞恩·里格斯(Ryan
Riggs),现年21岁,当地居民,甚至和受害人住在同一个街区。

里格斯讲了一些犯罪细节,都是警方尚未公布的,比如受害人遇害前曾遭性侵这个细节,所以高度怀疑他的确就是本案凶手。当然,怀疑不等于事实,等到DNA比对结果出来,案子就应该能够水落石出了,警方表示。

警方还表示,当初排查时他们完全没有怀疑过瑞恩,所以当他自首时,警方也吃了一惊。

未来生活更安全

畅想未来

未来,犯罪分子整容都没用了!警察可以靠DNA能“画”出了整容前的颜值,再加上“面部识别系统”已在全国大面积铺开,那么,犯罪分子将更加无所遁形。

目前,瑞恩·里格斯已被逮捕,并且不准取保候审。

相关文章