他能够拿到的全球人体数据的渠道一下扩展了许多,随着时间推移,这些数据更是给他带来了许多意想不到的惊喜。
思虑之中,顾青点开了一份加密文件。
一组组类基因组,又称人类基因体的资料,出现在他的面前。
人的基因组,由23对染色体组成,其中包括22对常染色体,1对性染色体。
基因组含有约31.6亿个dna碱基对,碱基对是以氢键相结合的两个含氮碱基,以胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤四种碱基排列成碱基序列,其中一部分的碱基对组成了大约20000到25000个基因。
看着面前这些资料,顾青的眼神深邃。
“夏阴星历1001年,蓝星六国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果,两年后年公布了人类基因组序列草图。
由于当时的技术限制,当初的人类基因组计划留下了大约8%的空白间隙。
在这一份人类基因组序列草图中,人类基因组的绝大部分区域已经能够通过测序进行读码,其中真正属于编码蛋白质基因的部分只占到1%,剩下99%的区域包含着大量突变,是不编码蛋白质序列的片段,因此,也曾被当时的科学家称为‘垃圾序列’。
但在后续研究中发现,这些所谓的‘垃圾序列’中也包含着很多与基因本身的调控功能有重要联系的序列区域,对编码蛋白质的基因区域有调控作用。
只不过要想对它进行测序,困难重重,因为其中存在着大量重复序列,当时的测序方法难以应对。
升级技术,使用纳米孔技术,actg四种不同碱基分别被卡住时,所反映的电位不同,从而可以快速识别出卡住的是哪一个碱基,提高了读码效率。
用电信号将dna链一口气读下来,填补遗留的8%空白,再使用我在神经信号翻译技术获得的相关科技……”