人民網(wǎng)健康·生活

迄今最全面人類基因組測(cè)序完成

比原圖增加2億堿基對(duì)和2000多個(gè)基因

2021年06月02日08:14 來源:科技日?qǐng)?bào)

  20年前,科學(xué)家宣布讀取了一個(gè)人的全部脫氧核糖核酸(DNA),其實(shí),他們漏掉了少許,F(xiàn)在,由于讀取DNA方法的改進(jìn),科學(xué)家終于可以從頭到尾讀取人類的全部基因組了!據(jù)生物預(yù)印本網(wǎng)站(biorxiv)近日?qǐng)?bào)道,美國(guó)科學(xué)家對(duì)全部人類基因組30.55億個(gè)堿基對(duì)進(jìn)行了測(cè)序,與此前結(jié)果相比,新結(jié)果增加了2億個(gè)堿基對(duì)以及2000多個(gè)基因。

  人類擁有數(shù)萬個(gè)基因,它們儲(chǔ)存于DNA分子中,基因信息以4種堿基(C、G、T和A)的形式存在,兩個(gè)堿基相互配對(duì)形成堿基對(duì)。

  科學(xué)家于1990年啟動(dòng)了人類基因組測(cè)序項(xiàng)目,并于2001年公布了首個(gè)人類基因組草圖。但當(dāng)時(shí)不得不將基因組分成小段讀取,然后重新組裝在一起,而這樣無法將一些高度重復(fù)的片段放回原位。隨后遺傳學(xué)家繼續(xù)改進(jìn),但重點(diǎn)還是放在提高現(xiàn)有序列的精確度,而非增加新序列,仍有約8%的序列缺失或錯(cuò)誤。

  新版本基因組由“端粒到端!保═2T)聯(lián)盟繪制。該聯(lián)盟由加州大學(xué)圣克魯斯分校的卡倫·米加和國(guó)家人類基因組研究所的亞當(dāng)·菲利皮領(lǐng)導(dǎo)。

  研究人員選擇從一個(gè)被稱為CHM13的細(xì)胞系中讀取DNA。該細(xì)胞系來自水泡狀胎塊——一種妊娠失敗情況,可以在實(shí)驗(yàn)室中培養(yǎng)這種細(xì)胞。菲利皮說:“CHM13的獨(dú)特之處在于,它不是任何人的基因組!

  普通人類細(xì)胞的每段DNA都有兩個(gè)副本,往往存在重大差異,一個(gè)來自母親,另一個(gè)來自父親,這使得對(duì)DNA精確測(cè)序變得更加困難,因?yàn)橐闱宄裁词菧y(cè)序過程中的失誤、什么是真正的差異非常棘手。使用CHM13避免了這個(gè)問題,因?yàn)閮蓚(gè)副本幾乎完全相同。

  為組裝基因組序列,研究團(tuán)隊(duì)利用了兩種技術(shù):一種是能讀取非常長(zhǎng)(超過100萬個(gè)堿基對(duì))片段的測(cè)序技術(shù);另一種是精確度極高、能處理差別極小的片段(比如同一個(gè)基因的多個(gè)副本)的技術(shù)。

  2020年7月,該團(tuán)隊(duì)公布了完整的決定性別的人類X染色體。現(xiàn)在,他們公布了完整的人類基因組,新版本比上一個(gè)版本增加了近2億個(gè)堿基對(duì)以及2226個(gè)新基因,是自人類參考基因組首次發(fā)布以來進(jìn)行的最大改進(jìn)。(記者劉霞)

(責(zé)編:崔元苑、楊迪)


相關(guān)新聞