深圳2019年8月21日 /美通社/ -- 2019年7月24日,承啟生物支持的中國(guó)科學(xué)家團(tuán)隊(duì)在生物科學(xué)界權(quán)威期刊Nucleic Acids Research上發(fā)表論文,通過(guò)自主研發(fā)的翻譯組測(cè)序技術(shù),發(fā)現(xiàn)了對(duì)癌癥等重大病變有重要影響的“隱藏的蛋白質(zhì)組”(Hidden Proteome) -- 這些蛋白質(zhì)長(zhǎng)期以來(lái)被人們認(rèn)為不會(huì)存在,所以被稱為“隱藏的蛋白質(zhì)組”。
蛋白質(zhì)是氨基酸形成的多肽長(zhǎng)鏈。通常認(rèn)為,至少50個(gè)氨基酸以上的為“蛋白質(zhì)”,而50個(gè)氨基酸以下的為“小肽”。小肽因長(zhǎng)度短,難以形成復(fù)雜的空間構(gòu)象,只能起一些調(diào)控作用;而蛋白質(zhì)較大,能生成較為精密和復(fù)雜的空間構(gòu)象,便可獨(dú)立行使細(xì)胞結(jié)構(gòu)、催化酶等較為復(fù)雜的功能,也能與其他蛋白質(zhì)相結(jié)合,形成精密的蛋白質(zhì)復(fù)合體甚至大分子機(jī)器,是生物學(xué)功能的主要執(zhí)行者。
在人類基因組已知的約5萬(wàn)個(gè)基因中,其中約2萬(wàn)個(gè)被認(rèn)為是“編碼基因”(coding genes) ,即其可以被翻譯成蛋白質(zhì);余下3萬(wàn)個(gè)左右的基因被認(rèn)為是“非編碼基因”(non-coding genes) ,這些基因被認(rèn)為不可能翻譯為蛋白質(zhì)。
已有的報(bào)道中,除了部分非編碼基因可表達(dá)為小肽行使調(diào)控功能外,有發(fā)現(xiàn)個(gè)別非編碼基因(如CLUU1、ESRG等)實(shí)際上能翻譯成>50氨基酸的蛋白質(zhì)。若這種情況不是個(gè)案而是普遍存在的現(xiàn)象,則說(shuō)明確實(shí)存在相當(dāng)一部分“編碼基因”被錯(cuò)誤地標(biāo)注成了“非編碼基因”,這將意味著人基因組需要被系統(tǒng)性地重新注釋。
該問題很早就被學(xué)界所關(guān)注,但科學(xué)界一直未給出有效的解決方法。傳統(tǒng)的蛋白質(zhì)組質(zhì)譜技術(shù)難以有效發(fā)現(xiàn)這些“隱藏的蛋白質(zhì)”。2014年,人類蛋白質(zhì)組草圖在Nature上發(fā)表,聲稱發(fā)現(xiàn)千余個(gè)“非編碼基因”所編碼的“新蛋白質(zhì)”,但隨后便被人類蛋白質(zhì)組組織 (HUPO) 爆出其分析不合規(guī)范,在用較嚴(yán)格的標(biāo)準(zhǔn)進(jìn)行質(zhì)控后,這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認(rèn)為是假陽(yáng)性而不予認(rèn)定。
承啟生物首席科學(xué)家、暨南大學(xué)張弓教授于2012年開發(fā)成功翻譯組測(cè)序技術(shù) (RNC-seq),即測(cè)定翻譯中的全長(zhǎng)mRNA。由于該項(xiàng)技術(shù)能準(zhǔn)確監(jiān)測(cè)翻譯過(guò)程,精度比質(zhì)譜高很多,可用于指導(dǎo)蛋白質(zhì)組學(xué),規(guī)避上面提到的問題,因此很快被作為人類蛋白質(zhì)組計(jì)劃的核心支柱之一,并在2014年被人類蛋白質(zhì)組組織列為人類蛋白質(zhì)組計(jì)劃的首要突出貢獻(xiàn)。
2018年,中山大學(xué)張弩教授、暨南大學(xué)張弓教授等人便用翻譯組測(cè)序技術(shù),發(fā)現(xiàn)了人細(xì)胞內(nèi)8000多個(gè)環(huán)狀RNA可能翻譯出蛋白質(zhì),顛覆了“只有極少數(shù)環(huán)狀RNA才能翻譯成蛋白質(zhì)”的傳統(tǒng)觀念,并確證了其中一個(gè)蛋白質(zhì)LINC-PINT具有明確的抑癌功能,顯示了翻譯組測(cè)序技術(shù)在尋找新蛋白方面所起到的積極作用。
而在本次發(fā)表的論文中,暨南大學(xué)何慶瑜教授、張弓教授、王通教授研究組發(fā)現(xiàn)了約4700個(gè)人類“非編碼基因”實(shí)際上可能翻譯成蛋白質(zhì),并提供了其中314個(gè)由長(zhǎng)鏈非編碼RNA (lncRNA) 表達(dá)的蛋白質(zhì)證據(jù)。這些蛋白質(zhì)不是小肽,而是含50個(gè)氨基酸以上的蛋白質(zhì),它們能穩(wěn)定存在,并可在癌癥等病變中發(fā)揮重要作用。
承啟生物在該研究中提供了系統(tǒng)生物學(xué)數(shù)據(jù)分析,準(zhǔn)確地預(yù)測(cè)了這些從未被人們認(rèn)知的蛋白質(zhì)在細(xì)胞中的定位及其可能的功能,相關(guān)結(jié)果已通過(guò)實(shí)驗(yàn)被證實(shí)。
本次研究發(fā)現(xiàn)的大批此前不為人知的新蛋白質(zhì),大規(guī)模地校正了人類基因組中的錯(cuò)誤注釋。這些新蛋白質(zhì)中有不少與人類生理病理相關(guān)的重要分子,由此打開了一個(gè)全新的人類蛋白質(zhì)寶庫(kù),為研究各種重大疾病打開了一扇大門。同時(shí),也使得中國(guó)科學(xué)家有獨(dú)立的方法檢驗(yàn)與校正人類基因組的注釋,不再依賴美國(guó)NCBI等數(shù)據(jù)庫(kù)中的注釋。