承啟生物助力中國(guó)科學(xué)家發(fā)現(xiàn)“隱藏的蛋白質(zhì)組”

2019-08-21 09:30 8710

深圳2019年8月21日 /美通社/ -- 2019年7月24日，承啟生物支持的中國(guó)科學(xué)家團(tuán)隊(duì)在生物科學(xué)界權(quán)威期刊Nucleic Acids Research上發(fā)表論文，通過(guò)自主研發(fā)的翻譯組測(cè)序技術(shù)，發(fā)現(xiàn)了對(duì)癌癥等重大病變有重要影響的“隱藏的蛋白質(zhì)組”(Hidden Proteome) -- 這些蛋白質(zhì)長(zhǎng)期以來(lái)被人們認(rèn)為不會(huì)存在，所以被稱為“隱藏的蛋白質(zhì)組”。

蛋白質(zhì)是氨基酸形成的多肽長(zhǎng)鏈。通常認(rèn)為，至少50個(gè)氨基酸以上的為“蛋白質(zhì)”，而50個(gè)氨基酸以下的為“小肽”。小肽因長(zhǎng)度短，難以形成復(fù)雜的空間構(gòu)象，只能起一些調(diào)控作用；而蛋白質(zhì)較大，能生成較為精密和復(fù)雜的空間構(gòu)象，便可獨(dú)立行使細(xì)胞結(jié)構(gòu)、催化酶等較為復(fù)雜的功能，也能與其他蛋白質(zhì)相結(jié)合，形成精密的蛋白質(zhì)復(fù)合體甚至大分子機(jī)器，是生物學(xué)功能的主要執(zhí)行者。

在人類基因組已知的約5萬(wàn)個(gè)基因中，其中約2萬(wàn)個(gè)被認(rèn)為是“編碼基因”(coding genes) ，即其可以被翻譯成蛋白質(zhì)；余下3萬(wàn)個(gè)左右的基因被認(rèn)為是“非編碼基因”(non-coding genes) ，這些基因被認(rèn)為不可能翻譯為蛋白質(zhì)。

已有的報(bào)道中，除了部分非編碼基因可表達(dá)為小肽行使調(diào)控功能外，有發(fā)現(xiàn)個(gè)別非編碼基因（如CLUU1、ESRG等）實(shí)際上能翻譯成>50氨基酸的蛋白質(zhì)。若這種情況不是個(gè)案而是普遍存在的現(xiàn)象，則說(shuō)明確實(shí)存在相當(dāng)一部分“編碼基因”被錯(cuò)誤地標(biāo)注成了“非編碼基因”，這將意味著人基因組需要被系統(tǒng)性地重新注釋。

該問題很早就被學(xué)界所關(guān)注，但科學(xué)界一直未給出有效的解決方法。傳統(tǒng)的蛋白質(zhì)組質(zhì)譜技術(shù)難以有效發(fā)現(xiàn)這些“隱藏的蛋白質(zhì)”。2014年，人類蛋白質(zhì)組草圖在Nature上發(fā)表，聲稱發(fā)現(xiàn)千余個(gè)“非編碼基因”所編碼的“新蛋白質(zhì)”，但隨后便被人類蛋白質(zhì)組組織 (HUPO) 爆出其分析不合規(guī)范，在用較嚴(yán)格的標(biāo)準(zhǔn)進(jìn)行質(zhì)控后，這些所謂的“新蛋白質(zhì)證據(jù)”幾乎都被認(rèn)為是假陽(yáng)性而不予認(rèn)定。

承啟生物首席科學(xué)家、暨南大學(xué)張弓教授于2012年開發(fā)成功翻譯組測(cè)序技術(shù) (RNC-seq)，即測(cè)定翻譯中的全長(zhǎng)mRNA。由于該項(xiàng)技術(shù)能準(zhǔn)確監(jiān)測(cè)翻譯過(guò)程，精度比質(zhì)譜高很多，可用于指導(dǎo)蛋白質(zhì)組學(xué)，規(guī)避上面提到的問題，因此很快被作為人類蛋白質(zhì)組計(jì)劃的核心支柱之一，并在2014年被人類蛋白質(zhì)組組織列為人類蛋白質(zhì)組計(jì)劃的首要突出貢獻(xiàn)。

2018年，中山大學(xué)張弩教授、暨南大學(xué)張弓教授等人便用翻譯組測(cè)序技術(shù)，發(fā)現(xiàn)了人細(xì)胞內(nèi)8000多個(gè)環(huán)狀RNA可能翻譯出蛋白質(zhì)，顛覆了“只有極少數(shù)環(huán)狀RNA才能翻譯成蛋白質(zhì)”的傳統(tǒng)觀念，并確證了其中一個(gè)蛋白質(zhì)LINC-PINT具有明確的抑癌功能，顯示了翻譯組測(cè)序技術(shù)在尋找新蛋白方面所起到的積極作用。

而在本次發(fā)表的論文中，暨南大學(xué)何慶瑜教授、張弓教授、王通教授研究組發(fā)現(xiàn)了約4700個(gè)人類“非編碼基因”實(shí)際上可能翻譯成蛋白質(zhì)，并提供了其中314個(gè)由長(zhǎng)鏈非編碼RNA (lncRNA) 表達(dá)的蛋白質(zhì)證據(jù)。這些蛋白質(zhì)不是小肽，而是含50個(gè)氨基酸以上的蛋白質(zhì)，它們能穩(wěn)定存在，并可在癌癥等病變中發(fā)揮重要作用。

承啟生物在該研究中提供了系統(tǒng)生物學(xué)數(shù)據(jù)分析，準(zhǔn)確地預(yù)測(cè)了這些從未被人們認(rèn)知的蛋白質(zhì)在細(xì)胞中的定位及其可能的功能，相關(guān)結(jié)果已通過(guò)實(shí)驗(yàn)被證實(shí)。

本次研究發(fā)現(xiàn)的大批此前不為人知的新蛋白質(zhì)，大規(guī)模地校正了人類基因組中的錯(cuò)誤注釋。這些新蛋白質(zhì)中有不少與人類生理病理相關(guān)的重要分子，由此打開了一個(gè)全新的人類蛋白質(zhì)寶庫(kù)，為研究各種重大疾病打開了一扇大門。同時(shí)，也使得中國(guó)科學(xué)家有獨(dú)立的方法檢驗(yàn)與校正人類基因組的注釋，不再依賴美國(guó)NCBI等數(shù)據(jù)庫(kù)中的注釋。

消息來(lái)源：深圳承啟生物科技有限公司