中科院水生所完成模式硅藻的蛋白質組精細圖譜

硅藻是一類重要的單細胞光合真核生物, 分布廣泛, 提供了地球上約20%的初級生產(chǎn)力,對整個地球生物圈意義重大,三角褐指藻?(Phaeodactylum tricornutum)?是海洋硅藻的模式生物,其基因組序列于2008年公布,但目前基因組的注釋仍很不完善。

Light Micrograph of?Phaeodactylum tricornutum (source:en.wikipedia.org)
Light Micrograph of?Phaeodactylum tricornutum (source:en.wikipedia.org)

?蛋白基因組學?(Proteogenomics)?是利用蛋白質組學數(shù)據(jù),尤其是高精度的串聯(lián)質譜數(shù)據(jù), 結合基因組和轉錄組數(shù)據(jù)對基因組進行深度注釋。中國科學院水生生物研究所葛峰課題組采用蛋白基因組學的研究策略和方法,完成了模式藍細菌的基因組深度解析?(PNAS,2014,111(52):E5633-E5642)?并開發(fā)了針對原核生物的蛋白基因組學專業(yè)分析軟件GAPP(Molecular & Cellular Proteomics,?2016; 15 (11): 3529-3539)。

在上述工作基礎上,葛峰課題組對真核模式硅藻三角褐指藻的基因組進行了深度解析并構建了蛋白質組精細圖譜,相關成果以“Genome annotation of a model diatom Phaeodactylum tricornutum using an integrated proteogenomic pipeline”為題于近日發(fā)表在Molecular Plant雜志上。

 

葛峰課題組通過整合基因組、轉錄組、ESTs序列等多組學數(shù)據(jù),并對數(shù)據(jù)庫進行了縮減,得到去冗余的三角褐指藻蛋白基因組學數(shù)據(jù)庫;通過整合基于蛋白和肽段的樣品預分離、雙酶切和高分辨質譜分析技術,獲得高質量的質譜數(shù)據(jù);質譜數(shù)據(jù)的鑒定整合了多種搜索引擎的結果,提高了蛋白鑒定的深度與覆蓋度;并采用更為嚴格的肽段假陽性控制策略,從而提高鑒定結果的可信度;通過開發(fā)新的算法,實現(xiàn)了真核生物中新的可變剪切體的發(fā)現(xiàn)與點突變基因的鑒定。

本研究精準鑒定到6628個已注釋的編碼基因;對未鑒定到的已注釋基因的深入分析發(fā)現(xiàn),有1895個基因可能并不編碼蛋白;發(fā)現(xiàn)了606個新的蛋白編碼基因并校正了506個已注釋的編碼基因,其中有56個新發(fā)現(xiàn)的蛋白編碼基因,在之前的研究中被錯誤預測為長鏈非編碼RNA(LncRNA);鑒定到 268個可能具有重要功能的微小短肽(micropeptides),21個新的可變剪切體,并修正了73個已注釋基因的可變剪切位點以及58個發(fā)生氨基酸突變的基因;通過將開放式與限定式檢索相結合的策略,對三角褐指藻中的翻譯后修飾進行系統(tǒng)鑒定,發(fā)現(xiàn)了20多種不同種類的蛋白質翻譯后修飾,這些修飾可能參與調控細胞內(nèi)眾多的生物學過程并在細胞的逆境適應中起著重要作用。通過以上工作的完成,實現(xiàn)了三角褐指藻基因組的深度注釋和蛋白質組精細圖譜的構建。

蛋白基因組學方法構建模式硅藻的蛋白質組精細圖譜
蛋白基因組學方法構建模式硅藻的蛋白質組精細圖譜

此外,在以上工作的基礎上,本研究還建立了完整的構建真核模式生物的蛋白質組精細圖譜的實驗技術和分析流程,可適用于各種已經(jīng)測序的真核生物,成為解讀真核生物基因組及其功能分析的重要工具。

該論文的第一作者是水生所楊明坤高級實驗師,通訊作者是葛峰研究員,該研究得到了國家重點研發(fā)計劃 (2016YFA0501304)的資助。

轉自:BioArt植物

Related Posts

Write a comment