一種土曲霉基因組規模代謝網絡模型及其構建方法

文檔序號:6441305
專利名稱:一種土曲霉基因組規模代謝網絡模型及其構建方法
技術領域
本發明屬于從基因編碼蛋白序列出發,構建土曲霉基因組規模代謝網絡的系統生物學領域。涉及土曲霉基因組規模代謝網絡模型及其構建方法。
背景技術
工業微生物產業的發展迫切需要對微生物進行系統全面的認識,以在此基礎上對微生物代謝功能進行有目的、有效率的設計和改造,以推進工業生物技術的快速發展。而伴隨微生物基因組學(Genomic)、蛋白組學(ftOteomics)、代謝組學(Metabonomics)等高通量數據的不斷積累和生物信息學策略的不斷完備,使得基因組規模代謝網絡模型(Genome Scale Metabolic Model,GSMM)構建成為全面系統研究和調控微生物生物生理代謝功能的最佳途徑。1999年大腸桿菌基因組規模代謝網絡模型構建完成至今,已發展出多種模型構建方法和分析方法。典型的模型構建過程從基因組序列的注釋開始,結合各類反應、酶學數據庫,獲得基因-蛋白-反應(Gene-Protein-Reaction,GPR)的關系列表,進而構建出生物的基因組規模代謝網絡。常用的模型分析方法有流量平衡分析(Flux Balance Analysis, FBA)、動態流量平衡分析(Dynamic Flux Balance Analysis,DFBA)等。以上分析方法的基本原理是在代謝網絡模型質量平衡(Mass balance)體系的假穩態(Pseudo steady-state) 條件下,對底物吸收的種類和速率加以約束條件,通過最大化或最小化目標方程,得到該約束條件下的代謝流量分布解空間(Solution space)?;蚪M規模代謝網絡模型提供了全局理解微生物生理代謝功能的高效平臺。如微生物生長表型的預測和分析,模糊反應的存在性及途徑可能性的驗證,目標產物代謝途徑中關鍵基因、反應的發現以及系統水平上的代謝工程改造等等?!?曲 β (Aspergillus terreus)M M M (Eurotiomycetes) f^ ^ ^ g (Eurotiales)發菌科(Trichocomaceae)曲霉屬(Aspergillus)絲狀真菌,工業上廣泛用于重要有機酸如衣康酸(Itaconic acid)、順烏頭酸(Cis-aconitic acid)以及降膽血脂藥物洛伐他汀(Lovastatin)的生產。土曲霉還被應用于重金屬離子的吸附,此外也是導致人、 動植物疾病及糧食腐敗的微生物之一。為了更好的利用該微生物,我們有必要從系統生物學的角度出發全面解析土曲霉的生理特性。而通過基因組規模代謝網絡模型的構建和分析是實現全面解析其生理特性的最佳途徑。

發明內容
本發明提供了一種土曲霉基因組規模代謝網絡模型的構建方法。該方法能夠用于任何生物基因組規模代謝網絡模型的構建;該方法能夠提供真菌細胞基因組規模代謝網絡構建所需的反應。本發明首次完成了土曲霉菌基因組規模代謝網絡模型的構建。該模型包含1300 個基因、1149個代謝物及1575個生化反應。
本發明補充了土曲霉基因編碼蛋白的注釋信息。2005年Birren B. W等完成對土曲霉(Aspergillus terreus NIH2624)的基因組注釋,注釋結果包含10402個基因編碼蛋白(Gene encoding-protein)。其中包含 5253個假定未知蛋白(Putative uncharacterized protein)和3494個預測蛋白(Predicted protein) 0本發明所構建的土曲霉基因組規模代謝網絡模型為其中的86個預測蛋白,645個假定未知蛋白重新分配了生理功能。本發明明確了土曲霉衣康酸的生物合成途徑。通過FBA對土曲霉基因組規模代謝網絡模型中衣康酸合的三種成可能途徑逐一進行流量分析,并實驗數據進行比較。結果驗證了衣康酸由順烏頭酸合成的途徑。本發明確定了土曲霉的生物量組成成分。生物量方程一般作為模型模擬的目標方程(objective function),獲取微生物細胞生物量構成及比例對模型的構建及模擬至關重要。本發明從實驗和文獻數據中獲取了土曲霉的生物量組分及比例,并根據模型模擬的結果進行了修正。土曲霉生物量組分及比例為32. 80%蛋白質、0. 80% DNA,5. 30% RNA、 19. 00%脂質、0. 10%糖原、5. 40%幾丁質、14. 60%葡聚糖、0. 70%甘油、6. 10%甘露聚糖以及15. 2%灰分構成。


圖1為土曲霉基因組規模代謝網絡模型重建所遵循的流程圖;圖2為生物系統發生樹;圖3為碳源限制條件下氧氣對模型生長的影響。
具體實施例方式實施例1系統發生樹信息獲取^t NCBI Taxonomy ^ig^fiiA Aspergillus terreus NIH2624> Aspergillus niger和Aspergillus oryzae進行檢索,獲取各菌間的親緣關系。結果見圖2.實施例2編碼基因及其蛋白名稱及功能從 Uniprot protein knowledgebase 中下載 Aspergillus terreus NIH2624、 Aspergillus niger禾口 Aspergillus oryzae RIB40的基因編碼的蛋白序列。示例如下表。表1編碼基因及其蛋白序列
/,___
ORF(A. terreus)_______ Function____________
IovB Lovastatin nonaketide synthase (EC 2.3.1.161) ATEG_10097 Succinate/fumarate mitochondrial transporter ATEG_10103_Alpha-amylase_實施例4基因組規模代謝網絡模型構建1.比對菌模型的統一主要進行代謝物名稱的統一。如水的表達形式有H20和Water,統一后均表示為 H20。2.臨時模型構建目的菌與比對菌進行蛋白序列Blastp比對,篩選相似性大于等于40 %的比對序列。數量篩選示例見表2。表2篩選示例
權利要求
1.一種土曲霉基因組規模代謝網絡模型的構建方法,其特征在于根據生物系統發生樹下親緣微生物蛋白功能相似性,構建目的微生物基因組規模代謝網絡模型。
2.根據權利要求1所述,其涉及的生物系統發生樹來源于美國國家生物技術信息中心。
3.根據權利要求1所述,其涉及的蛋白由編碼基因編碼合成。
4.根據權利要求1和3所述,其涉及的蛋白至少包含目的微生物細胞中的一個酶或膜轉運蛋白。
5.根據權利要求1所述,其蛋白功能相似性由美國國家生物技術信息中心的Blastp比對工具獲得。
6.根據權利要求1和5所述,篩選功能相似性大于或等于40%的蛋白序列用于基因組規模代謝網絡模型構建。
7.根據權利要求1的方法,基因組規模代謝網絡模型構建的步驟包括①比對菌模型的統一;②提取比對菌模型中與權利要求6所篩選的蛋白序列適配的反應信息,構建臨時模型;③整合臨時模型,獲得目的微生物的基因組規模代謝網絡模型。
8.根據權利要求7所述,步驟①中所述比對菌為Aspergillusniger,Aspergillus oryzae RIB40。
9.根據權利要求1、4和7所述,其中涉及的目的微生物為Aspergillusterreus OTH2624。
10.根據權利1、7所述,其中涉及的土曲霉基因組規模代謝網絡模型。
全文摘要
本發明涉及土曲霉的基因組規模代謝網絡模型及其構建方法。模型的構建基于生物系統發生樹下親緣微生物的基因編碼蛋白序列比對。通過模型的構建,明確了土曲霉生理活動中所發生的反應及其基因,補充了基因編碼蛋白序列的注釋信息。土曲霉的基因組規模代謝網絡模型進一步對深入了解土曲霉的生理特性將有極大的推進作用。
文檔編號G06F19/12GK102495976SQ20111041931
公開日2012年6月13日 申請日期2011年12月15日 優先權日2011年12月15日
發明者劉杰, 劉立明, 陳堅, 高倩 申請人:江南大學
再多了解一些
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
做爱视频