一種非編碼基因的高通量鑒定方法

文檔序號:410839
專利名稱:一種非編碼基因的高通量鑒定方法
技術領域
本發明涉及生物技術領域中的基因鑒定方法,特別是HIiCT0RNA基因的鑒定方法。
背景技術
microRNA或稱為miRNA,即微RNA,是一類內源性非編碼的單鏈RNA小分子;1993年在秀麗線蟲{Caenorhabditis eIegans)中首次被Lee等人發現(/ed),其轉錄后調控作用得到了學界的廣泛認可。在動物、植物和微生物(病毒)中廣泛存在,并具有一定保守性。microRNA通常由6(Tl20 nt的前體分子在酶的加工下形成,成熟體長度一般為19^25 nt。microRNA通過與靶基因堿基互補配對來實現其生物學功能,在細胞命運決定中具有重要的調控作用。microRNA是基因表達、修飾和翻譯的調節者。近年來的研究發現,microRNA在干細胞的自我復制、定向分化和組織再生中,都起著非常重要的作用,并且參與了細胞周期、細胞重編程,信號轉導、代謝調控等重要的生命過程。而細胞是組成生命體的一個基礎,細胞代謝上的障礙將會導致癌癥、心腦血管疾病、發育異常、農作物疾病……因此,microRNA涉及了發育、疾病以及糧食等一系列重大問題。同時,microRNA也正在成為 新型的biomarker,是疾病診斷分型與新型藥物研發中的新星。microRNA的研究多次入選Science年度十大科技進展,已經成為生物科技領域的研發熱點?;蜩b定是microRNA研究中的基礎。microRNA的鑒定方法主要有2大類基于實驗的方法與結合計算機分析的高通量鑒定,前者能較為準確的鑒定出研究對象中的microRNA基因,但一次鑒定的數目有限,并且需要依托基因組信息來驗證;后者彌補了前者的不足,可以完成對研究對象批量的系統鑒定,并具有準確性。隨著生物技術領域高通量方法的發展,后者成為了新興的研究方法,并日益成為主流。目前,結合計算機分析的高通量鑒定可分為以下3種(1)基于比較基因組學的序列保守性預測,這種方法在物種間保守的microRNA基因具有一定預測效果,而對物種特有的microRNA基因的鑒定效果不佳。由于不同物種間基因組的差異,導致研究對象中不一定存在該microRNA前體,使得方法I具有一定假陽性。(2)對已完成基因組測序的模式生物,可以結合小RNA測序進行microRNA 預測將小RNA測序的Reads匹配到基因組上進行延伸,獲得microRNA的候選前體序列;從而通過模擬microRNA生物學合成的方法來系統鑒定microRNA。但對于大量的沒有完成基因組測序的生物,這一方法并不適用;而完成基因組全測序是一個耗時并且價格昂貴的工作,限制了方法2在未完成基因組測序的生物中的應用。(3)用EST替代基因組序列是方法2的一種退而求其次的選擇,由于EST序列在基因組中的覆蓋度低、數據量不足和零散分布等原因,使得方法3鑒定的microRNA不全面?;谝陨显?,目前已經鑒定出的microRNA數目仍然十分有限,許多新的microRNA有待于被鑒定,其具有獨特功能有待于被發掘。因此,要在基因組的水平大量鑒定microRNA,研發出一種經濟而系統的microRNA高通量鑒定方法顯得十分必要
發明內容
本發明的目的是建立一種非編碼基因的高通量鑒定方法,特別適用于microRNA基因的檢測,尤其是對未完成基因組測序的生物的microRNA基因的高通量鑒定。本發明通過以下方案達到上述目的。一種非編碼基因的高通量鑒定方法,其包括以下步驟
(1)提取樣品總DNA,進行DNA測序,并將測序結果拼接成contig序列;
(2)提取樣品總RNA,從中分離長度為18 30nt的小RNA,對小RNA進行測序;
(3)將小RNA測序的Reads匹配到DNA的c ontig序列上進行兩端延伸,獲得候選前體序列;
(4 )利用計算機軟件對候選前體序列進行高通量鑒定。優選地,步驟(I)中對DNA 測序的方法為 454、Solexa、SOLiD、illumina、HiSeq 或Helicos方法中的一種或多種;contig序列的長度大于所測基因的前體要求的長度;采用2倍以上的覆蓋度(coverage)對研究對象進行DNA測序。優選地,步驟(4)中使用二級結構折疊、自由能計算、綜合罰分中的一種或多種對候選前體序列進行分析。上述方案可以對基因進行高通量鑒定,并且尤其適合于microRNA基因的鑒定。當所述基因為microRNA時,步驟(I)中contig序列的長度大于或等于60nt。更優選地,所述microRNA為沒有基因組圖譜物種的microRNA。但是本發明的方法并不局限于未完成基因組測序的生物,對已有基因組的生物同樣適用,可用于對生物體microRNA系統梳理與校對。所述基因還可以是具有前體結構的小RNA。由于本方法采用了 DNA高通量測序結合小RNA測序的方法,將小RNA片段延長獲得候選前體,這一特點不局限于microRNA,因此本發明同樣適用于具有前體結構的小RNA的檢測。本發明具有以下有益效果由于本發明采用的是DNA高通量測序的方法,其結果能夠覆蓋研究對象的基因組,其拼接結果平均長度達到了 500 nt以上,滿足microRNA前體長度(60 nt以上)需要。因此,這一研究設計與通常的基因組測序的研究目的不同,并且不涉及進行基因組精細圖的繪制,成本較低,是一種經濟而有效的microRNA高通量鑒定方法。


圖I本發明實施例的步驟模塊示意 圖2本發明實施例的DNA測序結果的質量檢測 圖3本發明實施例的小RNA測序結果的質量檢測 圖4本發明實施例的DNA拼接結果 圖5本發明實施例的microRNA鑒定結果 圖6本發明實施例的microRNA高通量鑒定效果與已有基因組物種的對比 圖7本發明實施例的microRNA高通量鑒定效果與EST方法的對比圖。
具體實施方式
實施例食用型香蕉(ifesa sp.)葉片microRNA的高通量鑒定 參考圖I所示步驟進行高通量基因鑒定。I.樣品總DNA提取與質量檢測
香蕉 DNA 采用 E. Z. N. A. HP Plant DNA Kit (Omega ,D2485-00)方法提取。DNA 樣品經NanoDrop檢測,濃度為75 ng/u L ;0D260/280值為2. 00,產量為6 u go2.對DNA樣品進行高通量測序
香蕉基因組C值為0. 58 0. 78 pg (1C),均值為0.66 pg。預測基因組大小為6 X IO8bpo DNA樣品采用500bp插入文庫,經cluster制備后,采用全基因組鳥槍法(WGS)測序,總測序量不低于6X IO9 bpo3.樣品總RNA提取與質量檢測
香蕉 RNA 米用 Plant/Fungi Total RNA Purification Kit (Norgen Cat# 25800,31300, 31900)方法提取。RNA 樣品經 NanoDrop 檢測,濃度為 660 ng/y L ;0D260/280 值為
2.07,產量為 20 u g04.對RNA樣品進行小RNA測序
從總RNA中分離小RNA (—般為18 30nt),加接頭并純化。經RT-PCR、建立小RNA文庫后,上機進行測序(實施例中采用Illumina Genome Analyzer平臺)。5.對DNA、RNA結果進行質量控制與序列預處理
去掉實驗中加入的接頭等雜質序列后,采用對測序結果進行質量控制,去除低質量序列(實施例中采用FastQC等軟件)。并完成后續分析所需的序列格式轉換。質量檢測結果請參見圖2和圖3。6.對DNA預處理結果進行拼接
對預處理后的DNA測序結果進行拼接,獲得contig的N50為I. 2kp,其長度大于microRNA前體(一般為70-120 bp),滿足microRNA候選前體的要求。(實施例中綜合采用ABySS> CAP、iAssembler、SOAPdenobo> Velvet等序列拼接軟件)。拼接結果參見圖4。7.以DNA測序拼接結果作為microRNA候選前體,結合小RNA測序預處理結果,利用軟件進行microRNA高通量鑒定。將contig序列集結合預處理后的小RNA測序數據集,用程序進行分析。得到microRNA前體為159條,成熟體為126條,星號序列為150條,其中新microRNA為77條,而84條星號序列為測序實驗中獲得,說明結果可靠。數據量與已測序物種葡萄(雙子葉植物)、二穗短柄草(單子葉植物)、高粱(單子葉植物)等相當。結果參見圖5、圖6和圖7。權利要求
1.一種非編碼基因的高通量鑒定方法,其特征在于包括以下步驟 (1)提取樣品總DNA,進行DNA測序,并將測序結果拼接成contig序列; (2)提取樣品總RNA,從中分離長度為18 30nt的小RNA,對小RNA進行測序; (3)將小RNA測序的Reads匹配到DNA的contig序列上進行兩端延伸,獲得候選前體序列; (4 )利用計算機軟件對候選前體序列進行高通量鑒定。
2.如權利要求I所述的鑒定方法,其特征在于步驟(I)中對DNA測序的方法為454、Solexa、illumina、SOLiD、HiSeq 或 Helicos 方法中的一種或多種。
3.如權利要求I所述的鑒定方法,其特征在于步驟(I)中contig序列的長度大于所測基因的前體要求的長度。
4.如權利要求I所述的鑒定方法,其特征在于步驟(I)中采用2倍以上的覆蓋度對研究對象進行DNA測序。
5.如權利要求I所述的鑒定方法,其特征在于步驟(4)中使用二級結構折疊、自由能計算、綜合罰分中的一種或多種對候選前體序列進行分析。
6.如權利要求1-5中任一項所述的鑒定方法,其特征在于所述基因是microRNA。
7.如權利要求6所述的鑒定方法,其特征在于步驟(I)中contig序列的長度大于或等于60nt。
8.如權利要求6所述的鑒定方法,其特征在于所述microRNA是沒有基因組圖譜物種的 microRNA。
9.如權利要求6所述的鑒定方法,其特征在于獲得的microRNA包含microRNA前體、成熟體與星號序列。
10.如權利要求1-5中任一項所述的鑒定方法,其特征在于所述基因是具有前體結構的小RNA。
全文摘要
本發明公開了一種非編碼基因的高通量鑒定方法,包括以下步驟(1)提取樣品總DNA,進行DNA測序,并將測序結果拼接成contig序列;(2)提取樣品總RNA,從中分離長度為18~30nt的小RNA,對小RNA進行測序;(3)將小RNA測序的Reads匹配到DNA的contig序列上進行兩端延伸,獲得候選前體序列;(4)利用計算機軟件對候選前體序列進行高通量鑒定。該發明主要針對于沒有基因組圖譜物種的microRNA及其基因的系統鑒定,發現新的非編碼RNA基因;對已有完成基因組測序的生物同樣適用;且不局限于microRNA,同樣適用于具有前體結構的小RNA的檢測。
文檔編號C12Q1/68GK102747147SQ201210170788
公開日2012年10月24日 申請日期2012年5月29日 優先權日2012年5月29日
發明者周惠, 屈良鵠, 廖建友, 楊建華, 溫俊志, 鄭凌伶 申請人:中山大學
再多了解一些
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
做爱视频