一種用于檢測染色體拷貝數變異的測序文庫構建方法和試劑盒與流程

文檔序號:11193530
一種用于檢測染色體拷貝數變異的測序文庫構建方法和試劑盒與流程
本發明涉及文庫的構建方法和試劑盒,更具體地,本發明涉及用于檢測染色體拷貝數變異的測序文庫構建方法和試劑盒。
背景技術
:研究表明,染色體數目的異常在已發現的染色體異常相關疾病中占有很大的比例(Nagaoka,etal,2012)。染色體數目的異常除了可表現為整條染色體的數目改變(染色體非整倍體),也可表現為某染色體的某一片段的拷貝數變異(如染色體微缺失微重復綜合征)。鑒于染色體異常疾病一般具有高發、危害性嚴重且缺乏有效的治療手段等特點,所以利用技術手段準確檢測染色體拷貝數是否存在異常具有重要的意義。采用傳統核型分析技術(Karyotyping)結合熒光原位雜交技術(FISH)或染色體微列陣分析技術(ChromosomeMicroarrayAnalysis,CMA,如aCGH和SNP-array)是目前臨床上用于檢測染色體拷貝數變異的主要手段和標準(Nord,etal,2015)。上世紀70年代建立起的高分辨率核型分析技術(Yunis,1978;Trask,2002)目前仍是檢測染色體非整倍體、平衡或非平衡性結構重排、較大片段的缺失/重復以及嵌合體等染色體異常的金標準,但其分辨率較低(約為5Mb),無法檢出具有臨床意義的染色體較小片段的拷貝數變異。而始于上世紀80年代后期的FISH技術(Trask,1991)將細胞遺傳學、免疫學和分子生物學相結合,在臨床研究上檢測目標染色體非整倍體和結構異常等方面具有較好的應用,但是其特異性探針的設計受到對目標區域信息的限制,因而僅能夠得到有限的染色體信息。近年來發展起來的染色體微陣列分析技術(CMA)則是一種高通量檢測基因組DNA拷貝數變異的分子核型分析技術,其中相對成熟的比較基因組雜交(aCGH)技術和單核苷酸多態性基因芯片(SNParray)技術都屬于CMA技術(ManningandHudgins,2010)。雖然CMA技術相比于傳統核型分析技術具有很高的分辨率(Breman,etal,2012),但其在臨床應用中需根據公共數據庫中詳盡的染色體異常及相關臨床信息定制微陣列芯片,因此對某些罕見的或數據庫中未涵蓋的微缺失微重復(CNV)的檢測存在不足。而且,目前CMA技術的難度較高和成本相對較高等特點也限制了其在欠發達地區的廣泛應用。因此,為了更廣泛地排查和診斷染色體疾病,需要一種在保證檢測通量和分辨率的前提下能夠準確檢測染色體拷貝數變異的經濟、簡單的方法。近些年日益成熟的高通量測序技術(NextGenerationSequencing,NGS)因其通量高、準確性高、靈敏性高、自動化程度高和運行成本低等突出的優勢,使其在臨床研究中得到廣泛的應用(Xuan,etal,2013)。目前通過NGS數據檢測CNV最常用的原理是基于計算深度(read-depth)來實現的,即通過將某區段的深度與預先校正得到的理論值進行計算比較以判定該區段是否存在CNV,這種方法對于單端測序和雙端測序都適用(Yoon,etal,2009;Mason-Suares,etal,2016)。在NGS文庫制備的過程中通常會采用標準的PCR來擴增隨機片段,而PCR不可避免的擴增偏好則會對數據的準確性造成影響(vanDijk,etal,2014;Head,etal,2014;Goodwin,etal,2016)。因此,建立一種簡單的不依賴PCR的建庫方法對于提高染色體非整倍性尤其是CNV的檢測準確性至關重要。技術實現要素:本發明的目的在于克服傳統檢測染色體拷貝數變異的方法在分辨率、全基因組覆蓋程度、通量和成本等方面的不足,同時克服NGS建庫過程中PCR擴增偏好性帶來的問題,提供了一種不依賴PCR的檢測染色體拷貝數變異的測序文庫構建方法和試劑盒。采用該方法和試劑盒對待測樣本進行染色體拷貝數變異檢測,可實現對染色體非整倍體和染色體微缺失微重復綜合征的篩查和診斷。在第一個方面,本發明提供一種用于檢測染色體拷貝數變異的測序文庫構建方法,其主要包括以下步驟:(1)利用雙鏈DNA片段化酶將待測DNA隨機片段化;(2)對片段化后的DNA進行末端補平和3’端懸A;(3)將末端補平并3’端懸A的DNA與測序接頭連接,獲得連接產物;(4)純化所述連接產物,獲得測序文庫,其中步驟(1)-(3)在單一反應管中完成。圖1示出了根據本發明的方法構建測序文庫的主要步驟。在一個實施方案中,待測DNA的起始含量優選為10-260ng。本領域技術人員已知,為滿足一定的上機測序要求,適合的文庫總量應不低于2fmol。因此,為使所構建文庫總量不低于2fmol,本發明人發現待測DNA的起始含量最優為10-260ng。含量過低,將導致所得測序文庫濃度不高,不能獲得有效的測序數據;含量過高,則將導致待測DNA不能被充分地隨機片段化(即,將有部分待測DNA未被片段化而仍然保持長片段的形式,這部分長片段DNA不能被有效地測序),也會影響最終文庫的濃度和測序的準確性(參見實施例2)。在一個實施方案中,雙鏈DNA片段化酶為非特異性切口核酸酶和T7內切酶突變體的混合酶。具體地,所述非特異性切口核酸酶是源自弧菌,例如嗜鹽弧菌(Vibriovulnificus)(Vvn)的核酸酶,所述核酸酶可以是野生型或其突變體。所述T7內切酶突變體是指在美國公開號2007-0042379中描述的,例如在兩個催化結構域之間的橋接區具有突變的T7內切酶。在一個實施方案中,包含非特異性切口核酸酶和T7內切酶突變體的雙鏈DNA片段化酶是本領域技術人員已知的,例如中國專利CN102301009A所述。在一個實施方案中,非特異性切口核酸酶和T7內切酶突變體的單位比例小于1:200,例如小于1:100或小于1:10,其范圍可以為1:2-1:200。最優選地,非特異性切口核酸酶和T7內切酶突變體的單位比例為1:200。其中,1個單位T7內切酶突變體定義為在37℃下1個小時將90%的2μg線性切口的2.44kb的dsDNA轉化成2個片段(1.37kb和1.07kb)所需要的酶的量。1個單位Vvn核酸酶和其突變體定義為在37℃下30min釋放1A260單位的酸性可溶寡核苷酸所需要的酶的量。在一個實施方案中,根據DNA是否落在大于60%GC(高GC含量)、40%-60%GC(標準GC含量)、或者小于40%GC(低GC含量)的范圍內可確定DNA片段化反應的最佳的溫育時間。例如,溫育時間范圍可以典型地在5min至120min,例如,15min至60min范圍內。在一個實施方案中,DNA片段化反應的溫度為35-40℃,最優選37℃。在一個實施方案中,待測DNA的隨機片段化是在緩沖液I存在下進行,其中緩沖液I主要包括20mM三羥甲基氨基甲烷-鹽酸(Tris-HCl)、15mM氯化鎂(MgCl2)、50mM氯化鈉(NaCl)、0.1mg/ml牛血清白蛋白(BSA)、0.15%曲拉通(Triton)。緩沖液I的存在能為隨機片段化反應提供合適的反應環境,同時維持DNA片段化酶的穩定性,并提高它的酶活力。在一個實施方案中,在步驟(1)和(2)之間還包括將所述雙鏈DNA片段化酶滅活的步驟。滅活所述雙鏈DNA片段化酶是指在60-70℃,例如65℃下溫浴10-13min,優選在緩沖液II存在下進行。所述緩沖液II主要包括50mM氯化鈉(NaCl)、10mM三羥甲基氨基甲烷-鹽酸(Tris-HCl)、10mM氯化鎂(MgCl2)、1mM二硫蘇糖醇(DTT)。緩沖液II的存在能為酶的滅活反應提供合適的離子濃度,同時也為接下來的末端補平和3’端懸A的反應提供合適的反應環境。在一個實施方案中,可以用本領域技術人員已知的任何適用于末端補平的酶對DNA進行末端補平。這種酶的實例包括但不限于T4DNA聚合酶、Klenow酶等。在一個實施方案中,可以用本領域技術人員已知的任何適用于3’端懸A的酶對DNA進行3’端懸A。這種酶的實例包括但不限于Taq酶、klenowex-(NewEnglandBiolabs)(是一種改進的Klenow酶,其3’-5’外切活性缺失)等。在本發明的文庫構建方法中,末端補平和3’端懸A同時進行,這簡化了操作步驟、節約成本,同時也降低了樣本間的污染。在一個實施方案中,末端補平和3’端懸A所用的溫育時間和溫度可以根據具體需要由本領域技術人員根據常規技術確定。在一個實施方案中,可以用本領域技術人員已知的任何適用于連接測序接頭的酶。這種酶的實例包括但不限于T4DNA連接酶、T7DNA連接酶或它們的混合物。本發明中的測序接頭是與測序平臺匹配的雙鏈測序接頭,是本領域技術人員根據常規技術可以選擇的。優選地,該連接步驟是在緩沖液III的存在下進行,所述緩沖液III主要包括50mM氯化鈉(NaCl)、10mM三羥甲基氨基甲烷-鹽酸(Tris-HCl)、10mM氯化鎂(MgCl2)、0.1%牛血清白蛋白(BSA)。緩沖液III的存在能夠為連接反應提供合適的反應環境,同時維持酶的穩定性。在一個實施方案中,在上機測序前可以用商購的試劑盒或本領域技術人員已知的任何試劑對根據本發明的文庫構建方法所得的測序文庫進行純化。所述測序文庫適用于第二代高通量測序平臺,例如:Illumina公司的HiSeq/MiSeq/MiniSeq/MySeq/NovaSeq測序平臺、ThermoFisher公司的PGM/Proton測序平臺等。在第二個方面,本發明還提供一種用于構建檢測染色體拷貝數變異的測序文庫的試劑盒,其包括:雙鏈DNA片段化酶和緩沖液I、緩沖液II、用于DNA末端補平的酶和用于3’端懸A的酶、測序接頭、連接酶和緩沖液III,其中緩沖液I、II和III的成分如上所述。在一個實施方案中,本發明的試劑盒還包括用作陰性對照的DNA樣本。陰性對照是指不含染色體拷貝數變異的正常DNA樣本。本發明的文庫構建方法基本上均通過酶反應完成,利用酶易失活的特點以及不同步驟中酶反應溫度不同的特點使得可以在單一反應管中依次連續地完成DNA隨機片段化、末端補平和3’懸A、以及連接接頭這三個步驟,步驟間無DNA純化過程。由于本發明的文庫構建方法可以在單一反應管中完成,因此也避免了DNA樣本在轉移之中造成的樣本損失以及樣本污染。此外,由于所涉及的試劑種類較少,本發明的文庫構建方法和試劑盒操作流程較為簡單,具有較好的易操作性。并且,本發明的文庫構建方法不包含PCR步驟,從而避免了因PCR操作本身帶來的擴增偏好性,最終提高檢測的準確性。最后,本發明的文庫構建方法和試劑盒可對低至10ng的樣本DNA實現準確的檢測,即,DNA樣本的起始含量比較低。附圖說明圖1:本發明所述的文庫構建方法的示意圖。圖2:采用本發明的方法構建文庫后對待測DNA樣本(A)和對照正常樣本(B)進行測序的結果。圖3:采用本發明的方法構建文庫后對第二個待測DNA樣本(A)和對照正常樣本(B)進行測序的結果。具體實施方式實施例1:根據本發明的方法構建文庫并用于測序DNA樣本根據本發明的用于檢測染色體拷貝數變異的測序文庫的構建方法和試劑盒,對以帕陶氏綜合征(T13)為例的染色體非整倍體、以染色體22q11.2微缺失綜合征為例的染色體微缺失進行檢測。具體地,帕陶氏綜合征是第13組染色體中出現第3個染色體引起的,是常見的三體綜合征之一;染色體22q11.2微缺失綜合征是指22號染色體22q11.21-q11.23微小缺失所造成的臨床癥候群,是人類最常見的微缺失綜合征。根據以下方法檢測樣本DNA:1.測定濃度:用Qubit熒光計測定待測DNA樣本的濃度,使DNA樣本的起始含量優選為10-260ng。2.構建文庫:按照本發明所述的用于構建檢測染色體拷貝數變異的測序文庫的方法進行文庫構建,具體包括以下步驟:(1)取待測DNA樣本和陰性對照(即正常DNA樣本)在冰上按下表1分別配制反應混合物。表1:試劑加入量DNA樣本10ng雙鏈DNA片段化酶1μl緩沖液I1μlEB緩沖液補至10μl混合均勻后,將反應體系置于37℃溫育10min。(2)將反應混合物轉至冰上,加入7μl的緩沖液II,充分混勻后置于65℃下溫育10min,以滅活雙鏈DNA片段化酶。(3)將反應混合物轉至冰上,加入1.5μlT4DNA聚合酶和1.5μlTaq酶,用EB緩沖液將體積補至50μl。充分混勻后,在室溫下瞬間離心5s,輕彈去除氣泡。然后將上述反應混合物放入普通PCR儀(或恒溫金屬浴)中開始下列溫育步驟:首先37℃,20min,然后72℃,20min,最后4℃,5min。(4)在PCR儀(或恒溫金屬浴)中完成溫育后,將反應混合物取出并置于冰上。同時,根據下表2配制預混液:表2:試劑加入量緩沖液III25μlT4DNA連接酶1μl將預混液進行充分混勻后,在室溫下瞬間離心5s。然后將該預混液加入已經完成溫育的反應混合物,并加入2μl的測序接頭在反應管壁上,然后立即在室溫下瞬間離心5s,快速混勻后,在室溫下瞬間離心5s,并輕彈去除氣泡,再次在室溫下瞬間離心5s。然后將上述反應混合物放入PCR儀(或恒溫金屬浴)中開始如下溫育步驟:首先20℃,15min,然后65℃,10min,最后4℃,5min。溫育完成后,即可獲得測序文庫。3.文庫純化和上機測序:使用高通量測序文庫構建DNA純化試劑盒(磁珠法)(杭州貝瑞和康基因診斷技術有限公司生產,貨號R0022)純化所得測序文庫,純化所得測序文庫,使其總量應不低于2fmol。使用NextSeqCN500(國械注準20153400460)測序儀,根據制造商的說明進行上機測序。4.分析測序結果:將測序結果與人類基因組參考序列進行比對,待測樣本和正常樣本的染色體拷貝數檢測結果分別如圖2和圖3所示。在圖2和圖3中,縱坐標log2(ratio)中ratio是指檢測區域的拷貝數與2(二倍體)的比值,橫坐標代表整條染色體區域。其中整條染色體被均勻地分成若干個區域(bin),每個點代表一個bin的log2(ratio)值,然后根據所有點的分布得到趨勢線(灰色實線)。圖中的黑色實線表示染色體的著絲點位置,將染色體分為短臂和長臂。由于目前人類基因組參考序列中尚無可供數據分析用的13號染色體短臂和22號染色體短臂的參考序列,因此無法分析13號染色體短臂和22號染色體短臂的相關測序數據,導致在這些區域沒有相應的log2(ratio)值。具體地,圖2示出了待測DNA樣本(A)和正常樣本(B)的13號染色體區域的拷貝數檢測結果。從結果可以看出,待測DNA樣本的13號染色體區域長臂的log2(ratio)值為0.585(=log21.5)左右,說明至少13號染色體的長臂部分有三個拷貝,即待測DNA樣本為帕陶氏綜合征(T13);而正常樣本的13號染色體區域的log2(ratio)值均為0(=log21),說明13號染色體為二倍體。用SNP-array芯片檢測該待測DNA樣本,證實確實存在三個拷貝的13號染色體長臂。換言之,本發明的方法和試劑盒建庫測序的檢測結果與臨床檢測結果一致。此外,還使用本發明的方法和試劑盒對第二個待測DNA樣本和正常樣本進行建庫并測序,結果如圖3所示。從檢測結果可以看出,待測DNA樣本的22號染色體在第20M左右的區域其log2(ratio)值約為-1(=log20.5),說明該區域為單倍體。將染色體的橫坐標與人類基因組參考序列進行比對,發現上述單倍體區域為22q11.21-q11.23區域,即待測DNA樣本為染色體22q11.2微缺失綜合征;而正常樣本的22號整條染色體區域的log2(ratio)值均為0(=log21),說明不存在22號染色體22q11.2區域的缺失。用SNP-array芯片檢測該待測DNA樣本,證實確實在22號染色體22q11.2區域具有微小缺失。換言之,本發明的方法和試劑盒建庫測序的檢測結果與臨床檢測結果一致。以上實施例說明,本發明的文庫構建方法以及相應的試劑盒可以用于通過高通量測序來準確地檢測染色體拷貝數的變異。實施例2:DNA起始含量對測序文庫濃度的影響根據實施例1所述的構建文庫和純化文庫的方法,用起始含量不同的DNA樣本制備測序文庫,并測定所得文庫的總量,結果如下表3所示。表3.DNA的起始含量與最終所得文庫的總量。起始DNA量(ng)文庫總量(fmol)<50.142<50.2<50.21<50.108<50.129<50.16951.05351.592102.776102.401502.97502.9881002.3181003.111502.4771502.7522002.3482001.7822202.4622201.7582402.0782401.9352602.1492602.2282801.4052801.5852901.9822901.8123001.043000.568從上表可以看出,當DNA起始含量為10-260ng時,所得文庫的最終總量基本上大于2fmol,滿足測序的需要。當濃度過低或過高,所得文庫的濃度均低于2fmol,不是最優適合用于測序。因此,在本發明中,用于制備文庫的起始DNA含量優選為10-260ng。以上所述僅為本發明的實施例,并不用于限制本發明,對于本領域的技術人員來講,本發明可以有更改和變化。凡在本發明的精神和原則之內,所作的任何修改、同等替換、改進等,均應包含在本發明的保護范圍之內。參考文獻NagaokaSI,HassoldTJ,andHuntPA.Humananeuploidy:mechanismsandnewinsightsintoanage-oldproblem.Nat.Rev.Genet.2012,13:493e504NordA,SalipanteSJ,PritchardC.Chapter11–CopyNumberVariantDetectionUsingNext-GenerationSequencing.ClinicalGenomics,2015,8:165-187YunisJ.High-resolutionchromosomeanalysisinclinicalmedicine.Prog.Clin.Pathol.,1978,7:267-288TraskBJ.Humancytogenetics:46chromosomes,46yearsandcounting.Nat.Rev.Genet.2002,3:769e778TraskBJ.Fluoresenceinsituhybridization:applicationincytogeneticsandgenemapping.TrendsGnent.1991,7:149-154.ManningM,andHudginsL.Array-basedtechnologyandrecommendationsforutilizationinmedicalgeneticspracticefordetectionofchromosomalabnormalities.Genet.Med.2010,12(11):742-745.BremanA,PursleyAN,HixsonP,BiW,WardP,BacinoCA,ShawC,LupskiJR,BeaudetA,PatelA,CheungSW,VandenVeyverI:Prenatalchromosomalmicroarrayanalysisinadiagnosticlaboratory:experiencewith>1000casesandreviewoftheliterature.Prenat.Diagn.2012,32:351e361.XuanJ,YuY,QingT,GuoL,ShiL.Next-generationsequencingintheclinic:promisesandchallenges.CancerLett.2013,340(2):284-295.YoonS,XuanZ,MakarovV,YeK,SebatJ.Sensitiveandaccuratedetectionofcopynumbervariantsusingreaddepthofcoverage.GenomeRes.2009,19(9):1586-1592.Mason-SuaresH,LandryL,LeboMS.DetectingCopyNumberVariationviaNextGenerationTechnology.Curr.Genet.Med.Report.2016,4(3):1-12.vanDijkEL,JaszczyszynY,ThermesC.Librarypreparationmethodsfornext-generationsequencing:tonedownthebias.Exp.CellRes.2014,322(1):12-20.HeadSR,KomoriHK,LaMereSA,WhisenantT,VanNieuwerburghF,SalomonDR,OrdoukhanianP1.Libraryconstructionfornext-generationsequencing:overviewsandchallenges.Biotechniques.2014,56(2):61-64.GoodwinS,McPhersonJD,McCombieWR.Comingofage:tenyearsofnext-generationsequencingtechnologies.Nat.Rev.Genet.2016,17(6):333-351.當前第1頁1 2 3 
再多了解一些
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
做爱视频