海量質譜數(shù)據深度解析新方法及其應用.pdf_第1頁
已閱讀1頁,還剩130頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物質譜技術的飛速發(fā)展為蛋白質組學的研究提供了重要的技術支持,特別是液相色譜一串聯(lián)質譜聯(lián)用技術憑借其高靈敏度、高通量和高精度的優(yōu)點,已經成為大規(guī)模蛋白質鑒定的主要技術。然而,隨著質譜儀檢測速度和檢測精度的提高,質譜產出的數(shù)據也成倍增加,如何正確解析這些質譜數(shù)據成為蛋白組學研究的一大挑戰(zhàn)。為滿足蛋白質組學研究中海量數(shù)據解析的需求,自動化分析流程是不可缺少的,目前主要的質譜數(shù)據的解析方式是通過蛋白質序列數(shù)據庫搜索進行蛋白質鑒定,然而常用數(shù)據

2、庫搜索方式對串聯(lián)質譜數(shù)據譜圖的解析能力有限,即使對于高精度的質譜數(shù)據而言,譜圖的解析率亦不超過30%。影響質譜數(shù)據解析的因素是多方面的,包括樣本本身的復雜程度、樣本制備過程引入的不確定因素以及質譜數(shù)據采集和分析過程的不同等。
  為了降低質譜數(shù)據分析過程中各種因素的影響,通常以標準品作為參考,規(guī)范和評價質譜數(shù)據的產生與分析流程。其中由于合成肽段具備序列信息明確,樣本構成簡單,不易受外界污染物影響等特點,能夠作為質譜性能評價和數(shù)據分

3、析方法評價的參考物質,因此,本文以化學合成肽段作為標準品,分別從質譜儀的掃描精度、質譜儀的參數(shù)設置、樣本的復雜程度以及數(shù)據處理等方畫深入分析了影響質譜數(shù)據解析的因素。該標準品共包含30個質譜響應較好的特征肽段,分別來源于騰沖嗜熱厭氧菌(Thermoanaerobacter tengcongensis,TTE)表達豐度不同的15個蛋白質,且與酵母蛋白質序列同源性較小,可用于構建以酵母為基體的復雜體系樣本。通過對合成肽段的色譜與質譜表征,表

4、明30個合成肽段樣本色譜純度均達99%以上,且肽段含量較高,序列合成正確,適合于構建標準品。
  通過標準肽段的高精度質譜數(shù)據分析,結果表明串聯(lián)質譜掃描中一級質譜儀的分辨率提高雖然能夠提供準確的一級母離子的質量數(shù),但受儀器本身固有特征與參數(shù)設置的影響,僅僅依賴質譜選擇的母離子并不一定能夠使所有二級譜圖得到鑒定。其中,離子動態(tài)排除和較寬的離子解離窗口設置是產生這一現(xiàn)象的重要原因,兩者共同作用容易導致較寬質荷比范圍內的所有離子共碎裂產

5、生混合譜圖。隨著檢測樣本復雜程度的增加,混合譜圖的比列也顯著增高,而混合譜圖的低解析率成為影響質譜數(shù)據解析率的重要因素之一。
  為了提高譜圖的正確鑒定率,本研究以混合譜圖作為主要研究對象,深入分析其譜圖的特征,并利用這些特征對混合譜圖進行鑒定。經過對大量質譜譜圖的分析.發(fā)現(xiàn)造成混合譜圖解析率低的原因主要包括兩部分,一是不能正確識別形成混合譜圖的所有母離子單同位素峰,二是混合譜圖中未鑒定碎片離子的影響。針對第一種原因,本研究提出了

6、一種基于同位素峰強度比值的單同位素峰識別算法(Peak intensity ratio-based monoisotopic peak determination algorithm,PIRMD),該算法首先利用相鄰同位素峰的強度比值對母離子單同位素峰的邊緣特征進行分析,并利用該特征識別未發(fā)生同位素峰混疊的母離子的單同位素峰,其次對于產生混疊的母離子的單同位素峰,通過構建實驗同位素峰分布與理論分布之間的誤差函數(shù)加以識別。對標準品樣本與復

7、雜蛋白質樣本的質譜數(shù)據分析表明,PIRMD能夠較為有效地提高質譜數(shù)據的解析率,其中復雜樣本鑒定結果表明解析質譜圖的25%來自混合譜圖。針對第二種原因,本研究從反轉譜圖的思想出發(fā),充分利用高精度質譜數(shù)據中一級掃描的高準確度與二級掃描碎片離子的互補特征,提出了一種基于碎片離子對的混合譜圖分離算法(Chimera identification algorithm based on fragmention pairs,CHIFP)。通過對理論參

8、考數(shù)據集的鑒定結果分析,CHIFP算法能夠在正確識別混合譜圖母離子的前提下,可將母離子強度較低的混合譜圖解析率提高絢20%。標準肽段數(shù)據集與騰沖嗜熱厭氧菌蛋白質樣本數(shù)據集的鑒定結果表明,與PIRMD相比,CHIFP并沒有顯著提高總譜圖的鑒定率(僅提高1~2%),但TTE蛋白質樣本的肽段鑒定結果與蛋白質鑒定結果證明,CHIFP可有效增加對混合譜圖的解析能力,受此影響的肽段鑒定數(shù)目增加了4%,而蛋白質鑒定數(shù)則增加了約10%,且經該算法過濾后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論