蛋白生物標志物發(fā)現(xiàn)是理解病理的非常重要的一步,也是在藥物研發(fā)過程中,鑒定潛在藥物和診斷目標物的重要一步。血漿和血清是關(guān)于一個人健康與否信息的重要來源,盡管投入了大量資金,但很少有新的生物標志物能真正進入臨床。因此需要使用一個相對定量的差別分析方法,發(fā)現(xiàn)這些假定的、跟疾病有關(guān)的標志物,并要求嚴格的實驗放方法來減少樣本與樣本之間的差異性。基于質(zhì)譜的蛋白質(zhì)組學(xué)是一種潛在的強大和有前途的技術(shù),它可以定量和特異性地分析血漿蛋白質(zhì)組。
通過對之前的研究回顧,不難發(fā)現(xiàn)紅細胞溶解、血小板污染和部分凝血引起的質(zhì)量問題會影響所有生物標志物研究中占比的50%,同時如何尋找一些有效方法降低候選生物標記的錯配,必然會對生物標記的發(fā)現(xiàn)存在重要指導(dǎo)意義。
2019年9月30日,德國馬普生化研究所所長、世界著名蛋白質(zhì)組學(xué)專家 Matthias Mann 教授將其最新的研究成果發(fā)表在了國際學(xué)術(shù)期刊EMBO Molecular Medicine(IF=10.624)上。他們利用血漿蛋白質(zhì)組分析,發(fā)現(xiàn)了三個質(zhì)量標記面板,這些質(zhì)量標記面板報告了血漿樣品在紅細胞裂解、血小板污染和部分凝血方面的狀態(tài)。這些面板可以識別到個別樣本質(zhì)量好壞與否,并糾正在生物標志物研究中的系統(tǒng)性偏差。同樣,它們也可以用來評估一種新的生物標志物候選是否與污染源之一有關(guān)。最后,作者還進一步提供了樣本制備指南和在線資源,以評估臨床研究中個別樣本的總體樣本相關(guān)偏差。

研究速讀
1、血漿蛋白質(zhì)組中的紅細胞和血小板蛋白
在之前研究中,作者通過手工和生物信息學(xué)檢查發(fā)現(xiàn)樣品質(zhì)量問題的三類起源:紅細胞,血小板和凝血系統(tǒng)。因此,設(shè)計實驗來系統(tǒng)地表征血漿蛋白質(zhì)組學(xué)的這些主要質(zhì)量問題。他們先獲得了紅細胞和血小板的參考蛋白質(zhì)組,收集的細胞成分來源于10位健康的女性和10位男性中(樣本策略),每個個體又分五個血液級分:紅細胞、血小板和純血漿(無血小板),并進一步收集了富含血小板的血漿和全血(圖1A)。使用自動化蛋白質(zhì)組學(xué)樣品制備流水線,然后進行液相色譜聯(lián)用高分辨率質(zhì)譜(LC-MS / MS)。此前還通過分析廣泛的預(yù)分離肽段,也已從合并樣本中生成了一個非常深的文庫,使用該文庫進行分析。
最終,他們從61654個序列獨特的肽中鑒定出總共6130種不同的蛋白質(zhì)(圖1B和C)。血小板蛋白質(zhì)組最廣泛(5793種蛋白質(zhì)),在紅細胞中檢測到2069種蛋白質(zhì),在富含血小板的血漿中檢測到1682種蛋白質(zhì),在無血小板血漿中檢測到912種蛋白質(zhì)。富含血小板的血漿與無血小板的血漿的比較表明,血小板可以引入的更多蛋白質(zhì)。作者選擇30種含量最豐富且CV低于30%的蛋白質(zhì),發(fā)現(xiàn)在污染性細胞類型中的表達水平至少比血漿高10倍(圖1D和E)。肌動蛋白和甘油醛-3-磷酸脫氫酶,這兩種蛋白被認為是血漿質(zhì)量起源的特定且獨立的指標。
紅細胞蛋白的明顯污染似乎是血漿蛋白質(zhì)組的一部分,紅細胞組通常在參考人群紅細胞水平與血漿樣品之間具有相對較高的相關(guān)性。相反,在許多血漿樣品中,參考隊列血小板水平與研究中的血漿樣品之間沒有可檢測到的相關(guān)性。所以,明顯的污染蛋白仍可以用作生物標記,但是,在這種情況下其豐度值應(yīng)與參考質(zhì)量面板中的模式不同。

圖1血細胞標志物的鑒定
2. 連續(xù)稀釋實驗驗證了紅細胞和血小板質(zhì)量標記物面板
為了進一步確定之前兩個蛋白質(zhì)組是否正確地量化了血漿中的污染,作者再一次從五個研究參與者中生成了四個紅細胞和血小板池。將這些池分9步稀釋成無血小板血漿,然后進行細胞計數(shù)和蛋白質(zhì)組學(xué)分析(圖2A),得到了與預(yù)期相同的細胞蛋白質(zhì)組與血漿比例下降(圖2B和C)。由于每個組中的蛋白質(zhì)具有相同的來源,因此作者通過對每種細胞類型的強度求和并除以所有定量血漿蛋白的總強度來定義單個變量。這產(chǎn)生了兩個非常強大的“污染指數(shù)”,相對于通過細胞流式細胞儀測定的細胞數(shù)而言,它們呈線性關(guān)系(圖2D和E)。當然,摻入的1:100污染物很容易被檢測到,相當于每升血漿中70000紅細胞或30000血小板的濃度。

圖2 將紅細胞和血小板組分摻入純血漿中,稀釋和分析方案
3. 凝血相關(guān)質(zhì)量標記面板
除了由細胞成分引起的污染外,凝血也可能導(dǎo)致生物標志物研究中的系統(tǒng)偏倚。在臨床實踐中,通常將抗凝劑預(yù)先添加到容器中,快速倒置會使抗凝劑與血液混合,離心后產(chǎn)生純血漿(圖3A)。添加或混合的任何延遲都可能導(dǎo)致部分凝結(jié),在缺少抗凝劑并等待30分鐘的極端情況下,將獲得血清而不是血漿。
為了生成評估血液凝固的面板,作者系統(tǒng)地比較了72個血漿樣本與72個血清樣本(4個人,共18等份)。在總共2099種定量蛋白質(zhì)中,有299種發(fā)生了顯著變化(圖3B)。凝結(jié)后最顯著去富化的蛋白質(zhì)是凝血級聯(lián)反應(yīng)的典型成分,更有趣的是,血清中升高最強的蛋白是高豐度的血小板蛋白。總共有208種蛋白質(zhì)由于凝結(jié)而增加,而91種減少。
為了定義一個可靠的凝血標記物,選擇了血清和血漿之間變化最劇烈的30種蛋白質(zhì)。與紅細胞和血小板標記面板相反,由于血液凝結(jié),凝血標記面板相關(guān)的蛋白質(zhì)或增加或減少,并且它們之間的倍數(shù)變化很大。因為對于減少的蛋白質(zhì)而言,倍數(shù)變化最大,所以可根據(jù)它們計算出凝血標志物的比率(所有血漿蛋白質(zhì)的總和除以血漿升高的凝血蛋白質(zhì)的總和)。比較血清和血漿時,該比率非常可靠,對于這些不同的樣品類型,它們的中位數(shù)比率分別為9和120,被明顯分開(圖3C)。在凝血標記物組中,只有F13A1,PPBP和THBS1與血小板組相同,而與紅細胞組則沒有相同(圖3D)。觀察到的三個質(zhì)量標記物組的低重疊可使其成為高度特定的工具,以闡明樣品相關(guān)偏差的存在和起源。

圖3 凝血質(zhì)量標記面板
4.在具體研究中的應(yīng)用
上面定義的標記物可以在三個層面上評估與樣品相關(guān)的問題:臨床隊列中每個樣品的質(zhì)量、整個研究中的潛在系統(tǒng)偏倚以及單個生物標記物候選物屬于污染物蛋白質(zhì)組的可能性。作者研究了減肥后血漿蛋白質(zhì)組的變化,對52個人進行2個月的熱量限制,然后維持體重1年。血漿蛋白質(zhì)組學(xué)分析的七個縱向樣品揭示了載脂蛋白譜的顯著變化、炎癥蛋白和與胰島素敏感性相關(guān)的標志物的減少。通過計算三個污染指數(shù),分別評估了每個樣品的質(zhì)量。通過這種方式,標記了12個樣品,其中6個樣品被血小板污染,一個樣品的紅細胞水平升高,另外五個樣品則有部分凝結(jié)的跡象(圖4)。
作者在www.plasmaproteomeprofiling.org上創(chuàng)建了一個在線平臺。它提供了用于交互式評估血漿蛋白質(zhì)組數(shù)據(jù)質(zhì)量的工具箱??赏ㄟ^簡單的拖放系統(tǒng)上載MaxQuant搜索結(jié)果表或模板中的蛋白質(zhì)豐度列表,系統(tǒng)自動生成三個污染指數(shù)值,如圖4A所示。如果用戶指示病例和對照,則將對數(shù)據(jù)集進行系統(tǒng)性偏差分析(如火山圖所示)(圖4B),全局相關(guān)圖也與質(zhì)量標記面板的群集一起顯示(圖4C)。

圖4 減肥研究和文獻研究中的質(zhì)量標記面板
總結(jié)以及對未來蛋白質(zhì)組學(xué)研究的建議
基于作者對上述三個質(zhì)量標志物面板的經(jīng)驗以及對數(shù)千種血漿蛋白質(zhì)組的分析,設(shè)計了一個通用指南,以最小化和檢測與樣品采集和處理有關(guān)的偏差(表1)。為了進一步記錄公共變量在采血過程中的影響,還邀請了10名健康個體,并在10個不同的采血管中采集了血液。在該實驗中,系統(tǒng)地改變了血漿/血清的類型,血液樣本管(有或沒有凝膠)以及血液在采樣管中的沉積(真空與拉動系統(tǒng))。最顯著的差異再次出現(xiàn)在血清和血漿之間(圖3B)。作者還發(fā)現(xiàn),從試管中采樣血漿的過程對血小板污染有顯著影響。因此,作者建議離心后不要收集血小板床上方的最低血漿層。從離心到血漿收集的任何延遲都可能引起血小板蛋白污染。這些因素主要影響血小板而不是紅細胞污染指數(shù),這表明來自血小板蛋白質(zhì)組的蛋白質(zhì)是生物標志物候選物錯誤分配的最可能原因。

總之,三個質(zhì)量標記面板能很好地報告血漿樣品在紅細胞裂解、血小板污染和部分凝血方面的狀態(tài)。同時,也發(fā)現(xiàn)了與樣品質(zhì)量相關(guān)的蛋白質(zhì)很多已被綜合文獻調(diào)查顯示為候選生物標志物。作者提供了樣品制備指南和在線資源(www.plasmaproteomeprofiling.org),以評估生物標志物臨床研究中與樣品相關(guān)性偏差,并防止重要生物標志物候選物的錯配。
參考文獻Geyer, P. E., et al., 2019, Plasma Proteome Profiling to detect and avoid sample-related biases in biomarker studies. EMBO Molecular Medicine.
原創(chuàng): Dr.Proteomics 精準醫(yī)學(xué)與蛋白組學(xué)
浙公網(wǎng)安備33010802007965號