單細胞數據高級分析——解碼細胞通信網路

2935 人參與      分類 : 科學  

前言


多細胞生物是由不同類型的細胞組成開放社會,這個社會中的單個細胞間必須協調它們的行為,為此,細胞建立通訊聯絡是必需的。細胞通訊是指一個細胞發出的信息通過介質傳遞到另一個細胞產生相應的反應,通過化學信號分子進行細胞間通訊是動物和植物最普遍採用的通訊方式。配體-受體複合物介導的細胞-細胞通訊對協調發育、分化和炎症等多種生物學過程具有至關重要的作用。


複雜的細胞外反應始於配體與其同源受體的結合和特定細胞信號通路的激活,定位這些配體-受體相互作用是理解細胞行為和對鄰近細胞反應的基礎。隨著單細胞RNA測序的日益流行,RNA測序數據量的指數增長,使得測量多種細胞類型中配體和受體的表達,並系統地解碼細胞間通信網路,最終解釋組織在穩態中的功能及其在疾病中的變化成為可能。


CellPhoneDB 簡介


為了研究不同細胞類型間的細胞通訊網路如何使生理過程得以進行的,英國 Sanger 研究所的 Teichmann 實驗室和 Vento-Tormo 實驗室聯合開發了 CellPhoneDB[1],一個配體、受體及其相互作用的資料庫,用於細胞通訊網路的系統分析。該資料庫利用了來自 UniProt、Ensembl、PDB、IUPHAR等資料庫的信息,共存儲了978種蛋白質:501種為分泌蛋白,585種為膜蛋白。這些蛋白質參與1396種相互作用,其中,有474種相互作用涉及分泌蛋白,490種相互作用僅涉及膜蛋白(圖1)。

與其他資料庫相比,CellPhoneDB的一個主要優點是它考慮了配體和受體的結構組成,準確地描述了異聚複合物。這一點對於許多細胞因子等蛋白質家族來說尤其重要,因為配體-受體相互作用通常涉及多個亞單位,其中受體共享結構亞單位,配體的親和力由受體亞單位的特定組合決定。在儲存在CellPhoneDB中的所有蛋白質中,466種是異聚體。

單細胞數據高級分析——解碼細胞通信網路

圖1 CellPhoneDB 資料庫概述


CellPhoneDB 進行細胞通訊分析原理


CellPhoneDB 集成了一種計算方法,用於從 scRNA-seq 數據中識別與生物學相關的配體-受體相互作用。CellPhoneDB的輸入scRNA-seq數據中應包含有counts定量數據和細胞類型注釋信息,具有相同細胞類型注釋的細胞以細胞狀態聚合在一起(圖a)。

單細胞數據高級分析——解碼細胞通信網路

CellPhoneDB 根據一種細胞類型中受體的表達和另一種細胞類型中配體的表達,預測兩種細胞狀態之間豐富的配體-受體相互作用。首先,對於細胞群中的每個基因,計算表達該基因的細胞百分比和基因表達平均值。只有表達受體和配體基因的細胞佔比超過指定的閾值時(默認為10%),該配體-受體對才會被納入分析。對於聚合體而言,則選擇表達平均值較小的亞基的表達值代表該受體的表達用於後續的統計分析(圖b)。

單細胞數據高級分析——解碼細胞通信網路

然後在數據集中的所有細胞類型之間執行成對比較。首先,隨機排列所有細胞的細胞類型標記,形成新的細胞群(默認隨機排列1000次),計算隨機排列後細胞群中配體的平均表達水平和與其相互作用的細胞類型中受體的平均表達水平的平均值。通過這種方式,在兩種細胞類型之間的每對配對比較中為每個配體-受體對生成一個零分布(圖c)。

單細胞數據高級分析——解碼細胞通信網路

生成零分布之後,按照原細胞分群計算兩種細胞類型間配體-受體對的實際平均值,根據計算平均值等於或高於實際平均值的比例推測該受體-配體對在這兩種細胞類型中可能的顯著性P值(圖d)。

單細胞數據高級分析——解碼細胞通信網路

之後,根據兩種細胞類型中富集到的顯著的配體-受體對的數量,對細胞類型之間高度特異的相互作用進行排序,以便手動篩選出生物學相關的相互作用關係。這樣,通過特異性的蛋白複合物,預測了細胞群之間可能的分子相互作用,產生了細胞群間潛在的通訊網路,這些網路可以通過直觀的表格和圖表進行可視化(圖e)。

單細胞數據高級分析——解碼細胞通信網路


細胞通訊分析應用


CellPhoneDB 分析細胞通訊網路可以推廣到任何包含潛在相互作用細胞群單細胞轉錄組數據中,並且已在多個單細胞圖譜中得以應用。例如:

  1. Braga 等使用 CellPhoneDB分析識別了健康氣道和哮喘氣道中細胞間相互作用的變化,確定了健康氣道中以間充質-上皮相互作用為主的細胞通訊網路在哮喘氣道中轉向以Th2細胞為主[2];
  2. Stewart 等在腎臟的背景下,使用細胞間相互作用分析方法有助於揭示上皮免疫系統的串擾,從而協調抗菌巨噬細胞和嗜中性粒細胞向腎臟最易感染區域的富集[3];
  3. 在2019年的一個單細胞圖譜分析中,Popescu 等通過涉及與造血相關的重要的分子如VCAM1、ITGB1和ITGA4分子等的相互作用,確定了紅細胞和EI巨噬細胞之間的相互作用[4]。
  4. 此外,CellPhoneDB 資料庫是使用人類特有的配體-受體相互作用創建的,但是通過將人類基因映射到同源的小鼠基因上,也可以應用於小鼠數據集。Davidson 等在18年通過細胞通訊框架證明了在小鼠黑色素瘤模型的腫瘤微環境中,不同細胞之間複雜的相互作用[5]。


歐易細胞通訊分析結果展示


單細胞數據高級分析——解碼細胞通信網路

圖片說明:所示左圖為點圖,展示了ligand-receptor對在不同細胞類型中的表達強度和特異性;所示右圖為熱圖,展示了不同細胞類型中相關作用的數量。

左圖中,行表示具有細胞間通訊關係的ligand-receptor對,列表示發生細胞通訊的細胞類型,圓圈大小表示顯著性水平,圓圈越大表示越顯著,圓圈顏色越紅表示細胞間通訊關係越強;右圖中,行和列都表示為細胞,每格表示細胞間的相關作用的數量,顏色越紅表示細胞間的相互作用數目越多,即細胞間通訊關係越強。


單細胞數據高級分析——解碼細胞通信網路

圖片說明:所示為細胞通訊網路圖,顯示不同的細胞類型之間檢測到配體-受體相互作用的數量。

圖中分別標記了正向(從信號細胞到目標細胞)和反向信號,同時測量了每個細胞類型內的自分泌信號。網路圖的節點按照細胞類型進行顏色編號,邊緣按信號和目標細胞之間的相互作用的數量進行標記和縮放。


單細胞數據高級分析——解碼細胞通信網路

圖片說明:所示為細胞通訊circos圖,顯示了每種相互作用的方向。其中最外圈表示每個相互作用的配體-受體基因對的詳細信息,基因表達由低到高由顏色由黃到紅表示;第二圈表示細胞類型,不同的細胞類型用不同的顏色表示;最內圈表示配體-受體基因對的作用關係,實線表示信號強度顯著,虛線表示不顯著。用戶可以選擇要在circos圖中顯示的細胞類型、基因類別和相互作用的數量。


總結


細胞通訊分析以細胞亞群的基因表達量數據為研究對象,獲取細胞中的配體及受體信息,獲得細胞間的信號通訊網路,在闡明生物學過程中細胞間通訊的複雜性、多樣性和動態性方面有重要意義。


參考文獻

[1] Efremova, M., Vento-Tormo, M., Teichmann, S.A. et al. CellPhoneDB: inferring cell–cell communication from combined expression of multi-subunit ligand–receptor complexes. Nat Protoc (2020).
[2] Braga, F. A. V. et al. A cellular census of human lungs identifies novel cell states in health and in asthma.Nat. Med. 25, 1153–1163 (2019).[3] Stewart, B. J. et al. Spatiotemporal immune zonation of the human kidney. Science 365, 1461–1466 (2019).[4] Popescu, D.-M. et al. Decoding the development of the blood and immune systems during human fetal liver haematopoiesis. Nature 574, 365–371 (2019).[5] Davidson, S. et al. Single-cell RNA sequencing reveals a dynamic stromal niche within the evolving tumour microenvironment. Preprint at bioRxiv: https://doi.org/10.1101/467225 (2018).


猜你想看


  • 單細胞方向:


END


本文系歐易生物原創

轉載請註明本文轉自歐易生物