Cell2location 采用分層貝葉斯框架,假設基因表達計數遵循負二項分布。 它首先使用外部 scRNAseq 數據作為參考來估計細胞類型特異性特征。 觀察到的空間表達計數矩陣用負二項分布建模,其中基因可用的特定技術敏感性、基因和位置特定的加性偏移作為平均參數的一部分包括在內 。 然后 cell2location 使用變分貝葉斯推理來近似后驗分布并相應地產生參數估計 。
使用變分推理 (DestVI) 對空間轉錄組學剖面進行反卷積是一種用于 ST 數據多分辨率分析的概率方法 。 DestVI 通過連續的潛在變量明確地模擬細胞類型內的變化,而不是將分析限制在細胞類型的離散視圖中。這種連續的細胞內類型變化以及相應的細胞類型特定配置文件是通過條件深度生成模型學習的,特別是使用解碼器神經網絡的變分推理。在該方案中, 分別為 scRNA-seq (scLVM) 和 ST 數據 (stLVM) 構建了兩個不同的潛在變量模型 (LVM) 。 DestVI 同樣假設觀察到的轉錄本的數量遵循負二項分布。 stLVM 使用由 scLVM 訓練的解碼器神經網絡,并使用最大后驗 (MAP) 推理方案獲得細胞類型比例,其中假設每個點中觀察到的轉錄本的數量遵循推斷的單細胞的加權和負二項分布。
RCTD 最初是為 Slide-seq 數據設計的,但它也可以用于其他 ST 數據。 它假設觀察到的每個spot的spot-level基因計數遵循泊松分布,同時通過包含基因特異性隨機效應項來解釋平臺效應 。 RCTD 首先使用外部 scRNA-seq 參考數據來估計每種細胞類型的平均基因表達譜。 然后通過選擇跨細胞類型的差異表達 (DE) 基因來執行基因過濾,并估計基因特異性平臺效應的方差。 將推斷的平臺效應插入概率模型以獲得細胞類型比例的最大似然估計 (MLE)。
STdeconvolve 是一種針對 ST 數據的無參考和無監督細胞類型反卷積方法 。 STdeconvolve 與其他方法的主要區別在于 STdeconvolve 可以在不使用外部 scRNA-seq 參考的情況下執行細胞類型反卷積。 該方法建立在潛在狄利克雷分配 (LDA) 的基礎上,以識別每種細胞類型的推定轉錄譜及其在每個 ST 點中的比例,其定義為由多項式分布和細胞類型分布建模的預定數量的細胞類型的混合物是從uniform Dirichlet distribution中得出的。 STdeconvolve 假設每種細胞類型都存在高度共表達的基因,并選擇顯著過度分散的基因來告知潛在細胞類型。
Stereoscope 實現了反卷積目的,同時使用帶注釋的 scRNA-seq 參考和 ST 數據對細胞類型進行空間映射。 Stereoscope 還依賴于常用的假設, 即空間和單細胞數據的計數均遵循負二項分布 。 Stereoscope 包含一個噪聲術語作為“虛擬”細胞類型的一種形式,以解釋不對稱數據集,其中細胞類型在空間和單細胞數據中沒有完美重疊。 MLE 用于使用 scRNA-seq 參考數據估計細胞類型特定參數,MAP 用于推斷 ST 數據中的細胞類型混合。
SPOTlight 是一種反卷積算法, 它采用非負矩陣分解 (NMF) 回歸算法以及非負最小二乘法 (NNLS) 。 在 SPOTlight 中,執行 NMF 以識別 scRNA-seq 參考中特定于細胞類型的top profile,并執行 NNLS 來識別spot top profile,這是反卷積的結果。 此外,據報道, SPOTlight 在不同的生物場景和具有匹配和外部參考的不同技術版本中執行靈敏且準確 。
DSTG 是一種 基于相似性的半監督圖卷積網絡 (GCN) 模型,可以恢復每個點的細胞類型比例 。 通過利用 scRNA-seq 數據,DSTG 首先通過隨機匯集從 scRNA-seq 數據中選擇的 2 到 8 個細胞作為 ST 點,構建稱為“偽 ST”的合成 ST 數據。 然后,為了捕捉點之間的相似性并合并偽 ST 和真實 ST 數據, DSTG 通過在典型相關分析 (CCA) 識別的共享空間中找到相互最近的鄰居來學習鏈接圖 。 半監督 GCN 使用偽和真實 ST 數據和鏈接圖進行訓練,可用于預測真實 ST 數據中的細胞類型比例。
總之,許多功能強大的 ST 反卷積工具已經專門針對 ST 數據集開發和定制。 這些方法在模擬和真實數據集中都證明了它們的實用性。 通過了解 ST 數據中的細胞比例變化以及空間信息進行下游分析,我們可以更好地揭示潛在的生物學機制,并進一步發現使用 scRNA-seq 數據集無法實現的新發現。 然而,目前還沒有對這些細胞去卷積方法進行公平和全面的比較。 我們將使用多個真實的 ST 數據集,包括單細胞水平分辨率和帶有病理學家注釋的點級分辨率 ST 數據,以系統和客觀地評估這些方法的性能 。
總而言之, 沒有一種方法能夠在不同的組織類型中始終優于其他方法 。在研究中測試的大多數概率方法,尤其是 Adroit、RCTD、Cell2Location 和 Stereoscope,在整個組織中都表現出始終如一的高性能。 STdeconvolve 作為唯一的無參考方法,具有識別組織結構和細胞混合物的能力,但必須仔細處理細胞類型映射。徹底評估了各種情況,包括不同的組織、不同的技術和數據分辨率、不同數量的單細胞和斑點,以及用于分析的基因的數量和類型。因此, 建議調查人員首先確定我們評估的一些與他們自己的數據最匹配的情景,并在這些情景下選擇表現最佳的方法 。

With the use of the appropriately chosen methods and gene sets, we hope the increased accuracy of cell mapping inference will assist in the future downstream analyses
噪聲和高維 ST 數據的去噪和降維可以允許更有效的信息提取。我們預計細胞類型反卷積將進一步受益于有效去噪和減少 ST 數據維度的方法的開發和進步 。
生活很好,有你更好