今天繼續(xù)為大家分享單細(xì)胞組學(xué)的研究方法。
希望對(duì)大家的科研工作有所助益!
按照綜述《Single-cell lineage tracing approaches to track kidney cell development and maintenance》中綜述并整合了單細(xì)胞譜系追蹤的方法,將其分為四大類(lèi)([CRISPR]/CRISPR-associated protein 9 [Cas9]-based、轉(zhuǎn)座子方法、Polylox 方法以及天然條形碼方法)。
1. CRISPR/Cas9-based 方法3.Polylox-based 方法
我們接下來(lái)看幾篇最近發(fā)表的文章,看下單細(xì)胞中譜系示蹤是如何運(yùn)用的。
2025 年在《Cell Reports》發(fā)表的《Dual-nuclease single-cell lineage tracing by Cas9 and Cas12a》,文中介紹了新開(kāi)發(fā)的DuTracer 系統(tǒng),這是一種先進(jìn)的基因記錄系統(tǒng),整合了 Cas9 和 Cas12a,用于單細(xì)胞水平的譜系追蹤和轉(zhuǎn)錄組分析。其具有雙核酸酶基因條形碼和譜系追蹤方法,能減少位點(diǎn)間缺失,在小鼠類(lèi)胚體(EB)和神經(jīng)中胚層類(lèi)器官(NMO)分化中的應(yīng)用,揭示了譜系層次結(jié)構(gòu),闡明了細(xì)胞命運(yùn)決定中復(fù)雜的轉(zhuǎn)錄調(diào)節(jié)因子,如識(shí)別出轉(zhuǎn)錄因子Foxb1在神經(jīng)中胚層祖細(xì)胞(NMP)命運(yùn)決定中的作用,還能區(qū)分心臟細(xì)胞起源等。
DuTracer 是一種整合了 Cas9 和 Cas12a 兩種正交 CRISPR 核酸酶的單細(xì)胞譜系追蹤技術(shù),其核心是通過(guò) Tet-On 和 4-OHT-ERT 誘導(dǎo)系統(tǒng)分別調(diào)控兩種核酸酶的編輯事件,減少傳統(tǒng)單一核酸酶系統(tǒng)中因多位點(diǎn)同時(shí)切割導(dǎo)致的跨位點(diǎn)缺失,同時(shí)在細(xì)胞中插入含 14bp 整合條形碼(intBC)的多拷貝靶標(biāo)陣列以區(qū)分不同整合位點(diǎn)、提升條形碼多樣性;該系統(tǒng)包含雙核酸酶質(zhì)粒(含 Cas9-ERT2 和 Cas12a 編碼區(qū))、靶物質(zhì)粒(mCherry 3'UTR 含 4 個(gè)靶標(biāo))及 gRNA 質(zhì)粒(表達(dá) sgRNA 和 crRNA)。

圖 1 DuTracer 產(chǎn)生的位點(diǎn)間缺失最少
一、HEK293T 細(xì)胞中 DuTracer 的譜系重建能力評(píng)估(對(duì)應(yīng)圖 2)
實(shí)驗(yàn)設(shè)計(jì):
構(gòu)建含高拷貝記錄位點(diǎn)的 HEK293T 細(xì)胞系,從 10 個(gè)細(xì)胞起始,先誘導(dǎo) Cas12a 表達(dá) 22 天,再誘導(dǎo) Cas9 表達(dá) 6 天(圖 2A),通過(guò)單細(xì)胞 RNA 測(cè)序(scRNA-seq)和擴(kuò)增子測(cè)序重建細(xì)胞譜系。
作者發(fā)現(xiàn)了:
譜系樹(shù)深度提升:
優(yōu)勢(shì)克。ê 2800 個(gè)細(xì)胞)的譜系樹(shù)平均深度達(dá) 5 層(圖 2B)。通過(guò)模擬實(shí)驗(yàn)顯示,在相同靶標(biāo)數(shù)量下,雙核酸酶系統(tǒng)(Cas9+Cas12a)比單核酸酶系統(tǒng)(僅 Cas9 或 Cas12a)能重建更深的譜系樹(shù)(圖 2E),因獨(dú)立編輯事件可覆蓋更多細(xì)胞分裂階段。
靶標(biāo)陣列拷貝數(shù)的影響:
細(xì)胞平均含 22 個(gè)整合條形碼(intBCs,對(duì)應(yīng) 88 個(gè)靶標(biāo)),但譜系樹(shù)深度在 10 個(gè) intBCs 時(shí)達(dá)到平臺(tái)期(圖 2G)。Cas12a 因編輯速度快,在 10 個(gè) intBCs 時(shí)飽和;而 Cas9 編輯較慢,在 22 個(gè) intBCs 時(shí)飽和(圖 2H、I),提示不同編輯效率的核酸酶需匹配不同靶標(biāo)拷貝數(shù)。
突變模式驗(yàn)證:
多數(shù)插入 / 缺失(indels)發(fā)生在單個(gè)靶標(biāo)內(nèi),位點(diǎn)間缺失極少,證實(shí) DuTracer 減少信息丟失的有效性。

圖2 HEK293T中DuTracer譜系重建能力評(píng)價(jià)
二、小鼠類(lèi)胚體(EB)中 DuTracer 的條形碼能力與心臟細(xì)胞起源區(qū)分
實(shí)驗(yàn)設(shè)計(jì):
通過(guò)懸滴法誘導(dǎo)小鼠胚胎干細(xì)胞(mESCs)形成 EB,采用 6 種不同誘導(dǎo)策略(起始時(shí)間和持續(xù)時(shí)間不同),追蹤 14 天內(nèi)的分化過(guò)程(圖 3B)。
作者發(fā)現(xiàn)了:
細(xì)胞類(lèi)型與分化偏向:
EB 分化為 6 種主要細(xì)胞類(lèi)型(原始生殖細(xì)胞樣細(xì)胞、神經(jīng)元、腸道細(xì)胞、心臟細(xì)胞等),中胚層(尤其心臟譜系)占主導(dǎo)(圖 3C、D)。
條形碼容量限制:
Cas12a 的條形碼多樣性(熵值)高于 Cas9(圖 3E),且條形碼熵與突變 UMI 分?jǐn)?shù)呈強(qiáng)線性相關(guān)(圖 3F),提示系統(tǒng)存在理論最大條形碼容量。譜系樹(shù)深度與條形碼熵正相關(guān)(圖 3I),且在 D8a 和 D10a 樣本中最深(圖 3H)。
心臟細(xì)胞起源區(qū)分:
通過(guò)單細(xì)胞信息增益(scInfoGain)分析,發(fā)現(xiàn) cardiopharyngeal 中胚層(CPM)與心臟細(xì)胞的譜系關(guān)聯(lián)性(圖 4D),并基于克隆關(guān)系將心臟細(xì)胞分為第一心臟場(chǎng)(FHF)和第二心臟場(chǎng)(SHF)來(lái)源(圖 4F)。SHF 來(lái)源細(xì)胞高表達(dá)特定基因(如 Isl1、Six1),且與 CPM 共享轉(zhuǎn)錄特征(圖 4G)。

圖3 DuTracer顯示小鼠胚樣體中受限的條形碼容量

圖4 譜系追蹤區(qū)分心臟細(xì)胞的起源
三、小鼠神經(jīng)中胚層類(lèi)器官(NMO)中 NMPs 的譜系偏向與分子機(jī)制
實(shí)驗(yàn)設(shè)計(jì):
從小鼠 ESCs 誘導(dǎo)神經(jīng)中胚層祖細(xì)胞(NMPs),形成 NMOs,追蹤早期 NMPs(D3)和晚期 NMOs(D15)的克隆關(guān)系(圖 5B)。
作者發(fā)現(xiàn)了:
關(guān)鍵結(jié)果:
細(xì)胞命運(yùn)偏向:
D3 以 NMPs 為主,D15 主要為脊髓神經(jīng)細(xì)胞和中胚層細(xì)胞(如肌節(jié)、肌祖細(xì)胞)?寺》治鲲@示,NMP 克隆在 D15 表現(xiàn)出明顯的神經(jīng)或中胚層分化偏向(圖 5G、H),例如某克隆含 900 個(gè)細(xì)胞,多數(shù)為肌節(jié)和肌祖細(xì)胞。
Foxb1 的作用鑒定:
通過(guò)比較神經(jīng)偏向與中胚層偏向的 NMPs,發(fā)現(xiàn) Foxb1 在神經(jīng)偏向細(xì)胞中高表達(dá)(圖 6E、F)。敲低 Foxb1 后,NMO 體積變小,神經(jīng)基因(Pax3、Pax6)下調(diào),中胚層基因(T、Foxc1)上調(diào)(圖 6G、H),證實(shí) Foxb1 促進(jìn) NMP 向神經(jīng)譜系分化。

圖5 譜系追蹤揭示了NMP的命運(yùn)偏差

圖 6 DuTracer 有助于發(fā)現(xiàn)命運(yùn)偏向的分子驅(qū)動(dòng)因素
當(dāng)然,也有一些文章直接利用了不依賴(lài)外源基因編輯的方法,在《Genome Biology》上發(fā)表的《Clonal expansion dictates the efficacy of mitochondrial lineage tracing in single cells》中,作者結(jié)合計(jì)算建模和單細(xì)胞組學(xué),探究線粒體 DNA(mtDNA)變體作為譜系追蹤標(biāo)記的有效性。研究發(fā)現(xiàn),多數(shù)亞群特異性變體(SSVs) 是初始細(xì)胞中預(yù)先存在的異質(zhì)性,而非分裂過(guò)程中的新生突變;線粒體譜系追蹤的效能高度依賴(lài)克隆擴(kuò)增程度,在弱克隆擴(kuò)增下區(qū)分真實(shí)譜系的能力有限,而在強(qiáng)克隆擴(kuò)增(如疾病狀態(tài)下的 T 細(xì)胞擴(kuò)增、衰老個(gè)體的克隆造血)中,部分高頻率且穩(wěn)定的 SSVs 可有效標(biāo)記細(xì)胞譜系;同時(shí),研究引入譜系信息評(píng)分(LIS),助力在不同單細(xì)胞基因組數(shù)據(jù)中識(shí)別可靠的線粒體譜系追蹤標(biāo)記。
譜系信息評(píng)分(LIS)對(duì)線粒體譜系追蹤應(yīng)用的推動(dòng)作用
在不同生物學(xué)場(chǎng)景中識(shí)別出的亞群特異性變體(SSVs)在標(biāo)記細(xì)胞譜系時(shí)表現(xiàn)出顯著不同的效能,因此迫切需要一種方法來(lái)識(shí)別真正具有譜系信息的線粒體 DNA(mtDNA)突變;谀M實(shí)驗(yàn)的發(fā)現(xiàn),作者嘗試引入一種定量指標(biāo),用于在單細(xì)胞基因組數(shù)據(jù)中篩選可靠的譜系信息性 mtDNA 變體。
顯然,若一個(gè) mtDNA 變體在某一細(xì)胞亞群中呈固定狀態(tài)(變異等位基因頻率 VAF 接近 100%,即亞克隆純合性),它就能像核基因組變體一樣長(zhǎng)期穩(wěn)定標(biāo)記該亞群。但亞克隆純合性非常罕見(jiàn),因?yàn)榇蠖鄶?shù)亞克隆變體在細(xì)胞內(nèi)呈異質(zhì)性狀態(tài)。因此,作者定義了 “譜系信息評(píng)分(LIS)” 來(lái)量化 SSVs 作為可靠譜系標(biāo)記的能力,計(jì)算公式為:

其中,Mean (VAF) 和 Var (VAF) 分別表示在檢測(cè)到該變體的細(xì)胞中觀察到的 VAF 平均值和方差。LIS 越高,表明該 mtDNA 變體作為細(xì)胞譜系標(biāo)記的可靠性越強(qiáng)。為確定 LIS 的實(shí)用閾值,作者還繪制了精確度 - 閾值曲線(方法部分詳述)。分析顯示,在模擬數(shù)據(jù)中,當(dāng) LIS 閾值設(shè)為約 0.6(0.58)時(shí),精確度可達(dá) 80%(圖 4a)。超過(guò)該閾值后,精確度的提升幅度會(huì)大幅降低。
值得注意的是,高 LIS 的 SSV 定義亞群的祖先世代顯著大于低 LIS 的亞群(圖 2-1b),這表明 0.6 這一閾值確實(shí)可用于 SSVs 的分類(lèi)。隨后,作者通過(guò)調(diào)整參數(shù)(包括不同的 mtDNA 拷貝數(shù)(500、750、1000)、每堿基對(duì)每細(xì)胞分裂的 mtDNA 突變率(μ=10−8、5×10 −8或10−7)以及擴(kuò)增強(qiáng)度(τ=0.1、0.5 和 0.9))生成更多模擬數(shù)據(jù),以測(cè)試 LIS 閾值的穩(wěn)健性。結(jié)果表明,當(dāng)前的 LIS 閾值(0.6)在不同設(shè)置下均能達(dá)到較高的精確度(>80%),穩(wěn)健性良好(圖 4c)。因此,在后續(xù)的單細(xì)胞基因組數(shù)據(jù)分析中,作者采用 LIS≥0.6 來(lái)篩選優(yōu)質(zhì) SSVs。
真實(shí)數(shù)據(jù)中 LIS 的應(yīng)用驗(yàn)證
作者進(jìn)一步將 LIS 應(yīng)用于真實(shí)數(shù)據(jù),以識(shí)別潛在的譜系信息性標(biāo)記。首先分析了之前生成的單細(xì)胞多組學(xué)數(shù)據(jù)集,該數(shù)據(jù)集來(lái)自 4 名年輕供體(22-24 歲)的外周血單核細(xì)胞(PBMC),包含單細(xì)胞轉(zhuǎn)錄組、染色質(zhì)可及性和 mtDNA 突變圖譜。由于這些供體年齡較小,克隆造血(造血過(guò)程中典型的克隆擴(kuò)增過(guò)程)的可能性較低,因此該數(shù)據(jù)集可作為弱擴(kuò)增的實(shí)例。作者在單細(xì)胞水平檢測(cè) mtDNA 突變,每個(gè)細(xì)胞的線粒體基因組覆蓋度約為 20×。隨后,利用染色質(zhì)可及性信息注釋細(xì)胞類(lèi)型,成功注釋出 PBMC 中常見(jiàn)的各類(lèi)細(xì)胞(圖 2-1d)。作者識(shí)別出 SSVs 并計(jì)算每個(gè) SSV 定義亞群的 LIS(圖 2-1e)。由于該數(shù)據(jù)集缺乏真實(shí)譜系信息,作者通過(guò)檢測(cè)每個(gè) SSV 定義亞群內(nèi)的細(xì)胞類(lèi)型相似性來(lái)評(píng)估。在這些年輕供體樣本中,未發(fā)現(xiàn)大量超過(guò) LIS 閾值(0.6)的 SSVs,這與 PBMC 中較低的克隆擴(kuò)增水平一致。值得注意的是,每個(gè) SSV 定義的亞群內(nèi)均觀察到高度的細(xì)胞類(lèi)型多樣性(圖 2-1e-g)。在所有 3 名供體中均觀察到類(lèi)似結(jié)果,但在年輕供體 4 中發(fā)現(xiàn)了少數(shù)高 LIS 的 SSVs(35 個(gè) SSVs 中有 2 個(gè)),表明即使在年輕時(shí)也可能存在克隆擴(kuò)增。
同時(shí)作者還收集了 2 名 70 歲以上老年供體(1 名男性和 1 名女性)的 PBMC 樣本,因?yàn)榭寺≡煅诶夏耆酥懈鼮槌R?jiàn)。通過(guò)對(duì)這兩名個(gè)體的 PBMC 樣本進(jìn)行了 mtscATAC-seq,并用單細(xì)胞染色質(zhì)可及性注釋細(xì)胞類(lèi)型(圖 2-1h)。在每個(gè)細(xì)胞的線粒體基因組平均覆蓋度為 20-40× 的情況下,作者識(shí)別出 mtDNA 突變,并對(duì)兩個(gè)樣本進(jìn)行了 SSV 分析(圖 2-1i)。老年供體中識(shí)別出的 SSVs 的平均 LIS 高于年輕供體。作者還發(fā)現(xiàn),來(lái)自老年供體 1 的 11 個(gè) mtDNA 變體中,有 5 個(gè)可被選為優(yōu)質(zhì) SSVs(LIS≥0.6,標(biāo)為紅色)。有趣的是,與低 LIS 的 SSVs 相比,可靠的 SSVs 表現(xiàn)出偏向性的細(xì)胞類(lèi)型組成。例如,9077T>C 定義的細(xì)胞亞群中,CD8+T 記憶細(xì)胞占 89.3%;9223A>G 定義的細(xì)胞亞群中,NK 細(xì)胞占 66.0%(圖 2-1j)。此外,9077T>C 或 9223A>G 亞群內(nèi)的細(xì)胞在染色質(zhì)可及性方面表現(xiàn)出顯著更近的親緣關(guān)系,表明這些 CD8+T 記憶細(xì)胞或 NK 細(xì)胞可能來(lái)自通過(guò)克隆擴(kuò)增產(chǎn)生的共同祖細(xì)胞(圖 2-1k)。對(duì)另一個(gè)獨(dú)立樣本(供體 2)的分析顯示出與供體 1 相似的結(jié)果?傮w而言,與年輕 PBMC 樣本(圖 2-1d-g)不同,這些結(jié)果強(qiáng)烈表明,在強(qiáng)克隆擴(kuò)增背景下識(shí)別出的 SSVs(尤其是高 LIS 的 SSVs)是有前景的譜系標(biāo)記,進(jìn)一步支持了之前的模擬結(jié)果。
盡管這些結(jié)果與模擬一致,但僅利用染色質(zhì)可及性的相似性來(lái)測(cè)試線粒體譜系追蹤可能導(dǎo)致錯(cuò)誤結(jié)論,因?yàn)樵谀承┣闆r下(如譜系可塑性),染色質(zhì)可及性的相似性與譜系關(guān)系可能不一致。因此,作者利用了另一個(gè) Smart-seq2 數(shù)據(jù)集,其中包括從自身免疫疾病患者中分離的 T 細(xì)胞(圖 2-1l)。我們?cè)俅卫?T 細(xì)胞受體(TCR)定義的克隆結(jié)構(gòu),評(píng)估線粒體譜系追蹤在具有顯著克隆擴(kuò)增的免疫反應(yīng)中的效能(圖 2-1m)。作者首先在系統(tǒng)性紅斑狼瘡(SLE)患者樣本 SLE232 和多發(fā)性硬化癥(MS)患者樣本 MS0816 中進(jìn)行 mtDNA 突變檢測(cè)。在兩個(gè)樣本中識(shí)別出的 SSVs 顯示出多個(gè)高 LIS 的 SSVs,包括 SLE232 中的 3849G>A 和 1201A>G,以及 MS0816 中的 16362T>C(圖 2-1n)。重要的是,通過(guò)比較了 SSVs 定義的亞群與 TCR 序列定義的亞群,發(fā)現(xiàn)這些 SSV 定義的亞群與 TCR 定義的亞群高度一致(圖 2-1n-o)表明這些高 LIS 的 SSVs 可用于識(shí)別真實(shí)克隆。值得注意的是,只有這三個(gè) SSVs(3849G>A、1201A>G 和 16362T>C)表現(xiàn)出低 TCR 多樣性(通過(guò)歸一化香農(nóng)熵 NSE 量化),這再次表明高 LIS 的 SSVs 可作為可靠的譜系標(biāo)記。結(jié)合模擬實(shí)驗(yàn)和多個(gè)單細(xì)胞基因組數(shù)據(jù)集,證明了 LIS 可作為在單細(xì)胞水平識(shí)別真正具有譜系信息的 mtDNA 變體的可靠指標(biāo)。

圖2-1 譜系信息評(píng)分(LIS)可準(zhǔn)確評(píng)估亞群特異性變體(SSVs)的譜系追蹤能力
好了,今天單細(xì)胞譜系追蹤的研究就介紹到這里啦,基于上述的介紹,可以看到單細(xì)胞譜系示蹤分析在研究單細(xì)胞發(fā)育、組織穩(wěn)態(tài)或疾病過(guò)程中如何分化、遷移和轉(zhuǎn)變命運(yùn)都非常有應(yīng)用潛力。樂(lè)備實(shí)作為蛋白檢測(cè)服務(wù)專(zhuān)家,提供了一站式的實(shí)驗(yàn)流程,在實(shí)驗(yàn)和軟件方法開(kāi)發(fā)中都有豐富的經(jīng)驗(yàn)。歡迎各位老師同學(xué)與我們聯(lián)系合作。