通過對比學習和參考指導準確注釋單細胞染色質可及性數據
染色質可及性是 DNA 的一個基本特性,在基因調控和細胞身份中發揮著關鍵作用,是指核大分子可以接近 DNA 并與 DNA 相互作用的程度。隨著單細胞染色質可及性測序 (scCAS) 技術的快速發展,scCAS 數據中細胞類型注釋的重要性不斷上升,因為它有可能捕獲控制每種細胞類型中基因轉錄的染色質調控景觀。然而,現有的自動注釋方法仍然存在很大的局限性,包括注釋準確性低、無法整合參考數據的信息以及無法識別新的細胞類型。
近日,Quantitative Biology發表了題為“Accurate cell type annotation for single-cell chromatinaccessibility data via contrastive Learning and Referenceguiding”的方法,該方法是一種基于對比學習框架的參考引導自動注釋方法,能夠有效識別新穎的細胞類型。細胞類型。通過對多個 scCAS 數據集進行廣泛的實驗,RAINBOW 在已知和新穎的細胞類型注釋方面展示了其優于最先進方法的優越性。
RAINBOW基于對比學習框架構建了自動細胞類型注釋模型(圖1),該模型側重于學習同類型細胞之間的共同特征并區分非相似細胞之間的差異,從而增強不同細胞類型的異質性。此外,RAINBOW 將外部參考數據的信息合并為先驗知識。此外,通過對未標記數據進行無監督聚類并選擇平均熵較高的聚類,RAINBOW 可以有效識別新的細胞類型。全面的基準測試實驗表明,RAINBOW 在注釋細胞類型方面優于當前領先的方法。此外,RAINBOW 有望揭示細胞的新生物過程和功能。
免責聲明:本答案或內容為用戶上傳,不代表本網觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。 如遇侵權請及時聯系本站刪除。