본문 바로가기
강의 및 공부/Bioinformatics-생물정보학

[단일세포] scATAC-seq 10X cellranger-arc 원리

by life_is_egg 2024. 2. 20.
반응형

single cell multiome 10X library 및 cellranger-arc 원리에 대해 공부중이다.

추가로 공부하는 내용이 있다면 계속 추가할 예정이다.


1. 멀티옴 ATAC 라이브러리 구성

Gene Expression Library에 대한 내용은 추후 추가 예정

- P5, P7: Illumina amplification을 위한 서열

- 10X barcode: 세포를 구분하기 위한 cell barcode

- Spacer: ATAC oligo barcode(바코드)로, transposed DNA fragments가 결합(attachment)할 수 있는 바코드 (길이 8bp)


2. ATAC matrix 가공 과정

multiome FASTQ를 가공하여 peak-barcode 매트릭스를 만들기 위해서는  cellranger-arc count 코드 한 줄만 입력하면 되지만,

그 코드 한 줄에는 복잡한 가공과정이 포함되어 있다.

 

https://support.10xgenomics.com/single-cell-multiome-atac-gex/software/pipelines/latest/algorithms/overview

(Input) ATAC FASTQs ➡️ (Output) Peak-Barcode matrix

1. Barcode processing

: sequencing error에 의한 cell barcode 서열에 오류가 있는지 확인하는 과정으로, 10x의 valid barcode list와 비교하여 barcode의 valid를 평가함.

2. Read trimming 

: 현재 기술로는 완벽히 원하는 서열만 읽어낼 수는 없고, read의 3' 말단에 primer(프라이머) 서열의 reverse complement가 포함되어 있을 수 있음. 이를 cutadapt 툴과 유사한 알고리즘을 통해 프라이머 서열을 인식하고 잘라냄(trimming).

3. Read alignmnent

: BWA-MEM 알고리즘을 이용

4. Duplicate marking

: PCR에 의한 duplication 탐지 및 제거하는 과정으로, fragments의 start, end position 및 cell barcode를 이용하여 duplicates를 찾음.

5. Peak calling

: fragments 중에는 nucleosome이 있는 영역이 포함되어 있음. 실제 TF가 접근할 수 있는 open chromatin 영역 즉, accessible regions을 찾기 위한 과정 ▶️ cellranger 결과 대신, macs2를 사용하길 권장

6. Peak-Barcode matrix

: Output

 

 

 

Reference
더보기
반응형

댓글