반응형
여러 ATAC 데이터를 합쳐서 가공하기 위해서는 fragments 파일을 merge 하는 과정이 필요함.
이전 버전의 Signac 튜토리얼에서 fragments merge 방법에 대해 올려둔 것이 있어 따라 했는데,
계속 tabix 단계에서 오류(chromosome blocks not continuous)가 발생함.
찾아보니까 파일 sorting이 제대로 되어 있지 않아서 그렇다고 함
문제의 코드
# merge files (avoids having to re-sort)
sort -m -k1,1 -k2,2n atac_fragments_MCA3M.tsv atac_fragments_MCA12W.tsv atac_fragments_MHA12W.tsv > atac_fragments.tsv
# block gzip compress the merged file
bgzip -@ 8 atac_fragments.tsv # -@ 8 uses 8 threads
# index the bgzipped file
tabix -p bed atac_fragments.tsv.gz
Signac 튜토리얼을 따라 코드를 돌렸더니 아래와 같은 에러가 발생함
tabix Error [E::hts_idx_push] chromosome blocks not continuous
에러 해결한 코드
# merge files (avoids having to re-sort)
cat atac_fragments_MCA3M.tsv atac_fragments_MCA12W.tsv atac_fragments_MHA12W.tsv > atac_fragments.tsv
sort -k1,1 -k2,2n atac_fragments.tsv > sorted_atac_fragments.tsv
# block gzip compress the merged file
bgzip -@ 8 sorted_atac_fragments.tsv # -@ 8 uses 8 threads
# index the bgzipped file
tabix -p bed sorted_atac_fragments.tsv.gz
깃헙 찾아보니까 sort 버전 문제라는 말이 있었으나 sort 버전을 바꾸기는 귀찮아서 혹시나 데이터를 합치고
다시 sort를 해주었더니 성공적으로 돌아감
정확한 원인은 모르지만 아무튼 성공!
(원인 파악을 위해서는 sorting 전 후 파일을 뜯어봐야 할 것 같음)
참고사이트
1. https://stuartlab.org/signac/0.2/articles/merging#merge-fragment-files-1
2. https://github.com/bcbio/bcbio-nextgen/issues/624
반응형
'프로그래밍 > 환경 구축 및 기타' 카테고리의 다른 글
005.[conda] 환경 충돌 해결 및 환경 복사 (1) | 2024.06.17 |
---|---|
004.[vscode]R terminal 오류: cannot open file '/home/~/.vscode-server/extensions/reditorsupport.r-2.8.3/R/session/init.R': No such file or directory (0) | 2024.05.20 |
003.[vscode]ssh 원격서버에 비밀번호 없이 접속하기 (0) | 2024.03.20 |
002.[vscode]VSC 자동업데이트 끄기(비활성화) (0) | 2024.02.23 |
001.[remote ssh]VScode 서버에 원격 접속하기 (0) | 2024.02.23 |
댓글