- data download
- data transformation
- data cleaning
- data mapping
- mapped read counting
- DEGs(Statistical analysis)
- Gene expression pattern
- data visualization
분석을 시작하기 전 데이터를 생산해야하는데, 이미 시퀀싱이 끝난 데이터를 다운로드 받아와서 분석을 진행했다.
https://www.ncbi.nlm.nih.gov/sra
1. BioProject를 선택하고 원하는 종과 시퀀싱 방법을 적는다.
2. 원하는 프로젝트를 고른다.
Accession 번호 (PRJNA806646)을 이용해서 검색이 가능하다.
Project Data > SRA Experiments > Number of Links를 누른다.
3. 프로젝트 중 하나를 선택한다.
4. All Runs를 누른다.
5. Item 중 원하는 것을 선택한다.
Run 이름의 S = 미국의 데이터, RR = 시퀀싱 데이터를 의미한다.
6. Acession list를 다운로드한다. Run 이름들이 적혀있는 텍스트 파일이다.
prefatch —option-file ~/Team4/SRR_Acc_list.txt
원하는 아이템들은 FASTQ 형식으로 받아올 수 있다.
참고자료: 충청 ict AI 바이오인포매틱스 과정
'Computer Science > [21-하] Projects' 카테고리의 다른 글
[Bioinfo] RNA-seq project 1 - (2) data cleaning, indexing (0) | 2022.08.12 |
---|---|
[캐글] Tabular Playground Series - April 회고 (0) | 2022.05.01 |
[캐글] Tabular Playground Series - November 회고 (0) | 2021.12.01 |
[캐글] Tabular Playground Series - October 회고 (0) | 2021.11.05 |
[캐글] 첫번째 노트북 발행 - Fish Market (0) | 2021.09.05 |
댓글