본문 바로가기
Computer Science/[21-하] Projects

[Bioinfo] RNA-seq project 1 - (1) data download

by gojw 2022. 7. 25.

 

- data download

- data transformation

- data cleaning

- data mapping

- mapped read counting

- DEGs(Statistical analysis)

- Gene expression pattern

- data visualization

https://www.rna-seqblog.com/trufa-a-user-friendly-web-server-for-de-novo-rna-seq-analysis-using-cluster-computing/

분석을 시작하기 전 데이터를 생산해야하는데, 이미 시퀀싱이 끝난 데이터를 다운로드 받아와서 분석을 진행했다. 

https://www.ncbi.nlm.nih.gov/sra

 

Home - SRA - NCBI

 

www.ncbi.nlm.nih.gov

 

1. BioProject를 선택하고 원하는 종과 시퀀싱 방법을 적는다.

2. 원하는 프로젝트를 고른다.

Accession 번호 (PRJNA806646)을 이용해서 검색이 가능하다.

Project Data > SRA Experiments > Number of Links를 누른다.

3. 프로젝트 중 하나를 선택한다.

4. All Runs를 누른다.

5. Item 중 원하는 것을 선택한다.

Run 이름의 S = 미국의 데이터, RR = 시퀀싱 데이터를 의미한다.

6. Acession list를 다운로드한다. Run 이름들이 적혀있는 텍스트 파일이다.

prefatch —option-file ~/Team4/SRR_Acc_list.txt

원하는 아이템들은 FASTQ 형식으로 받아올 수 있다.

 

참고자료: 충청 ict  AI 바이오인포매틱스 과정

댓글