유전자 분석 관련 서비스 제공사인 Applied Biological Materials 사에서 제공하는 NGS 관련 영상. Youtube 채널에서 NGS 이외에도 CRISPR/Cas9, Cell Culture, AAV system 등에 대한 설명 영상을 제공하고 있다.

Sequencing 기술 발달 속도를 고려할 때 무려 2년 전에 올라온 영상이라 현재 기술과는 좀 거리가 있을 수 있지만, Sequencing을 이해하려면 그 개발 역사를 알아야 하기에...



  1. NGS - An Introduction (link)
- Sanger's Method: 1977년 개발, 현재에는 NGS data validation 용으로 종종 사용
- 4 main DNA sequencing methods by NGS systems
     - Pyrosequencing: PPi release로 인해 발생하는 light emission을 이용. Reading length는 길지만 비싸고 에러가 많음. Human genome을 충분히 coverage 할 수 없음
     - Sequencing by Synthesis: 염기마다 다른 형광 dye를 달아놓고 발생하는 형광을 이용. 다른 염기의 형광이 제대로 wash되지 않으면 에러 증가. 주로 이 방법을 많이 사용. Illumina의 영상을 참고하면 좋다
     - Sequencing by Ligation: DNA pol대신 Ligase를 이용하여 형광이 붙어있는 8-mer 올리고를 붙이면서 리딩하기 때문에 length가 짧다  
     - Ion Semiconductor Sequencing: Nucleotide가 붙을 때마다 방출되는 H+를 감지할 수 있는 semiconducter를 이용. 제일 비싸다



  1. NGS - Sample Preparation  (link)
- 키트를 이용해서 하고자 하는 sequencing에 필요한 library를 준비
- Whole Genome Seq.
     - TruSeq PCR-free Library Prep. Kit: 자르고 end repair 한 뒤, 앞뒤로 adapter 붙이고 library를 만들어서 qPCR을 이용
     - TruSeq Nano DNA Library Prep. Kit: 더 작은 양의 DNA 분석 시 사용
     - Nextera DNA Library Prep. Kit: Transposome을 이용하여 DNA를 자르고 adapter sequence를 삽입 (Tagmentation)
     - Nextera DNA XT Library Prep. Kit: 유전체 사이즈가 작은 경우 사용
- Exome Seq.
     - Nextera Rapid Capture Exome Kit: Biotin-Streaptavidin을 이용해서 hybridize
     - Nextera Rapid Capture Expanded Exome Kit: UTR, miRNA binding site 등을 증폭 시 사용
- RNA Seq.
     - TruSeq Stranded Total RNA Kit: rRNA를 bid로 붙여서 제거하고, 남은 부분만 잘라서 primer 붙이고 cDNA 합성
     - TruSeq Stranded mRNA Kit: 샘플의 gene expressioon profile을 확인할 때 사용.
     - TruSeq Small RNA Kit: miRNA, small non-coding RNA 등을 확인할 때 사용. RT-PCR 이용
- Methylation Seq.
     - TruSeq DNA Methylation Kit: Genome의 Methylation pattern 확인ㄴ하는 경우 사용. 



  1. NGS - Coverage & Sample QC (link)
- Coverage
     - 99% 정확하면 좋은 게 아니다. 100개중에 1개가 틀리기 때문에, 30억개를 읽으면....
     - Coverage per genome = Total output / Total sample sequence size (e.g. Illumina HiSeq 2500: 1,000bn / 3bn = 333x)
     - 몇배의 coverage로 읽을 것인지 정하는 것이 중요 (전문가와 상담하세요)
- Sample QC: 양도 많고, 질도 좋아야 한다. 즉, 충분한 양의 Library를 잘 구축해야 한다.
- Quantitative Validation: qPCR, Qubit 등을 이용함
- Qualitative Validation



  1. NGS - Data Analysis (link)
- Raw Data Output: .bcl format으로 출력되며, 통용되는 형식인 fastq format으로 변환해줌
- Sequence Alignment
     - fastq data를 Reference genome과 비교하는 과정
     - BWA, Bowtie2, Maq, Stampy, Novoalign 등을 이용
     - 만약 reference genome이 없다면 de novo로 align해서 contig를 만든다
     - 이를 통해 SAM/BAM format이 탄생함: mapped sequence를 읽을 수 있는 형식
- Variant Calling
     - Mapped data와 Reference genome과 비교해서 SNP, SNV, Indel 등을 찾아내는 과정.
     - SAMtools mpileup, GATK 등을 사용, 이후 Data visualization
- Additional SW&Tools
     - FastQC, Picard 등을 이용해서 파일 treating



  1. NGS - Application of WGS (link)
- De novo Genome Assembly
     - Contig, Scaffold 등을 거쳐서 genome을 합성할 수 있음 (e.g.  Flax project)
- Pathogen Outbreaks
     - 병원균을 추적할 수 있음. (e.g. Campylobacter jejuni)
     - PFGE (pulse-field gel electrophoresis)가 널리 사용
- Molecular Evolution
     - 유전자를 통해 개체의 evolution 과정을 추적


+ Recent posts