출처

참조한 글은 문장의 뒤에 링크를 포함한 출처를 표기해두었습니다.


0. 작성 계기

WMS는 본인이 대학원을 다니며 주로 배운 기술 중 하나이다. 본인 생각에 너무 달려오기만 했기 때문에, 졸업 전 정리가 필요했다. 이미 개인 기록 노트에도 적어놓았지만 이렇게 공개적인 플랫폼에 공유함으로써, 다른 사람들에게 정보를 알리고 나의 기록도 더 체계적이게 정리되지 않을까 생각했다. 취업 전 포트폴리오용으로 사용하기에도 좋을 것 같았다.


1. WMS sequencing이란?

Imgur

WMS는 Whole Metagenome Shotgun의 줄임말이다. 무슨 말인지 더 자세히 알아보기 위해 바로 위의 그림으르 보자. 그림 좌측 상단의 ‘metagenome’이라는 용어는 인간의 장 (gut), 수환경, 흙, 병원 내 환자병동 등 바이러스, 세균 등 게놈 (genome)의 총체라고 이해하면 편하다. 그림을 보면 식별이 안된 여러 생물체의 게놈들이 널려져 있다.

본인은 human gut bacteria를 공부해왔기 때문에, bacteria를 중점으로 계속해서 설명하자면, 이러한 bacteria의 metagenome DNA 추출을 위해서 실제로는 실험을 할 때 사람의 분변 (fecal) 샘플로부터 여러 시약들을 첨가하는 등 방법을 사용하여 DNA를 추출하게 된다.

이때 shotgun sequencing은 DNA를 초음파 처리 (sonication)하여 원하는 크기의 랜덤한 많은 단편 (그림의 우측 상단)들을 얻을 수 있게 한다 (Gallardo AM et al., 1994).

이후 얻은 단편들로부터 시퀀스들을 읽어 서열 정보들을 얻고, 이 데이터들로 여러 분석을 수행한다.

본인은 이 다음 분석들 및 그 과정 중의 데이터 전처리에 필요한 여러 기술들을 이 블로그에 기록하려고 한다.

이러한 기술들을 수행할 때 필요한 코드, 생물정보학 프로그램 정보, 그리고 부족하지만 개인적인 생물학적 견해, 대학원 생활 중 해당 기술들을 수행할 때 있었던 여러 시행착오 (fastq 파일 전처리부터 시각화까지)들을 세세히 적어볼까 한다.


다음글: WMS tech 2- QC와 트리밍