요약

CpG island란, 유전체 (genome) 내에 CpG site가 높은 빈도로 몰려있는 곳을 말한다 (일종의 비유적 표현으로 island라는 용어가 쓰였다).

CpG site란, DNA 염기서열 C와 G가 연이어 존재하는 site를 말한다.

CpG site에서 메틸화 (methylation)가 대부분 일어나는데, DNA의 발현을 시작하는 프로모터 (promoter)에 많이 존재하기 때문에, 메틸화가 DNA의 발현을 억제함으로써 인체의 생리 작용에 영향을 준다 (질병 등).

아래의 글 부터는 다음 링크를 일부 번역했다: wikipedia


CpG site

Imgur

CpG site, 혹은 CG site는 DNA 염기서열인 사이토신 (cytosine, C)과 구아닌 (guanine, G)이 일관된 방향 (5’ -> 3’)으로 연이어 존재하는 site를 말한다.

CpG site 내 Cytosine 염기는 DNA methyltranserases라는 효소에 의해 메틸화 (methylation) 될 수 있다. 포유류에서는 CpG cytosine의 약 70~80%가 메틸화되었다고 한다.

추가정보: 메틸화된 C는 종종 티민 (Thymine, T)으로 변이하기도 한다.


CpG islands 정의 기준

CpG islands, 혹은 CG island는 CpG site가 높은 빈도로 존재하는 region이다.

일반적으로 보통의 CpG island 정의 기준은 다음과 같다.

첫째, 200 염기쌍 (base pair, bp)에 달하는 region에서 CpG site가 높은 빈도로 존재할 때

둘째, 해당 region 내 존재할 것으로 예상되는 CpG site 추정치 (expected CpG) 를, 진짜로 존재하는 CpG site 수 (observed CpG)로 나누었을 때, 다시 말해서 예측된 CpG 수 대 진짜로 존재하는 CpG 수의 비율이 60% 이상일 때

expected CpG 공식: (C 개수 * G 개수) / 서열의 길이
observed CpG 공식: (CpG 수)


CpG islands 특성

포유류의 유전체 (genome) 내 많은 유전자들이, 시작 지점 (promoter region)에서 CpG island를 가진다. 그렇기 때문에 CpG island를 가지고 gene이 어딨는지 예측하는데 쓰이기도 한다고 한다.

또한 사람의 생존에 있어서 필수적인 유전자 (house-keeping gene)들의 거의 대부분이 promoter 쪽에 CpG island가 존재한다고 한다.

CpG island는 CpG site가 많이 몰려있는 곳이고, CpG site에는 메틸화가 일어날 가능성이 높다. 만약 위 내용대로 CpG site가 DNA promoter내에 많이 몰려있으면, DNA promoter 내 메틸화가 일어날경우 발현에 필요한 다른 단백질들이 promoter에 달라붙기 어렵고, 발현을 하기 어려워진다. 즉 CpG island가 중요한 유전자들의 발현을 조절하며, 생존에도 영향을 미친다는 것이다.

추가정보: 일반적으로, CpG island에서는 CpG 빈도가 4~6& 이고, 이는 CpG 추정치 대비 60% 정도가 실제로 CpG가 있는 것으로 확인되었다 (CpG 빈도와 CpG 추정치 대비 CpG 실제 값의 비율은 다르다. 혼동하지 않도록 하자.). 그러나 CpG island 외 다른 유전체 region에서는 CpG 빈도 (1%)가 훨씬 낮은데, 이러한 현상을 CG 억제 (CpG suppression) 라고 부른다.


Imgur


이전글: 후성유전학 1. 개요

다음글: 후성유전학 3. DDS R package 원리 1