Whole Genome Sequencing (WGS) and Metagenomics
유전자 서열이란 무엇입니까??
생명체가 성장하고, 번식하고, 성숙해지는 데 필요한 모든 정보는 일반적으로 C, G, A, T로 간략히 불리는 뉴클레오타이드라고 하는 4개의 구성 단위의 서열 속에 암호화되어 있으며, 이 서열은 디옥시리보핵산(DNA)라고 불리는 세포 내에 있는 긴 사슬로 중합됩니다. DNA는 두 개의 평행한 사슬로 구성되어 있으며 사슬을 따라 존재하는 뉴클레오티드는 종종 염기쌍이라고 불리기도 합니다. DNA 내의 코딩 서열은 유전자라고 불리며, 효소나 다른 단백질과 같은 서로 다른 생물학적 기능에 대한 정보를 포함하고 있습니다. 비암호화 DNA는 합성을 조절하는 역할을 하지만 아직 발견되지 않은 알려지지 않은 기능도 포함하고 있습니다. 세포 내부의 수십억 개의 염기쌍 서열이이 특정한 생물의 게놈을 구성하는 염색체 형태로 배열됩니다. 생명체가 살아가면서 특정 단백질과 같은 무언가를 필요로 하면, 해당하는 유전자의 정보가 리보핵산(RNA) 형태의 개별적이고 움직임이 자유로운 청사진으로 복사되며, 이를 세포가 읽어 필요한 것을 만들게 됩니다.
살모넬라 박테리아의 특정 균주와 같은 유기체의 DNA에 암호화되어 있는 것과 그로 인한 생물학적 결과, 예를 들어 항생제에 대한 내성 또는 인내력과 같은 결과 사이의 연결을 이해하는 것에는 엄청난 가치가 있습니다. 이와 유사하게, DNA가 특정한 신체적 특성을 정의하기 때문에 DNA 서열에 대해 아는 것은 낭포성 섬유증, 근이영양증 등의 유전적 장애를 예측 혹은 극복하는 데 도움이 될 수 있다는 것이 알려져 있습니다. 하지만, 이러한 정보를 얻는 과정은 DNA 안의 구성 요소의 서열에 의존하기 때문에 대개 어렵습니다.
Whole Genome Sequencing WGS란 무엇입니까??
Whole genome sequencing 분석은 한 번에 특정 유기체의 DNA 안의 모든 C, G, A, T 뉴클레오티드의 순서를 측정하는 것입니다. 최초로 획득된 전체 인간 게놈(길이 약 30억 염기쌍)은 서로 다른 인물들의 여러 개별적인 측정값을 짜맞추어 측정 및 보고되었습니다. 방대한 분량의 비암호화 DNA를 포함하는 인간의 전체 게놈 염기서열 분석은 주로 비용과 시간이 많이 소요되기 때문에 일반적이지 않습니다. 그러나, 질병의 위험이나 혈통과 관련된 개인 DNA의 특정 부분에 보다 집중해서 이루어지는 염기서열 분석은 이제 일반화되었으며 개인 맞춤형 의료 및 의약품에 사용되는 강력한 도구입니다. 그러나 Whole genome sequencing 분석은 박테리아와 같은 단순한 생물에게서 더 쉽게 달성할 수 있으며, 유전 정보와 생물학적 기능을 연결짓는 지식 기반은 지속적으로 커져 가고 있어 유전자 염기서열 분석에 추가적인 가치를 제공합니다.
Sanger Whole Genome Sequencing Method
DNA 염기서열 분석의 Sanger 분석법은 1977년 개발되었으며, 역사적으로 가장 널리 사용된 방법입니다. 이 방법은 소규모의 표적 염기서열 분석 프로젝트의 방법으로서 오늘날에도 여전히 사용되고 있습니다. Sanger 분석법의 핵심은 두 가지 과학적 원리에 의존합니다. 하나는 DNA 조각들을 길이를 바탕으로 정확하게 분리(예를 들어 겔 분리를 사용해서)해 낼 수 있다는 것입니다. 특정 조건에서는 단지 몇 개의 뉴클레오타이드 차이에 불과한 길이 차이를 구별하는 것이 가능합니다. 따라서 "수프"에 길이가 서로 다른 수천 개의 DNA 조각이 혼합되어 있으면 각 조각의 길이를 개별적으로 검사할 수 있습니다. 두 번째는 각각 다른 색으로 밝게 빛나는 변형된 "마커" C, G, A, T 뉴클레오타이드가 존재하며, 일단 DNA 사슬에 마커가 더해지면 다른 뉴클레오타이드가 더 이상 연결되는 것을 막는다는 것입니다.
Sanger 분석법은 염기서열 분석될 DNA 샘플을 그대로 둘 경우 DNA가 여러 번 완전히 복제될 수 있을 정도로 해당 DNA를 복제하는 데 필요한 모든 성분과 혼합해서 시작됩니다. 그러나 소량의 마커 C, G, A, T 뉴클레오타이드도 혼합물에 추가되어 있으며, 이는 무작위로 사용되어 마커가 추가될 때마다 DNA 복제가 중단되게 됩니다. 이로 인해 만들어지는 "수프"는 끝에 밝게 빛나는 마커 뉴클레오타이드가 달려 있는 서로 다른 길이를 가진 DNA의 혼합물입니다. 겔 크로마토그래피를 이용하여 혼합물을 분리하면, 각각의 길이를 한 번에 하나씩 검사합니다. 마커 뉴클레오티드의 색상은 순서대로 기록되고, 이를 판독하거나 원본 DNA의 서열과 일치시킬 수 있도록 합니다.
Sanger 분석법을 사용하면 단일 실험에서 최대 약 1,000개의 염기쌍 크기의 DNA 조각을 염기서열 분석할 수 있습니다. 이 숫자가 커 보일 수 있지만 전체 게놈에는 수백만 개, 혹은 심지어는 수십억 개의 염기쌍이 포함되어 있습니다. 예를 들어 초파리의 게놈에는 약 137,000,000개의 염기쌍이 있습니다. 따라서 Sanger 분석법을 기반으로 해서 보다 시간과 비용 효율적인 방법으로 전체 게놈에 이르는 더 긴 DNA 세그먼트 염기서열 분석을 가능하게 해 주는 보대 현대적인 기술이 개발되었습니다.
Whole Genome Sequencing 분석은 어떻게 수행됩니까?
현대적인 Whole Genome Sequencing 분석 센터의 과학자들은 Sanger 방법과 유사한 원리를 사용하지만 최첨단의 미세유체공학 및 생물정보학을 활용하여 대규모 게놈 염기서열 분석에 대한 문제를 나중에 다시 전체 혹은 전체와 거의 완성된 게놈으로 재조립할 수 있는 수천 개의 더 작은 DNA 서열들로 분해합니다.
Shotgun Sequencing분석이란 무엇입니까??
DNA 분자가 너무 길어서 한 번의 실행으로 염기서열 분석할 수 없는 경우 관리하기 쉬운 "한입 크기의" 조각으로 잘라야 합니다. 조각은 각각 개별적으로 복제되고 서로 겹치는 영역이 있도록 염기서열 분석한 다음 재조립해 전체 유전자를 알 수 있게 해 줍니다. 이 과정은 수동으로 수행할 수 있지만 DNA의 각 절단, 복제 및 염기서열 분석 단계는 Sanger 또는 Maxam-Gilbert 분석법과 같은 1세대 연구 그 자체와 동일합니다.
차세대 샷건 염기서열 분석은 생산 및 관리를 통해 프로세스에 대한 깔끔한 솔루션을 만들어 냅니다.
염기서열 분석 프로세스 자체의 내용은 상용화된 기술에 따라 다르지만 합성에 의한 염기서열 분석(SBS)이 공통적으로 사용됩니다. SBS에는 DNA 조각을 결합하는 미세 유체 칩이 사용됩니다. DNA 조각이 칩의 특정 위치에 결합되면 동일한 DNA 조각만이 해당 위치에 결합하여 해당 위치에 클러스터를 생성하게 됩니다. 그 후, DNA 클러스터는 복제에 필요한 재료들에 노출되지만 한 번에 하나의 뉴클레오타이드에만 노출됩니다. 예를 들어, 클러스터에 GACA 서열이 있고 뉴클레오타이드(G, A, T, C)가 클러스터 위로 흘러나가면 첫 번째 시행에서는 라벨이 있는 G 뉴클레오타이드만 클러스터 내의 DNA 조각에 결합할 수 있습니다. 결합되지 않은 모든 뉴클레오타이드는 해당 DNA 클러스터에 결합되지 않고 씻겨나가게 됩니다. 두 번째 단계에서는 추가된 뉴클레오타이드의 라벨을 예를 들어 라벨에서 방출되는 빛의 색상(형광현미경을 사용해 관찰)을 이용해 읽습니다. 세 번째 단계는 추가된 뉴클레오타이드(위의 예시에서는 G)의 마커를 제거하여 실질적으로 다음 합성 단계를 위한 DNA 가닥을 준비하는 것입니다. 이 과정이 반복됩니다. 두 번째 주기에서 라벨이 붙은 A 뉴클레오타이드만이 클러스터에 결합할 수 있습니다. 그 뒤에는 A 뉴클레오타이드를 읽고 세 번째 단계를 준비하기 위해 라벨을 제거합니다. 각 주기는 전체 조각의 염기서열 분석이 완료될 때까지 시행됩니다. 서로 다른 상업화된 SBS 방법론 간의 중요한 차이점은 주로 라벨링과 그 라벨을 읽는 방식의 차이에 있습니다.
샷건 염기서열 분석의 결과는 무작위로 절단되었던 각각의 작은 DNA 조각들의 서열이 기록된 방대한 양의 데이터입니다. 이 데이터는 이후 원래의 DNA 분자를 재구성하기 위해 둘 이상의 조각에 나타나는 동일한 서열이 가장 잘 정렬되도록 처리되어야 합니다. 재구성 과정은 불완전한 분석 측정값, DNA 합성 과정에서 발생할 수 있는 오류, 반복적인 패턴을 가진 DNA상의 넓은 영역 등의 현실로 인해 복잡해집니다. 일반적으로 만족스럽게 재구성이 일어나기 위해서는 DNA의 동일한 영역을 진핵생물 게놈에서는 최대 30회, 원핵생물 게놈에서는 최대 100회 염기서열 분석해야 오류율을 줄일 수 있습니다.
유전자 염기서열 분석을 어디에 적용할 수 있습니까?
DNA는 한 유기체의 생물학적 기능에 대한 모든 정보을 담고 있으며, 한 세대에서 다른 세대로 전달됩니다. 이 때문에 친자 확인에 DNA 검사가 활용될 수 있습니다. 또한 미토콘드리아 DNA와 같은 특정 성에 대한 유전 물질은 어머니에게서 자손으로 전달되어 여러 세대 전의 모계 혈통을 추적하여 진화 생물학에서 종 간의 공통 조상을 식별하는 데 사용할 수 있습니다. 유전 정보는 법의학에도 혁명을 일으켰습니다. 사람의 DNA는 고유하고 모든 세포에 들어 있으므로 저희는 모든 일상 활동에서 DNA 흔적을 남기게 됩니다. 따라서 어떤 사람의 DNA를 알고 있고 범죄 현장에서 그와 동일한 DNA 샘플이 발견되면 문제의 사람이 어느 시점에 거기에 있었다는 결론을 내릴 수 있습니다. 이 과정을 DNA 지문 분석이라고도 합니다. 유사한 기술을 사용하여 박테리아 균주를 추적할 수 있습니다. 이러한 방법은 공장 내 미생물 전파 사례를 발견하여 식품 안전 및 품질 산업에 기여하고 이러한 지식을 사용하여 최종 제품에서 병원체 또는 부패유발원 오염을 방지할 수 있습니다.
따라서 염기서열 분석 프로세스의 원시 데이터에 여러 생물정보학적 분석 도구를 사용해 이러한 거대한 퍼즐을 조립해서 만들어진 초안 게놈 또는 수백만 개의 조각을 알려진 게놈과 비교하여 변형된 영역을 찾아내 만들어진 변형 맵이 만들어지게 됩니다. 두 가지 접근 방식 모두 DNA 지문 분석 과정과 유사한 방식으로 주어진 장소에서 발견된 박테리아 균주들 간의 관계를 파악하는 데 사용할 수 있습니다. 초안 게놈은 또한 박테리아 게놈에서 항생제 또는 살생물제 내성과 같은 흥미로운 표현형의 발현을 나타내는 관심 대상 유전자 또는 돌연변이를 찾는 데 사용할 수 있습니다.
Metagenomics이란 무엇입니까??
미생물은 생명이 있는 곳이면 어디든 존재하며, 더 큰 유기체와 유익한 공생 관계에 있기도 하며 특정 미생물은 감염 및 질병의 원인이 되기도 합니다. 사람의 신체 내에는 마이크로바이옴이라는 형태로 다양한 미생물의 엄청나게 복잡한 생태계가 존재하며, 그 마이크로바이옴의 상태는 인간의 건강에 직접적인 영향을 미친다는 것이 입증되었습니다. 다른 유기체나 더 큰 생태계에서는 마이크로바이옴 또한 중요한 역할을 하는 것으로 파악되어 있습니다. 마이크로바이옴 안의 서로 다른 종의 정체와 균형을 이해하면 미생물 군집의 활동과 관련된 귀중한 정보를 얻을 수 있습니다. 하지만, 기존의 세포 배양 방법을 사용하여 마이크로바이옴을 측정하는 것은 모든 미생물이 일반적인 세포 배양 조건에서 잘 생장하는 것이 아니(일부는 아예 생장하지 않기도 한다)기 때문에 존재하는 미생물 군집 전체에 대한 포괄적인 시야를 얻는 것이 어렵거나 불가능하므로 문제가 많은 일이다.
군유전체학은 개별적인 미생물만을 염기서열 분석하는 것과는 반대로 전체 미생물 군집 DNA을 염기서열 분석하는 것입니다. 전체 게놈 염기서열 분석과 동일한 방법을 사용하여 서로 다른 개별적인 미생물들에서 얻은 DNA의 혼합물을 염기서열 분석할 수 있으며, 이 정보는 전체 미생물 군집의 종 프로필을 재구성하는 데 사용됩니다. 미생물 군집의 종 프로필 외에도 집단의 각 구성원의 유전자 서열을 알고 다른 미생물 군집 내의 동일한 종과 비교하여 해당 미생물이 특정 환경 속에서 어떻게 진화하거나 적응했는지 이해할 수 있습니다.
군유전체학은 마이크로바이옴과 농장의 토양과 같은 더 큰 생태계 사이의 관계와 영양소의 순환, 질병 억제 및 질소 고정 등에서 이러한 미생물군집이 맡는 역할을 설명할 수 있게 해주었습니다. 인간의 경우 장내 미생물군집과 건강 사이의 관계는 분명하지만 그 기전에 대해서는 여전히 연구가 진행되고 있습니다.