컨텐츠 바로가기 영역
주메뉴로 바로가기
본문으로 바로가기

지식in

  • 출처김운봉(센터장), 김용민(전임연구원), 양진옥(선임연구원)/한국생명공학연구원 국가생명연구자원정보센터
  • 조회수 10479
  • 등록일2014-12-24
  • 첨부파일
    • 유전체 빅데이터 연구동향.pdf다운로드

유전체 빅데이터 연구동향

 

김운봉_편집본.jpg   김용민_편집본.jpg   양진옥_편집본.jpg

 

1. 정의 및 필요성

 

가. 유전체 빅데이터 정의

 

최근 빅데이터(big data)는 우리사회의 핵심 키워드로 등장하고 있다. 한 예시로, 최근 모 방송사에서 방영되고 있는 드라마에서 남자 주인공이 여자 주인공 전남편의 뇌구조를 분석 장면에서 ‘빅데이터를 이용해서 분석한 뇌 구조’라는 대사에서도 쉽게 체감할 수 있다. 이렇듯 빅데이터는 새로운 개념이 아니라 1990년 이후 인터넷이 확산되면서 정형화 된 정보와 비정형 형태의 정보가 무수히 발생하게 되면서 정보홍수(information overload)나 정보 폭발(information explosion)이라는 개념으로 정의 되었고, 지금의 빅데이터라는 개념으로 이어지게 되었다.

 

빅데이터는 컴퓨터 기술의 발전으로 대용량 데이터의 생산, 저장, 관리, 처리 능력이 급격히 향상 되고 있으며, 단순히 크기와 관련 된 문제가 아니라, 빅데이터의 3대 요소를 통해 새로운 데이터의 의미를 찾아내는 개념이다. (그림1) ※ 빅데이터 3대 요소 : 1) 데이터 규모(Volume), 2) 처리 및 저장 속도(Velocity), 3) 데이터 종류의 다양성 (Variety) 


 

바이오빅데이터 개념.jpg

 

그림 1. 빅데이터의 구성 요소

 

생물학 분야에서의 유전체 빅데이터란, 유전체(omics) 분석을 통해서 생성 된 대용량의 바이오 데이터를 지칭하는 것으로서, 전장 유전체(genome), 전사체(tranome), 단백체(proteome), 및 후성유전체(epigenome) 등의 분야가 있다. 유전체 빅데이터의 생산 및 분석은 최근에 개발 된 차세대 염기 서열 분석(Next Generation Sequencing) 방법의 도입으로 인해 기하급수적으로 증가하여, 최근 2년간 유전체 빅데이터의 생산량은 페타(petabyte, 1015 byte)수준에 이르고 있으며, 매년 2배 이상 증가하고 있다[1]. 이와 더불어, 앞에서 언급한 분야뿐만 아니라, 대용량의 염기 서열 정보와 다양한 생물학적인 연구 분야의 정보가 통합 되어 대사유전체학(metabolomics)과 같은 다양한 생물학적인 현상을 설명할 수 있는 분야가 등장 하고 있다.


 

img_141224_2.jpg

                가. DNA 서열 Megabase 당 비용 변화                        나. 인간 유전체서열 결정비용 변화

 

그림 2. 연도별 DNA 서열결정 비용의 변화

 

 나. 필요성

 

최근에 등장한 차세대유전체 염기서열 분석 (Next Generation Sequencing) 기술의 진보에 힘입어 지난 10 년간 유전체 빅데이터는 기하급수적으로 증가하고 있으며, 차세대 염기서열 분석 방법의 도입으로 인해 눈에 띄게 감소한 염기서열 분석 비용으로 인해 유전체 빅데이터의 생성이 폭발적으로 일어나고 있다. 염기 서열 분석 비용의 감소는 생물학자들로 하여금 인간을 비롯한 생명체의 유전체 정보(genome)를 연구의 기본 정보로 활용하게 하였으며 이로 인해 모든 분석을 유전체에 대비하여 분석할 수 있는 데이터 단위로 유도하게 되었다.

 

이러한 결과로 단백체, 전사체, 조절체 및 대사체 등의 거대 데이터로 해석하기 위한 학문인 유전체학(omics)이 발전하고 있다. 이와 같은 초고속의 대용량 유전체 데이터는 유전체연구의 방법론적 혁명을 통해 생명공학의 기술 패러다임을 변화시키고 있으며, 유전체 정보 생산 및 분석 연구는 신약, 진단/예방, 국방, 농업, 수산, 식품, 환경, 에너지 등 거의 모든 산업 영역에 막대한 파급효과를 미치는 핵심 기반 기술로서 선진국은 물론 개발도 상국에서도 경쟁적으로 투자를 확대해 나가고 있는 실정이다 [2].

 


img_141224_3.jpg
 

그림 3. 빅데이터 도입에 따른 유전체 연구의 변화

 

폭발적으로 증가하는 유전체 빅데이터의 효율적인 저장, 관리 및 분석을 위한 인프라의 요구 조건 및 수요의 증가는 관련 된 산업의 발전을 유도하고 있다. 폭발적으로 증가하는 유전체 빅데이터의 처리를 위한 대안으로 현재 부상하는 것이 클라우드 컴퓨팅(cloud-based computing)이며, 클라우드 컴퓨팅 기술의 도입으로 컴퓨터 자원이 부족한 연구자도 서비스 기관의 클라우드 컴퓨팅 서비스를 이용해서 자신의 유전체 빅데이터를 서비스 기관에서 제공하는 분석 툴만을 이용해서 분석하는 것 뿐만아니라 자신의 데이터의 성격에 맞는 사용자 맞춤형의 분석 또한 가능해졌다. 즉, 생명정보의 연구가 이전의 한 방향 연구에서 쌍방향 연구가 전환이 될 수 있는 여건이 갖추어진 것이다.

 

유전체 빅데이터의 등장은 생명 현상의 이해에 대한 깊이를 더해 줄 수 있게 할 뿐만 아니라, 개인 유전체 분석을 통한 개인 맞춤형 의료 및 관련 기반 연구의 발전을 유도하여 새로운 융복합 산업을 창출하고 있다.

      

 

2. 국내외 연구동향

 

가. 국외 연구동향

 

앞에서도 언급 했던 것처럼, 2002년 인간 유전체 해독 당시에 10억 달러에 달했던 유전체 분석 비용은 2000년 대 중반 차세대 염기서열 분석 방법이 개발 된 이후에 천 달러 내외로 감소했으며, 염기 서열 분석 비용의 감소는 생물학 연구의 경향을 중요한 유전체 해독에서 모든 관심 유전체의 해독으로 바꾸게 하는 결정적인 계기가 되었다. 이러한 경향으로 인해, 현재 해외에서의 유전체 빅데이터 연구 동향은 단일 유전체 해독 프로젝트에서 대규모의 신규 유전체 해독하는 작업으로 바뀌고 있으며, 대표적인 연구가 BGI(Beijing Genome Institute)의 3 million Genome Project 와 TAIR(The Arabidopsis Information Resource)의 1001 genome project, 영국의 100k Genome project 등이 있다.

     

     표 1. 해외 유전체 해독 프로젝트

프로젝트명

주요내용

3-Million Genomes Project

- 중국의 BGI에 의해서 2011년 11월에 시작 된 유전체 염기서열 해독 프로젝트

   로서,

- 수 백만종의 식물, 동물, 인간, 곰팡이, 박테리아, 조류 및 바이러스의 유전체의

   정보를 갖는 데이터베이스 구축을 목적으로 시작 된 프로젝트임

- The Million Plant and Animal Genome Project, The Million    Micro-ecosystem   

  Genome Project, The Million Human Genome Project로 구성

1001 Genome Project

- 2008년에 시작된 프로젝트로 모델 식물인 애기장대 1001개의 strain에서의   

  whole-genome sequece variation을 보기 위해 시작

- 2010년 막스 플랑크 연구소에서 80여개의 accession들에 대한 유전체 정보를 공

  개 하였으며, 그 이후 1049개에 대한 Arabidopsis accession들에 대한    유전체 해

  독을 수행하고 있음

100K Genome Project

- 2012년에 시작된 프로젝트로서 영국의 100,000 명 환자의 whole genome을 분석

  하는 프로젝트로 2017년까지 프로젝트 완료를 목표로함

- 신약 개발, 유전체 기반 의학 서비스 및 과학 발전에 기여 할 것으로 기대하고   

  있는 프로젝트임

ENCODE Project

- 2003년 9월 미국의 National Human Genome Research Institute (NHGRI)에    의해

  시작 된 프로젝트로서,

- 인간 유전체 염기서열에서 유전자 기능과 관련 된 모든 요소들을 규명    해내

  는 프로젝트임

 

 미국의 George M Church의 개인 게놈 프로젝트 (10k personal genome project)는 10만명의 개인 유전형, 표현형, 환경적 요인의 연관성을 위해, Genome in a Bottle Consortium는 데이터의 표준화를 제시하는 목적으로 진행되었다. 이러한 연구를 통해서 얻어진 막대한 유전체 빅데이터의 연구를 통해서, 연구자들은 관심 있는 유전자 및 유전체의 진화를 대상 유전체와 대상 유전체와 연관 된 다른 유전와의 비교 연구를 통해서 분석 할 수 있게 되었고 그 결과 관심 유전체의 및 유전자의 진화에 대한이해를 높일 수 있게 되었다.

 

 

img_141224_4.jpg

그림 4. 바이오 빅데이터의 발전사

 

인간 유전체 연구의 경우 ENCODE Project로 대표 되는 기능 연구, 주요 질환과 관련 된 후성 유전체 연구 등을 포함하는 유전체 연구 및 노화와 관련 유전체 연구 등이 활발히 진행되고 있다.

 

유전체 빅데이터의 연구에 있어서 중요한 분야 중 하나가 데이터베이스이며, 막대한 양으로 생성 되고 있는 유전체 빅데이터의 저장 및 공유를 위해서 중요한 요소로서 최근에는 생물학 정보의 논문 출판을 위한 중요한 요소가 되고 있다. 또한 다양한 연구목적을 토대로 생산된 데이터가 관련된 메타정보와 함께 표준화되어 저장되면, 데이터 유형에 따라 최적화된 분석방법을 적용하여 유전적 변이의 생물학적인 연관성을 효율적으로 분석 할 수 있게 된다.

 

이와 같은 새로운 패러다임의 데이터베이스가 중요해지면서 주목 받기 시작한 것이 Biocuration이다. Biocuration은 유전체 빅데이터의 구성(organization), 표현(representation) 및 접근성(accessibility)을 연구자와 컴퓨터에 보장해주는 작업으로서 생물학 연구 분야에서 기본적인 작업이 되고 있다[2]. 이러한 작업의 연장선상에서 연구로부터 얻어진 지식 또는 연구 성과를 공유하기 위한 연구 커뮤니티 차원의 표준 유전체 데이터베이스가 개발 되어 현재 서비스 되고 있다(표1).

 

표 2. 연구 지식 공유 데이터베이스

 

Species

Database

URL

Model organism database

 

 

Ades aegypti

VectorBase

www.vectorbase.org

Anopheles gambiae

VectorBase

www.vectorbase.org

Arabidopsis thaliana

The Arabidopsis Information Resources

www.arabidopsis.org

Caenorbabditiselegans

WormBase

www.wormbase.org

Candida albicans

Candida Genome Database

www.candidagenome.org

Culex pipiens

VectorBase

www.vectorbase.org

Danio rerio

Zebrafish Information Network

http://zfin.org

Dictyostelium discoideum

dictyBase

http://dictybase.org

Drosophila sp.

FlyBase

http://flybase.org

Clycine max

SoyBase

www.soybase.org

Homo sapiens

HUGO Gene Nomenclature Committee

www.genenames.org

Hordeum vulgare

Barley Genetic Stocks Database

http://ace.untamo.net/bgs

Ixodes scapularis

VectorBase

www.vectorbase.org

Leishmania sp.

GeneDB

ww.genedb.org

Mus musculus

Mouse Genome Informatics

www.informatics.jax.org

Oryza sp.

Gramene

http://gramene.rog

Paramecium tetraurelia

ParameciumDB

http://paramecium.cgm.cnrs-gif.fr

Pediculus humanus

VectorBase

www.vectorbase.org

Rattus norvegicus

Rat Genome Database

http:rgd.mcw.edu

Saccharomyces cerevisiae

Saccharomyces Genome Database

www.yeastgenome.org

Schizosaccaromyces pombe

GeneDB

www.genedb.org

Solanaceae sp.

Slo Genomics Network

http://sgn.cornell.edu

Strongylocentrotus purpuratus

SpBase

http://sugp.caltech.edu/SpBase

Triticum sp.

GrainGenes

http://wheat.pw.usda.gov

Trypanosoma sp.

GeneDB

www.genedb.org

Xenopus laevis

Xenbase

www.xenbase.org

Xenopus tropicalis

Xenbase

www.xenbase.org

Zea mays

Maize Genetics and Genomics Database

www.maizegdb.org

 

 

 

Nucleotide, protein and structure databases

All species

GenBank

www.ncbi.nlm.gov/Genbank

All species

UniProt

www.pir.uniprot.org

All species

Protein Data Bank

http://rcsb.org/pdb/home/home.do

 

 

 

Taxonomy

 

 

All species

NCBI Entrez Taxonomy

www.ncbi.nlm.gov/sites/entrez?db=taxonomy

 

 

 

 

 

이러한 데이터베이스의 특징은 개별 연구자, 연구 그룹/컨소시엄, 연구 기관 등에서 생성 되는 다양한 유전체 빅데이터뿐만 아니라 관련 연구 논문의 정보까지 연계하여 해당 유전체의 깊이 있는 연구를 할 수 있도록 다양한 연구 자원을 공유하는데 있다. 이러한 표준 유전체 정보를 바탕으로 현재 GWAS(Genome Wide Association Study) 분석이 활발히 진행 되고 있으며, GWAS 분석을 통해 오이와 토마토 육종의 역사를 밝혀낸 논문과 같이 최근 저명 해외 학술지에 다수의 GWAS 관련 논문이 출판되기도 한다.[3-5].

 

나. 국내 연구동향

 

국내의 경우, 국외의 연구진에 비해 차세대 염기서열 분석 방법을 이용한 분석이 최근에 도입 되어 연구가 진행 되고 있으며, 지난 수년간 차세대 염기 서열 분석 방법을 이용한 유전체 연구가 활발히 진행 되어 최근에 저명 해외 학술지에 연구 결과를 출판하였다[6].

 

국내의 경우, 농업 분야에서 주요 작물에 대한 유전체 연구가 활발히 진행 되고 있으며 이와 같은 연구를 통해서 주요 작물의 표준 유전체 데이터[6, 7]와 이를 활용한 유전체 재해석 데이터와 같은 다수의 유전체 빅데이터 연구 성과가 도출 되고 있다.

 

더 나아가서 산업적인 측면에서, 이렇게 분석이 된 유전체 빅데이터를 이용한 주요 작물의 육종에 활용하기 위한 다양한 시도가 이루어지고 있으며, 축산 분야에서도 작물 연구 분야와 같이, 주요 가축인 소, 돼지, 말 등을 중심으로 한 동물 유전체연구, 유용표지 유전자 탐색, 유전자 지도를 작성함으로써 경제적인 형질을 지배하는 유전자의 분리, 항병성 유전자의 특성을 규명하고, DNA 진단에 의한 개체 식별 마커 개발하는 것을 목표로 동물유전체 프로젝트가 진행이 되고 있다.

 

인간 유전체 연구 분야에서는 한국인 특이적인 유전 질환에 관한 연구, 전 세계적으로 진행되고 있는 인간 유전체 연구에 참여하여 인간 질환 및 노화 연구를 통한 삶의 질 향상을 위해 노력하고 있다. 하지만, 이와 같은 활발한 연구에도 불구하고 국내에서는 다양한 연구팀, 연구단, 전문 연구 기관 및 대학에서 진행되고 있는 유전체 분석을 통해서 생성되는 다양하고 방대한 양의 유전체 정보를 통합 관리 할 수 있는 데이터베이스가 전무한 실정이다.

 

3. 유전체 빅데이터 활용사례

 

차세대 염기 서열 분석 방법의 발전으로 유전자 분석 비용과 시간이 급속히 줄어들면서 유전체 분야에 다양한 바이오 신기술이 개발되기 시작하였으며, 새로운 분야와의 융합이 강조되고 있다.

 

이러한 융복합 연구는 맞춤형 신약개발 기술, 생명시스템 분석 기술, 유전체 정보 이용 기술, 줄기세포 기술 및 원격 건강관리 서비스 등이 대표적이다. 천 달러의 비용으로 개개인의 유전체 염기서열을 분석해 내면서 각종 질병의 예방 및 진단 그리고 개개인의 맞춤 의학에 활용할 수 있는 시대가 오고 있다.

 

2000년대에 들어서 염색체의 부분 결손 또는 증폭을 탐색하기 위한 기술 및 microRNA 탐색 기술과 유전자 발현 조절부위의 methylation 탐색 등의 신기술이 개발되면서 질병에 대한 주요 원인 유전자를 찾고, 암과 희귀질환의 조기진단 및 암 치료제 개발에 새로운 패러다임이 제시 되었으며, 이를 통해 많은 수의 질환 유발 유전자들이 밝혀졌다(그림 5).

 

img_141224_5.jpg
 

    그림 5. 기간 별 전체 엑솜 분석을 통해 밝혀진 질환 유발 유전자의 수

 (출처: Nature Reviews Genetics, 14: 681-691)

 

인간 암유전체의 microRNA 발현 패턴을 분석하면 인체의 암세포가 나타내는 발현 프로파일링을 발견 할 수 있게 되었으며, 현재까지 217종의 microRNA가 암 발생 초기와 진행과정에 관여되어 있으며 계속적으로 새로운 암 관련 microRNA의 기능이 밝혀지고 있다. 또한 유전체 조절영역의 methylation은 유전자 발현의 조절과 직접 연관이 되어 있음이 알려지면서 유전적 질환과 암유전체 연구에 대한 관심이 높아지고 있으며, 활발한 관련 연구를 통해서 유전체 변이정보(OMIM, Online Mendelian Inheritance in Man)[8] 및 암유전체에 대한 데이터(COSMIC, Catalogue Of Somatic Mutations In Cancer)[9]를 통합 관리하는 데이터베이스가 구축되어 유용한 정보를 제공하고 있다(그림 6).

 

img_141224_6.jpg

    

그림 6. COSMIC 데이터베이스에 등록 되는 기간 별 암 관련 정보

(출처: Cell, 155: 27-38)

 

이러한 연구 성과들을 통해서 암 진단 및 희귀난치성 질환에 대한 진단 기술 및 치료제 개발이 꾸준히 증가하고 있다(그림 7).


img_141224_7.jpg
 

     그림 7. 희귀난치성 질환 치료제의 연도별 개발 양상

(출처: Nature Reviews Genetics, 14: 681-691)

 

 

4. 향후 발전방향

 

앞으로의 유전체 빅데이터의 연구 방향은 크게 두 가지로 분류 할 수 있다. 첫 번째가 단일 표준 유전체 구축에서 발전한 다수의 표준 유전체 구축 및 유전체 재분석 및 이를 활용한 집단유전학적 방법에 적합한 GWAS 분석을 통한 농업 과 축산 분야로의 응용이며, 두 번째는 고도화 된 표준 유전체 정보와 전사체, 단백체 및 후성 유전체 정보와 임상정보를 결합한 질환 치료 및 개인 맞춤형 의료일 것이다.

 

국내외에서 지금도 다양한 분야의 유전체 연구가 진행되고 있으며, 이러한 연구들이 통합적인 시각에서 연계가 된다면 이전에 비해서 더욱 큰 가치를 창출 할 수 있을 것이다. 주요 작물 유전체 연구와 작물의 근권 미생물에 대한 메타 유전체 분석을 통합하여 근권 미생물에 의한 작물의 유전자 발현 양상을 분석하고 이해하는 홀로 바이옴 분석은 근권 미생물에 의한 작물의 반응을 보다 심층적으로 이해 할 수 있고 이를 통해 작물의 내병성 및 생산성을 이전에 비해 획기적으로 증가 시킬 수 있게 할 것이다.

 

또한, 인간의 질환 관련 연구에 있어서 인간 유전체 연구뿐만 아니라 장내 미생물과 인간과의 상호 작용을 유전체 빅데이터를 통해서 접근한다면 이전의 연구로 밝혀 낼 수 없었던 인간 질환에 대한 궁금증을 풀어 낼 수 있을 것이다. 인간 유전질환 연구 분야에서도 유전체 분석뿐만 아니라 전사체, 후성 유전체 및 임상 정보를 결합함으로써, 유전 질환에 대한 근본적인 이해를 높여서 해결 불가능 할 것으로 보이는 유전질환 치료에 새로운 장을 열 수 있을 것으로 기대한다.

 

이와 관련 되어 정부는, 2013년 12월 ‘유전체 기반 헬스케어’를 신산업 분야로 선정하여 집중 육성하겠다는 계획을 발표한 바에 의하면 ‘유전체 기반 헬스케어’는 ‘안전, 건강 등 4대 국민생활분야 융합 신산업’의 하나로서, 한국인 유전적 특성에 맞는 ‘유전정보 빅데이터 체계’를 구축하는 것이 그 골자이다.

 

이를 위해 2021년까지 국민 10만명의 유전체자원을 확보, 14대 질환군별 유전체기반 맞춤의료 가이드라인을 마련할 계획이나 지금까지는 부처간 시스템연계, 한국인 유전체자원의 확보 및 공유, 활용 인프라 등의 미흡으로 기업의 유전체서비스 창출에 애로를 겪었던 것도 사실이다.

 

이와 같은 문제를 해결하기 위하여 정부는 공공기관이 생산, 보유하고 있는 유전체자원의 공유와 활용 촉진을 위해 공공보유 유전체자원, 정부사업 연구결과물 등에 대해 각 소관부처에 의무적으로 제출토록 하고, 이렇게 제출된 유전체자원은 ‘국가생명연구자원정보센터(KOBIC)’에서 중점 관리 할 수 있도록 하고 있다.

 

하지만 앞에서도 언급한 것처럼, 다양한 분야의 융복합 연구를 위해서 가장 필요한 것이 연구 성과의 공유임에도 불구하고 실질적인 데이터의 공유는 제대로 이뤄지지 않고 있는 실정이다. 지금과 같이 국가 연구비를 통해 생산해 낸 유전체 빅데이터가 국내에서조차 제대로 공유가 되지 않는다면, 국내에서 이루어지는 연구는 각 연구 단위에서 생산 및 관리가 되어 새로운 융복합 연구를 창출해내지 못할뿐더러 후속 연구 및 관련 연구에 전혀 도움이 되지 않을 것이다.

 

이는 진정한 의미의 유전체 빅데이터가 아닐 것이며, 국제적인 경쟁력 또한 잃어버리게 하는 일일 것이다. 이러한 면을 개선하고자 현재 여러 부처에서 경쟁적으로 부처에서 생산 되는 유전체 빅데이터를 모으고 관리하고자 하는 시도가 일어나고 있으며, 실제로 미래창조과학부의 국가생명연구자원정보센터(KOBIC)와 농촌진흥청의 국립농업생명공학정보센터(NABIC)가 유전체 빅데이터를 수집, 저장 및 관리를 하고 있다. 또한 질병관리본부에서도 인체 유래 빅데이터를 수집 관리하기 위한 시스템(CODA)를 구축 중에 있으며, 국가생명연구자원정보센터(KOBIC)와의 연계를 위한 방안도 함께 고민하고 있다. 하지만, 이렇게 모인 유전체 데이터가 부처를 초월하여 통합 관리 되지 않는다면 이러한 작업 역시 유전체 빅데이터 연구에 큰 힘이 되지 못할 것이다.

 

국가생명연구자원정보센터(KOBIC)의 경우, 현재 진행 되고 있는 다부처 유전체 사업을 통해 생성되는 유전체 빅데이터를 각 부처의 정보기관으로부터 연계 받아 통합 관리 및 정보 분양을 할 수 있는 시스템(Genome Infranet)을 현재 구축 중에 있으며, 국내외에서 생산 된 다양한 유전체 빅데이터를 수집하고 이를 이용한 비교유전체학(Comparative genomics) 분석을 할 수 있는 오믹스 포탈인 Prometheus를 구축 중에 있다.

 

내년 상반기 중에 이러한 작업이 완료가 되면, 국가생명연구자원정보센터(KOBIC)를 통해 국내외 연구자들이 현재 공개 된 다양한 유전체 빅데이터를 이용하여 비교유전체학 분석을 할 수 있을 것으로 기대가 되며, 국내에서 생산 된 다양한 분야의 생명정보를 검색 및 분양을 통해 다양한 후속 연구가 진행 될 것으로 기대가 된다. 이를 위해서 국내외 연구자들의 인식 전환을 통해서, 연구 주관 부처의 강제성이 동반 된 데이터 등록이 아닌 자발적인 등록을 통해서 다양한 유전체 빅데이터가 통합 관리 시스템에 등록이 되어 활용 될 수 있기를 바란다.

 

 

참고문헌

 

1. Vivien Marx, The big challenges of big data, 2013, Nature, 498: 255-260

2. DougHowe et al., The future of biocuration, 2008, Nature, 455: 47-50

3. Qi J. et al., A genomic variation map provides insights in to the genetic basis of cucumber domiestication and dieversity, 2013, Nature Genetics, 45: 1510-1515

4. Shang Y. et al., Biosynthesis, regulation, and domestication of bitterness in cucumber, 2014, Science, 346: 1084-1088

5. Lin T. et al., Genomic analyses provide insights into the history of tomato breeding, 2014, Nature Genetics, 46: 1220-1226

6. Kim S. et al., Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species, 2014, Nature Genetics, 46: 270-278

7. The Brassica rapa Genome Sequencing Project Consortium, The Genome of the mesopolyploid crop species Brassica rapa, 2011, Nature Genetics, 43: 1035-1039

8. Boycott. et. al., Rare-disease genetics in the era of next-generation sequencing: discovery to translation, 2013, Nature Reviews Genetics, 14: 681-691

9. Koboldt DC. et. al., The Next-Generation Sequencing Revolution and Its Impact on Genomics, 2013, Cell, 155: 27-38

 

 

 

   

목록으로