본문

300년 만에 린네의 실수를 밝힌 단백질체학 기법

  • AD 최고관리자
  • 조회 2265
  • 2013.11.07 08:42
자연사 박물관 관계자들은 방문객들에게 잘 말해 주지 않지만, 잘못 분류된 표본 때문에 골머리를 앓고 있는 경우가 종종 있다. 이러한 분류 오류는 주요 소장품의 경우에도 발견되는데, 그중에는 동식물의 기준표본(archetypes)도 포함된다. 기준표본이란 특정 종의 기준이 되는 표본을 말하는데, 그것을 처음으로 발견한 생물학자들이 공식적으로 명명한다.
분류학(taxonomy)은 스웨덴의 카를 린네에 의해 시작됐으며, 그가 명명한 종(種) 이름이 다른 동식물 분류의 기준으로 사용된다. 린네의 분류는 대체로 정확하지만, 그가 분류한 일부 종에 대해서는 의문이 제기되어 왔다. 이와 관련하여, 방부처리된 유리병 속에 고이 담겨, 스웨덴 스톡홀름 자연사박물관에 300년 동안 보관돼 있던 코끼리 태아 표본의 정체가 새로 밝혀져 화제다. 이 표본은 `분류학의 아버지`인 린네에 의해 아시아 코끼리의 기준표본(type specimen)으로 분류됐었는데, 고(古)단백질체학(ancient proteomics)이라는 새로운 기법에 의해 아프리카 코끼리로 재분류된 것이다.

덴마크 코펜하겐 대학 톰 길버트 교수(진화유전학)의 연구실은 세계에서 제일가는 DNA 시퀀싱 장비를 보유하고 있는데, 7년 전 문제의 코끼리 표본에서 채취된 DNA 샘플을 이용하여 종(種) 분류를 시도하다가 실패하고 말았다. 실패 이유는 DNA가 너무 오래되어 분해됐기 때문이었다. 이 문제점을 비켜나가기 위해, 길버트 교수는 동료 엔리코 카펠리니 교수와 함께 코끼리 태아의 식도에서 샘플을 채취하여 최신 단백질 분석기법을 적용해 보기로 결정했다. "우리는 DNA는 분해됐을지 몰라도, 단백질만은 남이 있을 거라고 믿었다. 왜냐하면 코끼리 표본은 여전히 존재하니까..."라고 길버트 교수는 술회했다.

두 사람이 이끄는 연구진은 표본에서 - 예상대로 - 다양한 단백질들을 검출했다. (이 단백질들은 코끼리의 종(種)에 따라 달라지는 것으로 알려진 것들이었다.) 연구진은 이 단백질들의 아미노산 서열을 분석했는데, 분석 결과 놀랍게도 아시아 코끼리가 아닌 아프리카 코끼리의 단백질인 것으로 밝혀졌다(go.nature.com/ivzyzm). 린네는 문제의 표본을 아시아 코끼리(Elephas maximus)의 기준표본으로 삼았었지만, 동물학자들은 오랫동안 "그게 아니라, 사실은 아프리카 코끼리(Loxodonta africana)일 것"이라고 의심해 왔다. "이번 연구는 고(古)단백질 분석의 힘을 보여준 쾌거다. 단백질은 DNA보다 잘 분해되지 않기 때문에, 분자화석(molecular fossil)의 연대를 수백만 년 더 정확하게 측정할 수 있다. 더욱이 단백질은 유전물질만으로 밝혀낼 수 없는 정보를 제공해 줌으로써, 생물학적 통찰력을 배가(倍加)시킬 수 있다"고 단백질체학 전문가들은 말했다.

"고단백질 분석은 새로운 분야가 아니다. 일찍이 1954년부터 과학자들은 삼엽충과 공룡의 화석에서 아미노산을 검출했었다"고 영국 요크 대학교의 매튜 콜린스 교수(생물지구화학)는 말한다. 그러나 고단백질체학이 본격적으로 도약하기 시작한 것은 서기 2000년부터라고 할 수 있다. 당시 미국 미시건 주립대학의 페기 오스트롬 교수(지구화학)는 50,000년 된 들소와 바다코끼리에 대한 단백질 시퀀스분석 결과를 발표했다(참고논문 1). 그녀는 질량분석법(MS: mass spectrometry)을 이용하여, 펩타이드 단편을 이온화시킨 다음 그 질량을 측정하여 기준 데이터베이스(reference databases)와 비교하는 방법을 사용했다. MS는 단백질체학 분야에 혁명을 가져왔다. 왜냐하면 MS를 이용할 경우 하나의 조직에서 나온 수백 개의 단백질을 한꺼번에 분석하여, 단편화된 고단백질의 아미노산 서열을 분석할 수 있기 때문이다.

오스트롬과 콜린스를 비롯한 과학자들의 초기 연구는 유골 속에 풍부하게 존재하는 개별 단백질(예: 콜라겐)에 초점을 맞췄다. 콜린스 교수는 콜라겐을 `바코드`라고 부르는데, 그는 콜라겐 시퀀싱을 이용하여 고대 유적지에서 발견된 생물종들을 신속하고 저렴하게 확인하는 성과를 거뒀다. 예컨대 그는 양피지나 바이킹 헬멧의 뿔을 만드는데 사용한 동물이 무엇인지를 밝혀냈다. 또한 콜라겐은 매우 안정적이어서, 북극에서 발견된 350만 년 된 거대한 낙타 화석에서 채취된 콜라겐에서도 아미노산 서열을 분석하는 것이 가능할 정도다(참고논문 2).

그러나 연관된 동물종 간의 콜라겐 차이는 매우 작아, 그것을 진화의 지표로 삼기는 어렵다. "콜라겐을 갖고서 농가에서 기르는 염소를 아이벡스와 구분할 수는 없다. 네안데르탈인과 현대인을 구분하는 것도 마찬가지"라고 콜린스 교수는 말했다. 이에 카펠리니 교수는 오래 전 죽은 생물의 몸에서 검출된 다량의 상이한 단백질들을 확인하는 방법을 개발하는 연구에 착수했다. 2012년 그가 이끄는 연구진은 43,000년 된 털북숭이 매머드의 넙적다리뼈에서 126가지의 단백질을 검출했다(참고논문 3). 뒤이어 올해 초에, 연구진은 75만 년 된 말(馬)의 화석에서 73가지의 단백질을 검출하여 아미노산 서열을 분석하는 데 성공했다(참고논문 4). 이 두 가지 표본에서는 모두 DNA가 검출되었지만, 단백질 데이터는 DNA 분석이 밝히지 못한 추가정보(뼈에 발현되는 유전자의 종류에 관한 정보)를 제공해 주었다.

하지만 단백질 분석이 DNA 분석의 문제를 모두 해결해 주는 것은 아니다. 단백질 분석에도 문제점은 있다. 첫째, DAN 시퀀싱과 마찬가지로, 고대의 샘플을 MS로 분석하면 엄청난 양의 데이터가 생성된다. "단 하나의 샘플로부터 수백 개의 시퀀스가 쏟아져 나온다는 건 생각만 해도 끔찍한 일"이라고 오스트롬 교수는 말했다. 둘째, 고대의 단백질들 역시 - 고대의 DNA보다는 덜하지만 - 부패와 화학변화에 시달리게 된다. 셋째, 샘플에서 발견된 단백질을 확인하기 위해서는 기존의 데이터베이스를 이용해야 하지만, 고대의 동물들은 차치하더라도, 대부분의 현대 동물들에 대해서조차 이러한 데이터베이스가 구축되지 않은 경우가 허다하다.

길버트와 카펠리니는 박물관에 소장된 표본을 대상으로 이번 연구를 수행했지만, 고단백질을 연구하는 과학자들은 박물관을 벗어나 다양한 대상들을 연구하고 싶어한다. 오래된 생물의 유해에서 특정 조직을 떼어내어 단백질 시퀀스를 분석할 경우, 특정 조직에 발현되는 유전자가 무엇인지를 알아낼 수 있기 때문이다. 또한 단백질 분석을 하면, DNA 분석이 불가능한(DNA가 분해된) 표본으로부터 계통발생 정보( phylogenetic information)를 얻을 수도 있다. "DNA는 오랫동안 버틸 수 없기 때문에, 온대지방에서 발견된 고대의 샘플에서는 DNA를 검출하기가 매우 힘들다"고 콜린스 교수는 말했다. 고단백질 분석은 인류학 분야에도 도움이 될 것으로 보인다. 예컨대 호모 플로레시엔시스(Homo floresiensis: 인도네시아 플로레스 섬에서 발견된 키 작은 인간 화석)의 경우, 현대인과의 진화적 관련성이 불투명하며, 그로부터 DNA를 추출하기 위한 노력도 실패로 돌아갔다. 고단백질 분석은 인간의 진화계보에서 이러한 `호빗들(hobbits)`이 차지하는 위치를 결정하는 마지막 도구가 될 수 있을 것으로 보인다.

※ 참고논문
1. Ostrom, P. H. et al. Geochim. Cosmochim. Acta 64, 1043?1050 (2000).
2. Rybczynski, N. et al. Nature Commun. 4, 1550 (2013).
3. Cappellini, E. et al. J. Proteome Res. 11, 917?926 (2012).
4. Orlando, L. et al. Nature 499, 74?78 (2013).
 
출처 : http://www.nature.com/news/proteins-help-solve-taxonomy-riddle-1.14100 / KISTI 미리안 글로벌동향브리핑 2013-11-07
트위터 페이스북 미투데이 다음요즘 싸이공감 네이트온 쪽지 구글 북마크 네이버 북마크

댓글목록