고철환 저자는 서울대 문리대 식물학과를 졸업, 독일 킬대학교에서 해양생물학으로 이학박사학위를 취득했다. 현재는 서울대학교 자연과학대학 해양학과 교수이며 「동해안 오호리지역 해조류군집에 관한 연구」 외 수편의 논문이 있다.
수리분류학
수리분류학
책 머리에 지구의 역사와 함께 생물의 진화는 계속되어 왔고 전화과정 중에 나타나는 종분화의 결과로 오늘날의 다양한 종이 형성되었다. 이에 생물학자는 종의 형성과정을 설명하고자 노력하여 왔으며, 특히 분 류학자는 종이란 무엇이며 또한 종의 한계를 설정하는 원칙은 무엇 인가를 규정함으로써 생물학자가 가지는 공동의 목표에 좀더 접근 하고자 하였다• 아리스토텔레스는 종을 필수 · 형질을 소유하는 인위 적 단위로서 취급하였지만, 진화론이 주장된 이후 종은 자연에 존 재하는 진화적 단위의 실체로서 인식되기 시작하였으며 유전학의 지식은 이룰 생물학적 종의 개념으로까지 발전시키게 되었다. 따라 서 분류학은 생물을 일반 사물과 동일하게 취급하여 단순히 분류하 는 작업에서 벗어나서, 분류의 결과가 진화적 관점에서 논의되어져 야 하는 필연성을 갖게 되었고 분류학은 생물의 전화를 설명하는 생물학의 일개 분과로 성장하게 되었다. 이러한 전통적 개념에서의 분류학은 그러나 과거 수십 억년 또는 수 억년에 걸쳐 느리게 진행 되어 온 종 분화의 역사가, 현 시점에서 정확한 화석의 증거를 통 하여 증명되어지지 못한다는 사실 때문에 1960 년 이후 대두된 수리 분류학에 의해 다시 도전을 받기 시작하였다. 전화적 사실은 비록 인정되지만, 우리가 타임 머신을 타고 과거로 돌아가기 전에는 각 생물이 구체적으로 어떠한 과정을 통하여 진화가 이행되어 왔는가 를 알 수 없다고 본 것이다. 따라서, 현재의 생물군으로부터 분류 를 수행하면서 동시에 이의 결과가 계통적 관계를 반영하도록 어떻 게 생물간의 관계를 구성할 것인가에 대한 의문이 제기될 수 있다 고 수리 분류학자둘은 생각하였다. 죽 전통적 개념에 의한 종의 자 연성은 모두 인정되나, 종의 실체를 인지해내는 방법은 좀더 자연 과학적 방법론에 입각하여 객관성, 반복성을 소유하여야 한다고 주 장한 것이다. 현재의 종을 기준으로 과거의 사실을 유추해야만 한
다면 무엇보다도 먼저 현재의 종이 소유하는 분류적 형질이 철저히 분석되어져야 하며, 이러한 과정은 바로 생물이 현재 소유하는 모 든 형질이 선임관 없이 동등하게 취급됨으로써 이루어질 수 있다고 보았다. 이를 표현형을 대상으로 한 전유사성의 고찰이라고 수리분 류학자들은 표현한 바 있다. 물론 분류학의 이러한 이론이 오늘날 누구에게나 받아들여지고 있는 것은 아니다. 예를 들면, 최근 대두 된 분지론은 조상과 후손의 관계를 유추할 수 있는 형질에 비중을 두어 분류적 작업이 수행되어야 한다는 이론에 기초를 두고 있다. 그러나 분지론자들 역시 방법론에 있어서는 수리적 수단을 주로 사 용하고 있어, 수리분류학을 확대 해석한다면 분지론 역시 방법론적 관점에서 수리분류학의 범주에 속한다고 감히 주장되어질 수 있다. 지금도 전통 분류학이 분류학 내에서 차지하는 위치가 확고함에 는 틀림 없다. 그러나 분류의 목적이 생물을 실제로 동정해야 하는 데 국한시켜 제한적으로 설정되었을 경우 수리분류학은 커다란 장 점을 가지게 된다. 이러한 장점 때문에 전통 분류학자 역시 수리분 류학의 여러 방법론적 이론들아 분류를 수행하는 데 종합적으로 이 용될 수 있다고 보아, 수리분류학을 수용하는 입장임을 명백히 하 고 있다. 더우기 수리분류학적 방법론은 오늘날 분류학에서 사용되 고 있을 뿐만 아니라 인문 사회과학, 자연과학 범주 내의 일반적 사건이나 사물을 분류해야 하는 여러 분야에서도 적극적으로 이용 되고 있어 그 중요성이 강조되고 있다 하겠다. 이 책은 바로 이러 한 중요성 때문에 씌어졌다. 제 1 장부터 제 5 장까지를 포함하는 분류학의 이론을 취급한 제 1 부 에서는 분류학의 역사적 발달과정 속에서 분류군의 자연성이 생물 학적 지식의 축적에 의해 어떻게 해석되어 왔으며, 이에 따라 분류 의 원칙이 어떻게 설정되어 왔는가 하는 문제를 취급하였다. 제 2 부 (제 6 장-제 11 장)에서는 수리분류학적 관점에 따른 분류적 형질의 평 가와 분류적 유사성의 계산이나 분류군의 체계적 배열 등에 관한 구체적인 수리분류학 방법론울 기술하였다. 방법론에서는 특히 계 산과정의 원리를 이해시키는 데 주력하였으므로 여러 변형된 계산 과정을 심도 있게 취급하지는 못하였다. 변형된 계산과정에 대하여 는 소개된 문헌을 참고하기 바란다. 제 11 장의 분지론은 엄격한 의
미에서 수리분류학 방법론은 아니다. 그러나 분 류 결 과의 계통적 해석은 매우 중요하며 분지론의 이론은 이러한 문제 를 수리적 분석 의 과정을 통하여 해결하고 있어 이 책에서 하나의 독립된 장으로 소개하였다. 수리분류학이 가지는 문제점을 수리분류학자들은 어떠 한 입장에서 옹호하고 있는지를 제 3 부인 12 장 및 13 장에서 취급함 으로써, 전통 분류학 또는 분지론과의 만남에서 수리분류학이 가지 는 위치를 이해하는 데 도움을 주고자 하였다. 전체적으로 수리분 류학에 대한 분류학자의 입장을 객관적으로 기술하고자 노력하였 다. Mayr , Sim p s on, Sokal, Sneath , Hennig , Wi ley 등의 저 서 는 이 책울 서술하는 데 매우 많은 도움을 주었다. 이들 책에서 사용되는 술어를 우리말화하는 과정에서는 가능한 한 인위적으로 단어를 합 성하는 것을 피하였다. 현재 일상 생활에서 사용되고 있는 단어에 서 원어의 뜻을 가장 잘 나타내는 용어를 선택하였으며 어문각 발 행 국어대사전에 준하여 선택된 단어를 확인하였다. 따라서 현재 분류학 용어로 사용되는 단어 중 지금까지 정착이 안 되었다고 생 각되면서 동시에 인위적 합성어이기 때문에 위의 원칙에 어긋난다 고 여겨지는 용어들에 대해서는 일부 새로운 용어가 제안되기도 하 였다. 필자는 이 책을 분류학을 전공하기 시작한 대학원생을 대상으로 기술하고자 하였다. 특히 독자가, 이 책을 통하여 수리분류학적 과 정의 원리를 이해하고, 또한 이 과정을 이해한 상태에서 분류학에 서 문제가 되고 있는 제반 분류의 이론들을 수리분류학과 대비시켜 비교할 수 있도록 하는 데 도움을 주도록 하였다. 그러나 필자 스 스로 분류학에 대한 경험이 부족하여 분류학의 이론에서 취급되는 제반 문제를 적절히 논의 하였는가에는 자신이 없다. 현재 해양생 태학을 전공하면서 생태학에 도입된 수리적 분류 방법을 이용하는 과정 중에서 가졌던 작은 경험만으로 감히 이 책을 서술하고자 하 였음이 부끄러울 따름이다. 독자로부터의 많은 비판을 수용하여 개 정판에서는 보다 논리적으로 전개되는 내용을 수록할 수 있도록 노 력하고자 한다. 이 책을 서술하는 과정을 통하여 분류학적 사고에 좀더 접근할 수 있었던 기회를 준 대우재단에 감사할 뿐이다.
대학원 재학시 규조류 를 대상으로 필자로 하여금 분류학에 발을 둘여놓을 기회를 주셨던 서울대학교 식물학과의 정영호 교수님과 자유스러운 분위기에서 수리적 방법론을 공부하도록 허락해 주셨던 킬대학교의 Schwenke 교수님, 또 선배로써 매사에 조언을 아끼지 않으셨던 서울대학교 해양학과의 심재형 교수님께 감사드린다• 1985 년도 생물학회에서 가졌던 분류학의 제 문제에 관한 학술 발표 회를 통하여 분류의 행위에 대한 우리의 생각을 정리하게 해준 서 울대학교의 김훈수 교수님, 이인규 교수님, 전북대학교의 이병훈 교수님 , 충북대 학교의 고흥선 교수님께 감사드린다. 1986 년 12 월에 개최 되었던 전북대학교 생물학연구소 주최 계통 분류학에 관한 발 표회 역시 필자에게는 매우 유익하였다. 제 9 장에서 소개되는 배열 법에 관하여는 충북대학교의 김영환 교수님과 의견을 교환한 바 있 다. 서울대학교 식물학과의 분류학 연구실, 해조류학 연구실 대학 원생들과 가졌던 종의 제반 문제에 대한 토론 또한 많은 도움을 주 었다. 득히 식물학과 대학원 재학중 분지론에 입각한 분류의 이론 에 관하여 의견을 교환하고 실제 계산 예를 제공해 준, 지금은 오 스틴에서 공부하고 있는 김기중 선생께 깊이 감사드린다. 항상 불 평없이 원고를 타자해 준 조정숙 양에게 가지는 고마운 마음은 오 랜동안 간직될 것이다. 이 책을 서술하며 가졌던 지난 몇 년간의 가슴 설레임은 학문에 대한 줄거움을 다시 한 번 맛보게 한 중요한 경험이었다. 늘 풍요로운 마음으로 나를 대하는 아내에게 이 책을 바치고자 한다. 1987 년 12 월 고철환
수리분류학 - 차례
책 머리에 5 제 1 장 분류학 술어의 정의 11 1.1 분류학과 계통학 11 1.2 수리분류학 16 제 2 장 분류학 발달 과정과 수리분류학의 출현 18 2.1 분류적 관점 18 2.2 수리분류학의 출현 배경 20 제 3 장 분류의 원칙과 종 23 3.1 분류 원칙 설정의 문제점 24 3.2 종 26 3.3 종분화 30 제 4 장 분류군의 자연성 37 4.1 자연분류군 37 4.2 수리분류학의 입장에서 본 분류군의 자연성 41 4.3 분류적 관계의 자연성 46 4.3.1 전동 분류학에서의 분류적 관계 48 4.3.2 분지론과 분류적 관계의 자연성 50 4.3.3 표현론과 분류적 관계의 자연성 54 제 5 장 분류적 형질 59 5.1 분류적 형질의 정의 59 5.2 분류적 형질의 종류 63 5.3 형질의 유사성 66제 6 장 수리분류학과 분류적 형질 73
6.1 수리분류학의 특징 73 6.2 형질의 선택과 전유사성 76 6.3 형질의 단위 78 6.4 운영분류단위 79 6.5 형질의 적정 갯수 82 6.6 형질의 상대적 중요성 83 제 7 장 분류적 유사성의 계산 87 7.1 자료의 종류 88 7.1.1 정성자료 89 7.1.2 정량자료 90 7.2 유사도의 계산 91 7.2.1 유사지수 및 거리지수 92 7.2.2 조합계수법에 의한 분류적 유사지수 96 제 8 장 운영분류단위의 체계적 배열 103 8.1 집괴분석 105 8.1.1 집괴분석의 과정 107 8.1.2 단일결합 110 8.1.3 완전결합 110 8.1.4 평군결합 111 8.2 집괴분석법에 의한 계산 예 114 8.3 집괴분석 결과에 의한 표현군 118 8.4 분류학에서의 이용 예 121 제 9 장 배열법에 의한 분류군의 배열 125 9.1 집괴분석과 배열법의 관계 125 9.2 식생의 분류와 배열법 126 9.3 배열법의 과정 130 9.3.1 좌표축의 설정 및 좌표값 131 9,3.2 배열 결과의 통계적 검정 137제 10 장 요인분석법에 의한 분류군의 배열 140
10.1 요인분석 의 목적 141 10.2 요인분석 과정 143 10.3 요인분석 결과의 해석 153 10.3.1 A 및 F행렬의 해석 원칙 153 10.3.2 요인분석 계산 예와 결과의 해석 155 10.3.3 F행렬의 수리분류학적 이용 162 제 11 장 분지론 169 11.1 분지론의 원리 170 11.2 원시형질과 파생형질의 판단 174 11.3 분지분석의 수리적 방법 178 11.4 분지분석의 이용 예 190 제 12 장 수리분류학에 대한 비판 193 12.1 전유사성 194 12.2 수리적 분류 과정 196 12.3 수리분류학자의 입장 199 제 13 장 전통분류학과 수리분류학의 만남 202 13.1 전통분류학, 표현론 그리고 분지론 203 13.2 전통분류학과 광의의 수리분류학 206 13.3 수리분류학의 분류학에서의 역할 212 13.4 나는 수리분류학을 옹호하는가 215 참고문헌 219 찾아보기 225제 1 장 분류학 술어의 정의 1.1 분류학과 계통학 수리분류학을 논의하기에 앞서 분류학이란 무엇이고 또한 분류학 의 어떤 역사적 배경에서 수리분류학이 발전되어 나왔는가를 살펴 봄이 타당하다고 생각한다. 우선 이 책에서 사용되고 있는 술어인 분류학(分類學, tax onomy ) 의 의 미를 정 확히 알아보고 이 와 관계 되 는 계 통분류학(系統分 類 學, sys te m ati cs ), 분류(分類, classif ica ti on ) , 동정 ( 同 定 ide nti fica ti on ) 등을 정 의 해 보자. 분류학아라는 용어는 영어권에서 t axonom y로 표기되는 술어를 동양권에서 분류학으로 번역하여 현재까지 관습적으로 사용하는 단 어 이 며 경 우에 따라서 는 sys te m ati cs 역 시 분류학으로 표기 하고 있 기도 하다(김 등, 1982, 제 15 쪽). 그러나 영어권에서의 tax onomy 와 s y s t ema tic s 는 엄밀하게 말해 완전히 동일한 의미를 내포하지는 않는다. t axonom y는 그리스어의 . tax is ( arrang e ment : 배 열)와 nomos (law : 법 ) 라 는 단 어 를 합 쳐 서 구 성 한 단 어 이 고, s y s t ema tic s 는 그리스어로 부터 라틴어 문자화 된 s y s t ema( 여러 부분으로 이루어전 전체)라는 단어에 그 기원을 두고 있다. 실제로
이 두 용어는 여러 저자에 의해 서로 조금 다론 의미로 정의되고 있다. 예 를 들면 Sim p s on (19 61) 은 t axonom y란 〈 분류의 근거 , 원 칙, 과정 및 규칙을 포함하는 분류에 관한 모든 이론적 학문(t he the oreti ca l stu d y of classif ica ti on , inc ludin g its basis , pr in c ip le s, pro cedures and rules) 〉이라고 표현하고 있는 반면, s y s t ema ti cs 란 〈생물의 종류와 다양성 및 생물간에 존재하는 모든 관계에 대한 학 문 (the sci en ti fic stu d y of the kin d s and div e rsit y of orga nis m s and of any and all relati on ship s among the m) 〉 으로 정 의 하고 있다. 죽 S i m p son 은 t axonom y의 정 의 를 생 물의 종을 분류하는 과정 과 분 류의 원칙에 초점을 맞춘 반면, s y s t ema tic s 는 생물 종 간의 관계 를 강조하는 뜻에서 사용하고 있다. 물론 분류의 과정이나 원칙이 실제에 있어서는 생물 종 간의 관계를 중심으로 이루어지고 있어 이 두 용어의 개념상의 차이를 정의하는 것은 어려운 문제로 남아 있다고 본다. 그러나 t axonom y가 분류 그 자체에 비중을 두고 있 는 반면, s y s t ema tic s 는 분류 되 어 진 종들 간의 모든 관계 를 논의 (물론 이 과정이 분류학적 과정이건 하지만)하는 학문으로 정의되 고 있어 이 두 술어의 번역은 사용하는 상황에 따라 달라질 수 있 다고 생각한다. 필자는 t axonom y를 〈분류학〉, s y s t ema tic s 를 〈분류학〉, 〈계통 분 류학〉(김 등, 1982) 또는 〈체계학, 體系學〉으로 이 책에서 번역, 사 용하고자 한다. s y s t ema tic s 를 체 계 학으로 의 미를 확장시 켜 번역 하 고자 하는 데에는 다음 두 가지 이유가 있다. 우선 s y s t ema tic s 가 생 물학에 서 만 쓰여 지는 용어 가 아니 라는 사실 이 다. s y s t ema tic이 라 는 형용사는 생물학을 포함하는 전 자연과학뿐만 아니라 심지어 인 문, 사회과학의 분야에서 까지도 어떤 사실의 체계를 수립하고자 할 때 흔히 쓰여지는 단어이다. 그러나 무엇보다 중요한 것은 s y s t ema ti cs 는 S i m p son 이 지 적 한 대 로 생 물학 내 에 서 조차 생 물의 분류와 관계하는 분야 이의의 다른 분야에서도 흔히 사용될 수 있 는 술어라는 사실이다. 예를 들어 생리학이라하면, 이의 대상 분야 가 생물의 종류나 다양성에 초점을 맞출 필요가 없기 때문에 S i m p son 이 정의한 . s y s t ema ti cs 의 범주에 들어가지 못하나 만일 생 리학의 결과들에 대하여 서로 비교되는 작업이 행해지는 경우, 이
때 는 다시 s y s t ema ti c s 라 는 개 념 이 이 용될 것 이 다. Sim p so n (1961) 역시 이러한 개념까지 를 포함시켜 s y s t ema ti cs 를 부연설명 하고 있는 바, 이를 〈 거의 모든 생물학 분야로부터 유도될 수 있고 또한 모든 분야에 적용될 수 있는 관심의 초점이며 사물을 보는 관 점 이 다 (sys t e m ati cs is a foc us of int e r est or a way of lookin g at thi n g s th at may deriv e from or app ly to almost any sort o f bio l og i- cal stu d y ) 〉 라고 기 술하고 있다. 이 러 한 의 미 를 함께 생 각하면 s y s t ema tic s 를 분류학 또는 계 통분류학 이 의 에 추가로 체 계 학이 라 는 용어를 사용하는 것도 가능하리라 본다. 일반적으로는 〈 p hy lo g en y 〉 를 계통으로 번역하여 사용하고 있으므 로 체 계 학이 라는 용어 의 사용은 p h y lo g en y와 관계 된 술어들과 혼 돈을 피하는 장점을 가져 울 수도 있다. 예를 들어 우리가 만일 s y s t ema tic s 를 S i m pson 이 지 적 한 대 로 생 물의 〈모든 관계 〉에 서 출 발하고 있음을 인정한다면 모든 관계중 계통적 관계를 나타내는 ph y lo g e neti c s y s t ema ti cs 는 〈 계 통 체 계 학〉, p hy lo g ene tic s 는 〈계 통 학 〉 으로 sys te m ati cs, 죽 체계학과 구별되게 번역하는 것이 가능할 수 있다. ph y lo g e neti c s y s t ema ti cs 와 phy lo g ene tic s 의 구별은 실제 로 불가능 하나 (W iley , 1981, 제 6 쪽) 이 두 술어 와 s y s t ema tic s 는 구별되어야만 하는데, 이러한 구별은 각 술어가 가지는 의미를 위에 서 제시한 술어에 의해 번역함으로써 더욱 명확해지리라고 믿는다. 분류학, 계동 분류학 이의에 체계학이라는 술어의 제안이 모든 분류학자들에 의해 받아들여 지리라고는 생각하지 않는다. 왜냐하 면 현재의 분류학자들은 생물의 체계를 생물의 계통에서 찾으려 하 므로 체계학은 곧 계통학이라고 표현될 수 있기 때문이다. 그러나 필자는 이 의견에 반드시 동의하지는 않는다. 수리 분류학자들이 지적한 대로 분류는 그 목적하는 바에 따라 생물간의 관계에 대한 관점을 달리 할 수 있기 때문이다. s y s t ema tic s 에 대한 우리말 용 어 에 체 계 학을 추가하는데 어 려 운 점 은 실제 로 s y s t ema tic s 를 분류 학, 계동분류학 또는 심지어 계통학으로 사용하는 우리의 관습에 있다고 본다. 김 등 (1982, 제 12 쪽)은 s y s t ema tic s 를 한국에서 일 반적으로 분류학 또는 계통 분류학으로 번역, 사용하고 있음을 소 개하고 있으며 이의에 또 〈 계통학〉으로 통용되기도 한다. 이 책의
제 11 장에서 소개되는 분지론( 分 枝 論 , clad i s tic s) 을 국내에 도입하 는데 주도적 역할을 해온 이병훈 교수는 그의 모든 논문 (1985 등) 에서 s y s t ema tic s 를 〈계통분류학〉으로 표기하고 있다. 이러한 술어의 사용은 관습적으로 이루어지므로 분류학, 계통 분 류학, 또는 체계학 중 어떤 술어를 선택할 것인가를 독자의 판단에 맡길 수 밖에 없으며 또한, s y s t ema tic s 의 의미가 각 경우에 있어 제한적 의미로 사용될 수 있어 위의 몇 가지 술어 중 그 의미하는 바에 따라 어느 한 술어가 상황에 의해 선택되어도 무방하다고 하 겠다. 단 필자로서는 가장 광범위한 의미의 〈체계학〉이라는 용어가 s y s t ema tic s 를 설명하는 하나의 술어로서 추가로 사용되어야 한다 고 주장할 따름이 다. 위 의 논의는 어 디 까지 나 s y s t ema tic s 가 Sim p s on 또는 Ma y r 가 정의한 바와 갇이 t axonom y보다 넓은 의 미로 사용됨을 전제로 한 경우이다. 그러나 이 두 용어는 동의어라 고 주장되는 경 우도 많으며 (이 책 에서도 이 경 우는 s y s t ema tic s 를 분류학으로 번 역 하고자 함) , 또 t axonom y가 s y s t ema ti cs 보다 더 포괄적이라고 주장되는 경우도 있다. 분류학 또는 계통학 및 체계학이라는 용어 이의에 분류학에 관한 책자에서 많이 사용되고 있는 용어로는 분류(分類, classif ica ti on ) 및 동정(同定, i den tifi ca ti on) 이 있다. 분류란 S imp son(1961) 의 정의에 의하면 〈생물을 그들 사이의 관계에 기초를 두어 군(群)으 로 체 계 적 으로 배 열 함 (classif ica ti on is the orderin g of orga nis m s int o grou p s (sets ) on the basis of the ir relati on ship s) 〉을 뜻 한 다. 이때 생물간의 관계가 무엇을 의미하는 가에 혼돈이 있을 수 있다• 죽 생물간의 관계가 선조, 후손간에 존재하는 계동적 관계인가 아 니면 단순히 어떤 생물간에 현상적으로 나타나는 형질의 유사성 (類 似性, s imi lar ity)인가 이다. 이러한 문제에 관하여는 제 4 장에서 자 세히 다루고자 한다. 단 여기서 강조하고 싶은 것은 분류란 일종의 과정일 뿐만 아니라 이러한 과정에서 나타나는 최종적인 결과 역시 분류라 할 수 있다는 사실이다. 동정이란 〈현재 분류되어 있지 않은 생물을 이미 분류되어진 어 떤 분류군에 예 속시 키 는 작업 (allocati on or assig nme nt of addi- tion al unid e nti fied obje c t s to the correct class once a classif ica ti on
has been esta b li sh ed) 〉 을 뜻한다 (Sim p so n, 1961 ) . 동정 이 분류와 구별되는 차이를 엄격히 지적하자면 분류가 어떤 분류군을 설정하 는 작업까지를 포함하고 있는 반면, 동정은 분류군의 설정이라는 관과의점 보관다계는에 단기순초히를 이 두미어 설예정속된시 분키류는군 작에업 대이상라이 할되 수는 있생다물.을 M그a들yr 등 (1953) 은 동정을 분석 단계 (分析段階, analyt ica l sta g e ), 분류 롤 종합 단계 (綜合段階, syn th e ti c s t a g e) 로 구분하여 동정 및 분 류 모두를 분류학을 연구하는 과정으로 소개하기도 하였다. 분류의 행위는 일정한 규약에 의해서 수행된다. 예를 들면 분류 의 형식은 일차적으로 종과 속으로 구성되는 명명(命名, nomen-clatu r e) 과정을 거쳐 계층 구조(階層 構造, h i erarch y)로서 표현 된다. 이때 배열되는 대상은 분류군(分類群, t axon) 이라 불리우는 생물의 무리이며 생물 개체가 아니다. 죽 어떤 개체를 분류한다고 표현하면 이는 잘못된 표현이며 이 때는 동정이라고 말해야 한다. Sim p s on (1961) 의 정의에서 보여진 것처럼 분류가 되는 것은 어디 까지나 어떤 군이라야 하는데, 이때의 군을 분류군(分類群, t axon) 이라 한다. S i m p son 은 〈분류군은 계층구조적 분류의 어느 단계에서전 하나의 단위로 인정되는 실제 생물의 집단이다 (a tax on is a grou p of real orga nis m s recog nize d as a for mal unit at any level of hie r archic classif ica ti on ) 〉라고 하였 다. 이 때 계 층구조 란 〈최 하위 조(組, ,se t, class) 는 예외이나, 상위 조의 경우 몇 개 의 부속조로 이루어지는 서로 다론 수준에서의, 조의 계열로서 배 열 되 는, 분 류 를 위 한 체 계 적 구 조 이 다 (A hie r archy is a sys te m ati c fram ework for zoolog ica l classif ica ti on wi th a seq u ence of classes (or sets ) at dif fer ent levels in whic h each class_e xcep t the lowest inc ludes one or more subordin a te classes) 〉라 고 정 의 하 였 다. 또한 계 층 구조의 각 단계 를 분류적 범 주 (範“읍, cate g o ry ) 라 하였는바 〈분류적 범주란 계층 분류에서 어떤 단계에 놓여 지는 분 류군들로서 구성되는 조이다 (a tax onomi c cate g o ry is a class the members of whic h are all the tax a pla ced at a give n level in a hie r archic classif ica ti on ) 〉라고 상세 히 서 술하고 있다. 계 층 구조의 예를 들면, 대표적인 것으로 린네의 계 (界, kin g d om), 문(門,
ph y lu m) , 강 (綱, class) , 목 ( 目 , order) , 과 (科, fam i ly ) , 속 (鳳 ge nus), 종(種 s p e ci es) 의 7 개의 연속적인 단계로 이루어진 구조 룰 둘 수 있으며 S i m p son(1961) 은 이를 세분하여 총 21 개 단계를 설정하고 있기도 하다. 분류적 범주란 위 예에서 각 단계 (예를 들 면, 문, 강, 목 등)를 가리키며, 이 때의 각 단계는 여러 분류군으 로 구성된다 하겠다. 반대로 말하면, 분류군이란 위 S i m p son 의 정 의에서 말한 대로 어느 단계이건 상관없이 생물의 실제적인 집단의 단위이며, 이러한 분류군은 1 개 또는 그 이상이 모여 어떤 분류적 범주를 형성한다. 동정을 위하여 우리는 또한 검색표(檢索表, ke y)를 종종 이용하 고 있는 바, 이러한 검색표는 반드시 분류학적으로 중요한 형질에 의해 작성된 것이 아니라 단지 개체를 구별하기 위한, 가변성이 없 는 간단 명료한 형질들을 이용하여 작성된 것이다. 따라서 검색표 는 동정의 편의를 위해 인위적으로 만들어진 것이라고 할 수 있다. 1.2 수리분류학 분류의 원칙, 과정 등 분류학에서의 중요한 문제를 취급하기 이 전에 수리분류학(數理分類 學 , numeric a l t axonom y)이란 어떻게 정의되어 질 수 있는 가를 잠시 살펴 보고자 한다. Sokal 과 Snea th (1963) 는 수리 분류학을 〈분류 단위 사이의 근연성이나 유사 성을 수리적으로 측정하고 분류 단위를 그들의 근연성에 기초를 두 어 체 계 적 으로 배 열 함 (the numeric a l evaluati on of the aff ini t y or sim ilar i ty betw een tax onomi c unit s a nd the orderin g of the se unit s tax a on the basis of the ir a ffi n iti es) 〉으로 정의한 바 있다. 이들 저자는 1973 년에 수리분류학에 관한 저서를 재출판하면서 (Sneath 와 Sokal, 1973) 수리분류학을 다시 정 의 하고 있으나 내용상으로는 하등의 변화가 없다. 죽 수리분류학이란, 〈분류 단위를 그들의 형 질 상태에 기초를 두어 수리적 방법에 의해 분류군으로 묶는 것 (the grou p ing by numeric a l meth o ds of tax onomi c unit s i nt o ta xa
on the basis of the ir characte r sta t e s ) 〉이 라 하였 다. 위의 수리분류학에 대한 정의에서 우리가 생각하여야 할 문제는 수리분류학이 단순히 방법론적인 것이냐 하는 문제이다. 즉 경험적 인 방법을 수리적인 방법으로 개선한 것에 불과한가이다. 위의 정 의에 따르면 우리는 수리분류학자들이 방법론적인 면만을 강조한 것으로 이해하기 쉽다. 그러나 실제로는 수리적 분류의 결과를 전 통분류학에서 사용되는 원칙에 근거하여 해석하고자 수리분류학자 둘은 많은 노력을 경주하였다. Sokal 과 Snea t h 에 의한 수리분류학 에 대한 정의도 분류의 원칙이라는 측면에서 보면, 비록 그들이 유 사성을 평가하는 과정을 강조하였지만 이때의 유사성이 전통분류학 의 이론에 기초를 둔 유사성임을 간과해서는 안될 것이다. 따라서 현재 분류학에서 사용하고 있는, 분류의 원칙에 따른 분류군의 설 정을 수리분류학에서 어떻게 해결하고 있는 가를 살펴보는 것이 이 책을 서술하는 목적 중의 하나이다. 만일 수리분류학이 단순히 방법론적인 면만을 강조하고 있다면 수리분류학이라는 용어 대신에 수리적 분류(數理的 分類, numeri - cal classif ica ti on ) 라는 용어 를 사용해 야 할 것 이 다. 수리 분류학이 단순한 방법론에 국한되고 있지는 않으나 분류하고자 하는 대상 생 물의 여러 성질을 일단 수량화해야 하는 것은 사실이다• 그러나 이 러한 수량화 작업이 수리분류학의 중요한 목적은 아니므로 분류의 방법론적 주안점을 둔 용어의 사용은 부적당하다. 이의에 수학분류 학 (數學分類學, math e mati ca l tax onomy ) 이 라는 용어 를 주장하는 학자도 있으나, 수리분류학에서 사용되는 정량적 방법들이 단순한 기술(記述, descrip tive ) 통계적 방법들을 이용하고 있어 수학이라 는 범위를 모두 사용하는 것은 적당치 않다. 죽 수리분류학에서의 방법들이 통계학의 제반 방법을 포함하고 있지 않음도 물론이고, 수리분류학에서 이미 제안된 방법과 그 방향을 전혀 달리하는 수학 적 방법이 쓰여질 경우 이 역시 수리분류학의 범주에 삽입될 수 없 다고 본다. 학자에 따라서는 수리분류학을 수리체계학(數理體系學, numeric a l sys t e m ati cs) 으로 표현해 야 한다는 주장도 있으나 전통 적으로 수리분류학이라는 술어가 사용되고 있어 더이상의 논의를 생략한다.
제 2 장 분류학 발달 과정과 수리분류학의 출현 2.1 분류적 관점 우리는 일상 생활에서 매우 많은 종류의 사물을 접하게 된다. 만 일 우리가 이러한 사물을 종류에 따라 인식하고자 시도한다면 많은 종류의 사물은 우리를 매우 혼란스럽게 만들 것이다. 그러나 다행 히도 각각의 사물들은 어떤 형태로든 이미 고유한 이름을 가지고 있어 우리가 이러한 사물을 식별할 수 있도록 해 주고 있다. 죽 사 물을 각각의 특성에 따라 나누고 이를 이름을 붙이는 분류 (우리가 일상용어로 사용하는 의미에서의 분류)라는 과정이 이미 과거에 수 행 되었다고 볼 수 있다. 일반적 사물의 분류는 이렇게 우리 일상 생활과 알게 모르게 매우 밀접한 관계를 가져 왔으며 또한 앞으로 도 계속해서 생활과 밀접한 관계를 가지게 될 것이다. 예를 들어 현대 사회와 같이 많은 상품이 쏟아져 나오는 사회에서 이러한 상 품이 분류되지 않는다면 이를 구매하려는 소비자에게 매우 큰 혼란 이 울 것이다. 도서관에 보관되어 있는 수 많은 종류의 책들을 상 상하여 보라. 끊임없이 출판된 책들이 분야별로 나뉘어 정리되어 있지 않다면 우리가 원하는 책을 도저히 찾을 수 없을 것은 틀림
없다. 아마도 지구상에 있는 모든 사물은 어떤 형태로든 분류되어 야만 우리가 이룰 쉽게 식별할 수 있을 것이다. 이러한 필요 때문 에 우리는 심지어 동질의 사물이라 할지라도 그 양이 방대할 경우 인위적인 범위를 정하면서 까지 이 대상을 분류하고자 시도한다. 수 만명의 학생이 모이는 학교에서는 이들을 학년이나 반, 학과 등 으로 분류하며 우리가 거주하고 있는 지역도 시, 동, 번지 등으로 구분하고 이 곳의 거주자 역시 이러한 분류에 따라 0 0 동 주민이 라 부르고 있다. 이렇게 우리가 일상으로 접하는 사물, 사회적 제반 현상들은 그 양태가 다양하기 때문에 우리는 이룰 체계있게 정리해야만 하는 필 요성을 느끼게 되고, 따라서 우리는 어떻게 지구상의 무한한 사물 내지 사건을 분류할 수 있겠는가 하는 문제에 봉착하게 된다. 그러 나 무한히 존재하는 사물의 각 개체가 다른 개체와 전혀 무관하여 유리된 상태에서 독립적으로 존재하고 있지 않다는 사실은 이러한 사물을 분류하는데 있어서 매우 중요한 의미를 지닌다. 죽 어떤 사 물이든 그들의 속성이나 형태적 특징 등에 의해 다른 사물과 특수 한 관계를 가지고 있고 우리의 언어는 이러한 관계를 중요시하여 이들 관계나 특징을 상칭화 시켜 형성된 것으로 볼 수 있다. 따라 서 일상언어는 이미 분류의 의미를 내포하고 있다 하겠다, 우리가 무의식적으로 수행하는 분류의 내면에 이렇게 사물 사이 의 관계라는 잠재 의식이 내포되어 있음은 매우 중요한 사실이다. 이때 사물 사이의 관계는 매우 여러 가지 형태로 나타난다. 그러나 중요한 것은 어떤 관점에서 이 관계를 보는가 이다. 심지어 지구상 의 많은 사물도 어떤 물질로 구성되었는가 하는 화학적 성분의 관 점에서 보면 단지 100 여 개의 원소만으로 표시되며, 이때 각 사물 간의 관계는 구성 원소의 차이에 의해 표현된다. 생물학의 한 분과 인 분류학에서 역시, 생물 사이의 관계에 대한 관점이 무엇인가가 매우 중요한 문제로 지금까지 취급되어 왔다. 분류학에서의 생물 간의 관계에 대한 관점은 따라서 분류학이 역사적으로 어떤 과정을 거쳐 현재까지 발달하여 왔는가를 살펴봄으로써 그 윤곽이 명확해 질 것이며 이러한 과정 속에서 수리분류학아 가지는 관점의 방향이 이해되어질 것이다.
2.2 수리분류학의 출현 배경 생물을 대상으로 한 분류학은 이미 그리스 시대부터 체계적으로 발달하기 시작하였다. May r 등 (1953) 은 분류학의 발달 과정을 크 게 세 시대로 구분하고 있다. 제 1 기는 아리스토텔레스가 동물을 생활 양식이나 서식지, 몸의 구조 등에 기초를 두어 새, 물고기, 곤충들을 분류한 이래 16-17 세기의 동물상, 식물상에 대한 연구가 활발하던 시대를 거쳐 린네의 분류학적 등급의 설정이나 이명법(二 名法, bin o mi al nomenclatu r e ) 을 제 안한 시 기 까지 롤 포함한다. 이 시기에 있어서의 분류학의 특칭은 분류를 순전히 생물간의 형태 적 유사성에 기초를 두어 시행해 왔다는 것이다. 그러나 다윈이 1859 년 〈종의 기 원〉을 발표한 이 래 분류학도 이 영 향하에 놓이는 제 2 기를 맞이하게 된다. 물론 라마르크가 린네 이후 최초로 진화 의 개념을 분류학에 도입한 학자이긴 하나, 라마르크 시대까지만 하여도 진화의 개념이 분류학에 많은 영향을 미치지는 못하였고, 다윈 이후에야 비로소 진화의 문제가 본격적으로 도입되기 시작하 였다. 린네 시대 이전에 있어서의 분류의 원칙이 종과 종 간의 논 리적 관계에 근거한 것이라고 한다면, 린네 이후 학자들의 원칙은 논리적 관계를 설정하는데 사용되는 여러 성질 중 선조 후손 관계 의 중요성을 강조하고 있는 것이라고 볼 수 있다. 이러한 관점에서 의 분류적 시도를 전화분류학(進化分類學, evoluti on ary tax o-nomy ) 이 라고 일컫는다. 진화분류학의 기원을 이루는 다윈은 그의 〈종의 기원〉의 저서에 서 진화의 사실을 증명하려고 노력하였고, 진화의 기작 중 〈자연 선택〉의 효과를 강조하였다. 다윈은 분류군이란 후손에서 일어난 변이의 결과라고 보았으며, 따라서 현재 설정되어 있는 분류군은 모두 공동 조상과 연결되는 연속적 현상이라고 주장하였다. 그는 특히 이러한 관접에서 공동 조상으로 부터 유도된 것으로 간주될 수 있는 공동 특징이나 공동 조상으로 부터 변형된 것으로 해석되
는 고정된 중간형 또는 일시적 모형 등에 대한 증거를 제시하여 분 류군을 설정해야 한다고 주장하였다. 어느 시간에 있어서의 생물의 촌재는 그 이전의 조상과 또 최초의 공동 조상으로 연결된다는 것 이다. 죽 현재 존재하는 종은 서로 수평적 관계에 있는 것이 아니 라 조상으로 연결되는 수직적 관계에 있다고 보았다. 따라서 종의 분류에 대한 원칙이 조상과의 관계에서 설정되어야만 한다고 주장 한것이다. 제 3 기로 지칭된 20 세기에 들어와서는 분류학 자체도 생물학의 발전에 많은 영향을 받기 시작하였다. 죽 생물의 종을 개체별로 파 악하는 것 이 아니 라 개 체 군 (個體群, po pu lati on ) 으로 파악하고 (Huxley, 1940), 따라서 어떤 종의 한계를 개체군 사이에 존재하 는 일련의 차이에서 추정해야 한다는 개체군분류학(p o p ula ti on sys te m ati cs) 의 대 두나, 생 물 종의 분류를 주로 형 태 적 특징 에 의 존하던 것을 생태적, 분포적, 유전적, 생리적 특칭까지를 포함시켜 야 한다는 생물분류학 (bio s ys te m ati cs : 이를 종분류학으로 보통 번 역한다. 형태적 이의의 형질을 모두 분류에 고려하고 종울 중심으 로 종을 규정하려 노력하기 때문이다. 그러나 어원상 종분류학이라 고 번역하면 의역이 된다고 생각한다.) 등의 등장은 이 시기의 생 물학의 발전이 분류학에 얼마나 큰 영향을 미쳤는가를 잘 반영하고 있다. 분류학사에서 무엇보다도 중요한 것은 그러나, Sokal 과 Sneath 에 의해 최근 주창된 수리분류학과 이어서 전개된 분지론(分枝論, cladis t i cs) 의 이 론이 다. 분지 론 역시 수리 적 방법 을 사용하고 있고 조상형의 설정 등에 대한 방법론의 타당성이 논의되고 있으나 우선 수리 분류학의 문제로 돌아가 보자. 이는 May r 등의 시대적 분류 인 제 3 기 이후로 1963 년 Sokal 과 Snea t h 가 그의 저서 『수리분류학 의 원리 Pr inc ip le s of Numeri ca l Taxonom y 』 를 출간한 이후 수리 분류학의 방법론은 분류의 실제에 있어 급속도로 응용되기 시작하 였다. 더우기 수리 분류학의 방법들은 생물의 분류에서뿐만 아니라 생태학에도 커다란 영향을 미쳐 생태학 방법론 자체를 발전시켰을 뿐 아니 라 (Kershaw, 1973 ; Muller-Dombo i se 와 Ellenberg, 1974 ; S t e i nhausen 과 Lang e r, 1977 ; Whit tak er, 1982) 사회 과학의 방면에
서도 수리적 분류의 방법이 사회의 제반 현상을 분류하는데 사용되 고 있음이 현재의 실정이다. 수리분류학의 원리에 의하면 공동조상과의 유연관계라 할지라도 이 유연관계가 현존하는 생물 개체간의 여러 유사성으로부터 유추 될 수밖에 없다는 것이다. 그러나 전통 분류학은 경험적 지식을 동 원하여 선조와 후손의 관계로 유추되는 유사성을 도출해야 한다고 보았다. 이 두가지 관점은 서로 밀접한 관계를 가지고 있어 실제로 이를 유리시켜 생각하기는 매우 어렵다. 다윈 이후 근대 분류학에 서는 분류군의 설정이 선조, 후손이라는 전화적 관점에서 이루어전 다. 그러나 이때 화석종의 증거가 불충분한 상태이므로 선조, 후손 의 관계는 어쩔 수 없이 화석종이 아닌 현재 존재하는 종들간의 유 사성에 기초를 두어야 하는 모순점을 안게 된다. 죽 단순히 지질학 적 증거인 화석에만 기초를 두어 시대적으로 변화하는 종의 한계를 파악하기에는 현존하는 종의 다양함에 비해 그 화석종의 증거들이 너무 부족한 상태이고, .따라서 고생물학 자체에서 까지도 어떤 형 의 변화로 부터 시대적 연속성을 거꾸로 유추하려는 시도가 이루어 지고 있는 실정이다. 이러한 관점에서 보아 현존하는 종들 간의 형 질의 유사성은 매우 중요한 의미를 갖게 되었고, 따라서 현존하는 개체간의 유사성에 기초를 둔 수리분류학의 태동은 당연한 결과라 하겠다.
제 3 장 분류의 원칙과 종 우리는 앞에서 생물을 어떠한 관접에 의해 분류해 왔는가를 간단 히 살펴보았다. 많은 분류학자들이 각자의 견해에 따라 분류의 원 칙을 수립하여 왔으나 현 시점에서 역시, 누구나 수긍할 수 있는 분류의 원칙을 선택하여 알기 쉽게 간략히 설명한다는 것은 매우 어려운 일이다. 바로 이 분류의 원칙 문제를 해결하기 위하여 지난 수세기 동안 분류학자들이 부단한 노력을 기울여 왔지만, 현재까지 도 많은 사람들의 논란이 지속되고 있음은 물론, 이러한 의견을 수 령할 수 있는 공통된 원칙을 제시하고 있지도 못하다. 이 책에서도 따라서 내용의 많은 부분을 할애하여 분류학에서의 원칙이 무엇인 가를 다루고자 한다. 이 책의 서술 목적도 분류의 원칙을 수리 분 류학자의 입장에서 어떻게 주장하고 있는가를 소개하고 수리적 방 법론이 이러한 원칙을 어느 정도 고수할 수 있는가를 토의하는데 있다고 볼 수 있다.
3.1 분류 원칙 설정의 문제점 현재 수없이 존재하는 생물을 일단 분류가 수행되지 않은 이름 없는 개체라 가정하고, 단순히 소박한 관찰을 통하여 현존하는 생 물 개체를 대상으로 분류의 작업을 수행한다고 생각해 보자. 분류 의 원칙을 설정하는 문제를 이러한 가정을 통하여 아래에 서술되는 논리로 설명한다는 것은 전문적인 분류학자의 입장에서 보아 매우 우스꽝스러운 일이다. 이미 분류학 입문을 숙지한 독자들은 훨씬 깊이 있는 토론을 기대하며 이 장을 대할 것이기 때문이다. 그러나 만의 하나라도 생물학 이의 분야의 독자가 수리분류의 방법론만을 이해하기 위하여 이 책을 읽게 될 것이라고 가정한다면, 아래의 예 가 나름대로의 도움을 줄 것이라고 판단되어 참시 분류 원칙의 설 정의 어려운 점을 쉽게 예시하고자 한다. 분류학자의 입장에서 가 지는 분류군 또는 종의 개념을 일단 벗어나서 단순한 분류의 작업 에 주안점을 두어 위에 기술한 가정으로부터 출발해 보자. 그러면 우선 우리는 현존하는 모든 생물 개체 각각을 하나의 단 위로 보고 이에 어떤 이름을 주고 다른 생물 개체와 구별하고자 할 수도 있다 (이러한 가정 자체도 생물학의 한 분과인 분류학의 입장 에서 보면 틀린 가정이다. 분류의 대상은 개체가 아니라 개체군이 라고 말해지고 있다). 예를 들면 우리 인간 사회는 각 개인에게 이 롬이 붙여졌고 이에 따라 각 개인이 구별된다. 그러나 지구상에 서 식하는 생물 개체 모두에게 이름이 주어지는 것은 도저히 불가능한 일이다. 그러므로 우리는 각 개체를 합칠 수 있는 어떤 기본 단위 룰 생각해내는 것이 편리하다는 생각에 이룰 수 있다. 죽 각 개체 롤 어떤 단위로 묶고 단순히 이렇게 묶여전 단위들을 구별하도록 제한할 수 있다. 이때 어떤 방법에 의해서 또는 무엇을 기준으로 하여 단위의 한계를 설정하는가가 매우 중요한 문제가 된다. 왜냐 하면 단위의 기준에 의해 이 단위에 속하는 개체의 범위나 개체의 . 특칭이 달라지기 때문이다. 바로 이러한 단위의 범위에 대한 기준
문제가 분류를 시행하는데 선결되어야 할 가장 기본적인 문제이며 분류의 원칙은 바로 이 문제로부터 출발한다고 하겠다. 이러한 문제점을 소개하는 의미에서 실제로 생물학에서 기본 단 위로 설정된 종( 種 , s p e ci es) 을 대상으로 분류 원칙 설정의 구체적 문제점을 생각해 보자. 생물학에서 일단 종이라고 칭한 이 기본 단 위를 우리가 수긍한다면 기본 단위의 설정 문제란 바로 종의 한계 성을 긋고 개념을 설정하는 일로서 표현되어질 수 있다(후술되는 종의 개념 제 3.2 장 참조 바람). 여기에서 아주 간략히 종의 한계성에 대하여 살펴보자. 한계성이 란 어떠한 특칭을 소유한 개체 까지를 하나의 기본 단위인 종의 범 주에 넣는가의 문제이다. 일단 우리가 종이란 무엇인가를 정의한 상태는 아니지만, 흔히 받아들여지고 있는 〈생식이 가능한 개체의 무리〉 라고 가정해 보자. 그러면 현존하는 개체끼리 생식이 가능했 던 개체는 시간을 거슬러울라가 어느 정도 이전 시기까지는 이들의 선조도 계속 생식이 가능하였었다고 가정할 수 있다. 죽 현재부터 종의 분화가 일어났던 시기까지 생식이 가능했던 것만은 틀림 없는 사실이다. 그러나 우리는 이 시기가 언제인지를 전혀 알 수가 없 다. 우리가 이 시기를 알 수 있는 방법이란 타임 머신을 타고 시간 을 거꾸로 울라가 그 해당 시기에 다시 살아야 하는 것 이의에는 더이상 좋은 방법이 없을 것이다. 그러나 이러한 방법이 불가능 하 므로, 만일 위의 종에 대한 정의(생식이 가능한 개체군)를 받아 들 이면서 이 정의대로 종의 한계를 설정하려 한다면, 바로 이 시간을 유추하고 이 시간에 어떤 종이 갈라져나왔는지를 상상하는 수 밖에 없다. 죽 어떤 절대적 사실이 있음에도 불구하고 이를 알지 못한 채 이 절대적 사실을 유추하는 과정만이 있을 뿐이다. 바로 이 문 제로부터 많은 학자의 의견 충돌이 시작되고 있다. 만일 위에서 제 시한 원칙에 의해 종을 분리 (분류학자들의 표현을 빌면, 종을 분리 해내는 것이 아니고 실존하는 종을 증명한다고 말하고 있으나, 이 러한 문제는 제 4 장에서 다시 다루기로 하고)해내는 것이 가능하고 또 이 원칙에 의해 생물의 족보(이를 계통이라 표현함)를 구성할 수 있다면 분류학은 아마 논쟁이 없는 아주 단순한 학문으로 전락 했을지도 모른다.
이제 위에 서술한 간단한 예에서 벗어나 생물학자이면서 동시에 분류학자인 입장에서 수리분류학을 설명하기 위한 전 단계로, 종이 무엇인가에 대한 여러 의견을 검토하고 수리분류학에서의 방법론들 이 어떤 이론적 근거에서 종의 개념에 상반됨이 없이 종의 존재를 인식하고자 하는가 하는 문제를 취급하려 한다. 물론 종 사이의 유 연 관계가 수리분류학적 과정을 통해 증명된 종에 의해 어떻게 설 정되어지는가도 이 책의 후반부에서 논의될 것이다. 그러면 근본적 인 문제로 돌아가 종이란 무엇인가에 대하여 구체적으로 생각해 보 자. 3.2 종 앞에서 종이란 무엇인가에 대한 간단한 소개를 이미 한 셈이 되 어 버렸다. 종이 간단히 소개된 이유는 분류학에서 해결하고자 하 는 문제가 무엇이며 이 문제를 해결하는 데 어떠한 어려운 점이 있 는 가를 설명하는 과정에서, 종의 한계성을 설정하지 않은 채 분류 학의 문제를 설명하는 것이 불가능하기 때문에 일어난 어쩔 수 없 는 결과에 불과하다. 분류학의 역사를 기술하면서 가졌던 분류군의 개념과도 어느 정도 중복되고 있기는 하나 종의 개념에 대한 좀더 명확한 소견들을 아래에서 소개하고자 한다. 종이란 무엇인가에 대한 해답은 많은 사람들에 의해 시도되어 왔 고 현재에 있어서도 그 논란은 계속되고 있다. 앞 장에서 예시한 바와 갇이 우리는 일상생활에서조차 눈에 뜨이는 생물을 식별하고 종류별로 구별하는 자연 발생적인 생물의 분류 행위를 하며, 이를 통하여 생물 집단의 단위를 인식하고 있다. 생물의 자연집단을 아 리스토텔레스는 이데아론에 입각한 필수 요건 (essence) 을 공유하고 있는 자연의 집단이라는 관점에서 보았다. 아리스토텔레스의 사상 은 린네까지 이어져 린네 역시 종의 본성이 중요하다고 보았으며 이 본성 에 의 해 종 간에 나타나는 차이 (種差, dif fere nt ia) 에 의 해 종을 분류하고자 하였다. 그러나 종은 이러한 본성 이의에도 종의
구성원 중 특정한 개체만이 지니는, 종의 본성이라고 생각될 수 없 는 우연성 (1 맵然性, ac ci den t)을 지니고 있다. 린네를 포함한 이러 한 초기 분류 학자들의 개념은 분류의 계충구조를 구성하는 문제에 접근할 때는 타당하다고 인정되나, 전화적 개념의 우연성을 무시하 였으므로 오늘날에 와서는 그 정당성이 희박하게 되었다. 다윈에 의해 전화론이 정립된 이후 다윈 자신이 암시한 진화적 실체로서의 종의 개념이 분류학적 원리에 적용되기 시작하였고, 멘 델에 의한 유전 이론이 알려지면서 오늘날에 와서는 종의 개념이 생물학적, 전화적 개념의 두 가지로 압축되었다. 따라서 필자는 생 물학적, 진화적 개념을 내포하는 종의 실체를 설명함으로써 종의 개념에 좀 더 접근해 보고자 한다. 물론 우리가 종이라 하면 진화 적 단위가 되는 개체들의 자연적인 무리인 생물학적, 전화적 개념 의 종 이의에 단순한 하나의 분류 단위로서 린네의 생물계 계층구 조에서 나타나는, 분류적 범주로서의 종을 생각할 수도 있다. 그러 나 분류적 범주로 설정된 종 역시 오늘날에 와서는 전화적 실체로 서의 종에서 출발한 것으로 해석되야만 하므로 이러한 의미에서의 생물학적, 진화적 종의 개념을 살펴보고자 하는 것이다. 생물학적 종의 개념이란 어떤 것인가? 이는 앞에서 소개했던 (제 21 쪽, 25 쪽)바와 같이 일종의 〈서로 생식이 가능한 개체의 무 리〉라고 볼 수 있으며 이에 대한 정의로 가장 많이 인용되고 있는 것이 May r 등 (1953, 제 25 쪽)의 정의이다. -〈다른 무리와는 생 식적으로 고립되어 있는 생식이 서로 가능한 자연 개체군(gr oup s of actu a lly int e r breedin g natu r al po p u lati on s whic h are re- pro ducti ve ly iso late d from oth e r such grou p s) >- 위의 정의에서 알 수 있듯이 생물학적 종의 개념이란 일종의 유 전적 개념이다. 이 정의에 의하면 종이 개념상으로 매우 명확하게 드러나며 또한 현재에 생존하는 생물에 적용하기에 매우 적합한 듯 이 보인다. 그럼에도 불구하고 이러한 종의 개념을 적용하여 실제 화하는 데는 몇 가지 제약이 따른다. 예를 들면 〈생식이 서로 가능 한〉이라고 쉽게 표현되어 있긴 하지만 우리가 대상으로 하는 개체 들이 서로 생식이 가능한가를 관찰하는 데는 어려움이 있다. 뿐만 아니라 앞에서도 기술한 바와 같이 과거의 종에 있어서는 이러한
생식 능력을 검토할 수가 없다. 또 경우에 따라서는 서로 생식을 통하지 않고도 단일 모체에서 단순한 과정을 거쳐 후손이 형성되기 도 한다. 그러므로 반드시 생식이 기초가 된다고 주장하기 어려운 경우들이 있게 된다. 이러한 예의에도 불구하고 생물학적 종의 개 념은 생물의 본질에 대한 원칙적인 것들을 고수하고 있어 종이라는 단위의 근원을 이룬다고 볼 수 있다. 이러한 생물학적 종의 개념에 진화적 개념이 추가됩으로써 종이란 이러 이러한 것이다 라는데 대 한 원칙이 세워진다고 하겠다. 종의 진화적 개념은 어떤 것인가 ? S i m p son(l961) 은 이룰 다음 과 같이 정의하고 있다. 〈전화적 종이란 다른 가계 (家系, line ag e ) 와는 독립적으로 전화되고 자기 자신의 가계 내에서는 자기 고유의 단일한 진화적 역할과 경향을 보이는 하나의 가계(조상과 후손의 연 속 적 인 개 체 군) 이 다 (an evoluti on ary spe ci es is a line age (an ancestr a l-descendant seq u ence of po p u lati on s) evolvin g sep e rate l y from oth e rs wi th its own unit ar y evoluti on ary role and ten den- cies )>. 진화적 종에서 강조되고 있는 것은 바로 가계라는 것이다. 하나의 가계는 고유하게 다른 가계와 구별되는 선조-후손 간의 동 질성을 가지며, 같은 진화적 경로를 따라 발달하여 온 동일한 역사 성을 지니고 있다. 가계의 개념은 종의 생물학적 개념과 어쩔 수 없이 일치될 뿐 아 니라 (서로 생식이 가능해야 하므로) 시간적 의미의 변화까지를 포 함하게 된다. 따라서 전화적 개념의 종이란 유성생식을 하는 개체 들의 집단이 종의 어떤 덩어리를 만든다는 사실을 인정하면서, 동 시에 생물학적 종의 개념에서 문제가 되고 있는 점들까지롤 포함하 여 해결하고자 설정된, 어떤 혈통이라는 측면에서 출발한 개념이라 할 수 있다. 물론 진화적 종의 개념이 종의 모든 문제를 해결해 주 고 있는 것은 아니다. 진화적 종의 개념에서 어려운 점 중의 하나 는 〈전화적 역할〉에 대한 것이 구체적으로 어떤 대상 종에서 어떤 상태로 나타나고 있는가를 판단하는 일이다. 물론 이는 현생종에서 큰 문제가 되지 않는다. 왜냐하면 많은 생태학자들은 어떤 종이 그 들의 생태적 지위 내에서 다른 종과 뚜렷이 분리되고 있는지를 알 고 있기 때문이다. 그러나 고생물 종에 있어서는 이런 구별이 어렵
다. 진화적 역할은 형태적 차 이에서 약간씩 유 추 될 뿐이다. 또한 선조-후손 간의 동질성이란 문제도 관점에 따라 차이가 있을 수 있 어 어려움을 더해 준다. 그러나 현재까지 많은 사람들에 의해 역사 적으로 논의됐던 종에 대한 견해들은 생물학적, 전화적 종의 관점 에서 이해될 수 있고 이 둘의 개념을 종합함으로써 종의 구체적인 모습에 좀더 접근할 수 있으리라 생각한다. 위에 열거한 종의 개념을 근간으로 우리는 이제 종이 단순히 어 떤 자연의 편리롤 위한 단위가 아님을 상상할 수 있다. 종의 분화 역시 인위적인 것이 아님도 명백하다. 종이란 자연에 실재하는 단 위이며 생물계 내의 자연적 단위로서 객관적으로 연구되어질 수 있 는 것이다. 종은 어떤 특성을 지니며 하나의 개체처럼 존재한다고 도 생각할 수 있다. 종이란 진화의 단위가 되는 개체들의 자연적인 집단이고 따라서 분류적 단위보다는 진화적 실체로서의 종이 우선 해야 한다. 그렇다고 분류학자들의 역할이 경시되어도 좋다는 것은 아니다. 자연에 질서가 있음은 틀림없고 이 질서는 어떤 기작에 의 해 운영되므로 우리는 이 과정을 이해하려 노력하고 있는 것이다. S i m p son(1961) 은 자연의 질서와 분류학을 대비시켜 〈과학의 기 본 공리는 자연 자체가 질서를 가전다는 사실이다. 분류학의 목적 은 과학의 다른 분야와 마찬가지로 과학의 질서를 자연의 질서에 근접시키고 또 적합한 방법을 통하여 자연의 질서에 대웅시켜 보는 일 이 다 (The most basic pos tu l ate of sci en ce is tha t natu r e itse lf is orderly. In tax onomy as in oth e r scie n ces the aim is th at the orderi ng of sci en ce shall be app ro xim ate or in some esti m able way refl ec t the order of natu r e)> 라 고까지 표현하고 있다. 전화론자는 바로 이 자연적 질서가 선조로부터 파생된 것이라고 믿는 것이며, 따라서 분류학자는 진화론의 이론으로부터 선조의 형이 어떤 것인 지 후손의 형이 어떤 것인지를 구별해내기도 하고 후손의 변형된 형태로 부터 진화의 기작을 유추하는데 공헌하고자 노력하기도 한 다.
3.3 종분화 종의 개념이 종차(種 差 )에 의한 수평적 개념에서 선조 후손의 수 칙적 개념으로 바뀌고 연역적 (a pr io r i) 규정에서 귀납적 (a po ste r - ior i) , 경험적 실체로 정립되면서 Huxle y (1940) 의 〈신 분류학 (New S y s t ema tic s) 〉에 의해 근대 분류학의 이론이 확립되었다. 따 라서 분류학적 방법 자체도 고전적 방법에서 탈피하여 세포학적, 생화학적, 유전학적 방법들이 도입되기 시작하였고, 특히 멘델의 영향으로 분류적 단위가 개체가 아닌 개체군으로 정의된 이래 여기 에 생물학적 종의 개념이 추가되기 시작하였다. 다윈의 진화 개념 이 개체였음에도 불구하고 유전학적 공헌에 힘 입어 개체군이 변화 해 감이 분명해졌고, 따라서 이 변화 자체가 개체군의 본성으로 취 급되었다. 그러므로 변화하는 본성을 이해하는 것이 개체군의 본질 을 이해하는 것으로 간주되어, 종의 인식은 고전적인 정적표본(標 本, sp e c im en) 을 통해 서 가 아니 라 시 간에 따라 변화하는 동적 본 질을 파악함에 의해서 이루어지기 시작하였다. 생태적 격리에 의해 변화하는 〈개체군의 기본적인 진화 단위〉를 종으로 간주하였으며, 종은 고대의 관념적 개념으로부터 구체적 실체로 이해되기 시작하 였다. 분류작업은 따라서 개체를 통하여 종을 인식하고 종 상호칸 의 연관성으로부터 체계를 인식하는 행위가 되었다. 이러한 의미에 서 종의 분화 또는 종의 형성에 대한 현재까지의 지식이 어떠한 과 정을 거쳐 정립되었는지 살펴보고자 한다. 이미 라마르크 (1744-1829) 는 진화적 개념을 도입하여 현재 이 시 간의 종을 흐르는 강물의 한 단면으로 표현하기도 하였다. 그러나 이러한 종의 변화가 단순한 생물의 적응으로만 보았지 생물의 가장 중요한 생식의 관점에서 좀더 구체적인 지식을 제공하지는 못하였 다. 라마르크는 생물의 적응 능력에 대한 형성 과정을 생물 자체에 내적으로 존재하는 방향성 있는 변화가 적응의 방향으로 진행된다 고 보았다. 특히 주위환경은 이런 방향을 유도하는 데 중요한 역할
을 하며 따라서 어떤 동물의 기관은 이룰 사용하는 빈도수에 따라 이들의 구조가 더 견고해 지거나 약해전다고 생각하였고 이렇게 생 물의 생존 기간 중 형성된 형질은 후손에 유전적으로 남겨 지고 몇 세대를 거치면서 좀더 적합한 적응을 하는 데 도움을 준다고 보았 다. 죽 라마르크는 후천적으로 환경에 적응하여 형성된 형질아 유 전되며 이에 의해 세대가 지날수록 점점 그 환경에 적응된 생물이 형성된다고 믿었던 것이다. 오늘날 우리는 실제로 환경의 여러 요인이 생물의 형질에 영향을 주고 이에 따라 생물의 형질에 어떤 수정이 가해짐을 알고 있다. 고산지대에 살고 있는 젖먹이 동물이나 인간은 이들의 적혈구 수나 적혈구 내 헤모그로빈양이 많으며 고산지대에 사는 식물은 자의선 의 영 향으로 크기가 작고 견고하다. 또 운동을 많이 하는 사람은 독특한 근육이 발달하기도 한다. 그러나 문제는 이렇게 후천적으로 형성된 형질이 유전될 수는 없다는 것이다. 이들은 각 개체가 일시 적인 적응을 일으칸 것일 뿐이다. 다시 말하면, 이들의 표현형(表 現型 p heno typ e) 만 어떤 변형이 일어났을 뿐 유전형 (遠傳型, g eno typ e) 은 변화하지 않았다. 그러나 진화란 세대가 지나면서 변 화 속에서 형성되는 것이고 순전히 유전적인 기작에 의해서만 가능 하다. 생물의 본질은 생식에 있고 이러한 생식을 통하여 모든 것은 후손에 전달되고 있음을 우리는 다시 한 번 상기해야만 한다. 따라 서 라마르크의 주장은 종의 변천 과정과는 상관이 없는 것이라 할 수 있다. 다윈 (1809-1882) 은 라마르크보다 약 50 년 후에 생물의 적응 문제 를 다시 한 번 논의하였다. 이 문제에 대한 다윈의 해답은 자연선 랙 ( 自 然選擇, natu r al selecti on ) 설 이 다. 그는 두 가지 가정으로부 터 이 문제의 해답을 구하고자 시도하였다. l. 생물의 각 개체가 모두 완전히 동일하지는 않다. 이들은 서로 약간씩의 변이를 보인다. 진화에서 중요한 역할을 하는 것은 유전적인 상이함이다. 2. 모든 생물은 후손이 잉여 생산되고 있다. 죽 서로 다른 성을 가진 두 개체가 두 개 보다 훨씬더 많은 수의 후손을 생산한
다. 따라서 비교적 높은 사망율이 존재해야만 한다. 왜냐하면 대부분의 경우 어떤 종의 개체군 크기는 여러 세대를 지나면서 일정한 수준에 머물러 있기 때문이다. 다윈에 의하면 생존 경쟁을 통하여 여러 변이 중 가장 적합한 것 만이 살아남을 수 있다는 것이다. 자연선택의 과정을 통하여 세대 를 거치면서 환경에 대응하는 적응의 양상이 나타난다고 보았다. 물론 최근 굴드 갇은 생물학자는 종의 변화가 다윈이 주장하는 것 처럼 서서히 연속적으로 일어나지 않고 급작스럽게 불연속적으로 일어난다고 주장하고 있으나 다윈의 학설은 근본적으로 옳은 것으 로 받아들여지고 있다. 특히 다윈 시대에는 잘 알려지지 않았던 유 전적 사실이 밝혀지면서 이 학설은 더욱 신빙성을 갖게 되었다. 그 러면 이제부터 종의 분화가 어떤 과정을 통하여 이루어지는가를 다 윈의 자연선택설에 입각하여 설명한 예들을 참시 소개해 보자. 종이 실재하며 진화적 실체로서 존재함을 이제 간과할 수는 없 다. 오랜 지구 역사를 통하여 생물은 계속 진화해 왔고, 이러한 진 화과정 중에서 종은 적당한 환경이 아닐 경우, 소멸되기도 했고 자 신의 생물학적 특성을 바꾸어 적응해 나가기도 했으며 또 환경의 차아에 의해 분화가 일어나기도 하였다. 종의 이러한 변화 과정은 크게 두 가지로 설명될 수 있다. 첫째는 역사적인 종의 변화로 세 대가 지나면서 진화에 영향을 주는 변이나 자연선택에 의해 서서히 생물학적 형질이 변하여 아주 오랜 시간이 지나면 한 개의 종이 완 전히 다른 종으로 변하는 결과를 가져오는 경우이다. 이를 이시기 종 형 성 (異時期 種 形成, allochronic spe c i es for mati on ) 이 라 하며 이렇게하여 형성된 종은 이시기종(異時期種, allochronic spe cie s ) 또는 천 이 종 (遷移種, successio n al !,pe ci es ) 이 라고 한다. 이 러 한 종 의 형성 과정은 시간에 따른 종의 변화에 의한 것으로 Mayr (1963) 는 이룰 다음과 같이 기술하고 있다. -〈예를 들면 어떤 섬의 고립된 개체군은 시간이 경과함에 따라 종 a 에서, 분지점이 없이 b, C 를 거쳐 士로 변해질 수 있다 (an iso ~ate d po pu lati on on an isl and, for ins ta n ce, mi gh t chang e in the course of time from spe c i es a thr oug h b and c into spe ci es d wi tho ut ever sp litting ) >
―이러한 의미에서 Ma y r 는 이시기 종형성을 계통적 종분화(系 統的 種分化, ph y le ti c sp e ci at i on ) 라고 지 칭 하였 다. 계 통적 종분화 의 경우는 시간이 지난다 하여도 종의 수가 증가하지 않으며 또한 각 개체는 그들이 살고 있던 시간의 차이로 인해 옛 종과 현재 종 이 서로 생식을 할 수 없는 상황에 놓이게 된다. 계통적 종분화에 의해 형성된 계통종은, 이종을 대상으로 종의 개념을 생물학적으로 정확히 적용시켜 종 사이의 생식이 가능한 지 롤 검토하는 데는 어려움이 있다. 뿐만 아니라, 지질학적 연대에 따른 화석이 아주 충분하여 종의 변화 과정을 상세히 관찰할 수 있 울 경우라도 Ma y r 가 지적한 바와 갇이, 실제로 어디부터 어디까 지를 하나의 종 단위로 보는가가 다시 문제가 된다. W ile y ( 1981) 는 이러한 이유들과 그 밖에 자신이 제시한 몇몇 근거를 바탕으로 계통적 종분화 자체를 부정하고 있다. 그가 특히 강조한 것은 계통 적 종분화는 일반적인 진화 이론이나 종의 개념에서 보아 이를 받 아들이기 어렵다는 것이다. 예를 들면, 계통종의 인지는 어디까지 나 인위적으로 이루어지므로 계통종이란 일종의 인위적인 종이고, 따라서 계통종의 종분화 기작 역시 인위적으로 설정된 것으로 보았 다. 그러나 종의 분화란 자연적인 기작에만 의한 것이지 어떤 계통 학자가 마음속으로 상상하여 이렇게 인위적으로 설정될 수는 없다 고 그는 주장하였다. 물론 계통적 종분화 과정으로 간주되는 느리 고 꾸준한 종의 변화는 다윈 자신도 주장한 중요한 종의 형성 과정 이다. 그러나 W il e y는 다윈 역시 종을 우리 마음속에 존재하는 인 위적인 실체로 본 사람이라고 취급함으로써 계통종을 강력히 거부 하였다. 우리가 흔히 대하는 종의 분화를 도식화한, 여러 갈래로 갈라지 는 계통수는 위와는 다론 기작에 의해 형성되는데, 이룰 동시기 종 분화(同時期 種分化, syn c hronic s p e ci a ti on) 라 부른다. 이는 종의 시간에 따른 변화와는 다르게 한 개의 종이 두 개의 종으로 분화되 는 현상이며, 이때 분화되는 종들은 같은 시대에 사는 결과를 가져 오기 때문에 동시기 종분화라는 술어가 사용된다. W il e y (1981) 는 이를 첨가적 종분화(添加的種分化, addit ive s p e ci a ti on) 로 칭하기 도 하였다. 동시기 종분화는 오랜 세월이 흐르는 동안 종의 수를
계속 증가시켜 왔으며 또한 분화로 인하여 계통수의 가지가 형성되 고 오늘날의 세분화된 종의 분화를 가져오기도 하였다. 동시기 종분화는 여러 과정에 의해 일어난다. 첫째 서로 유전자 를 교환할 수 있는 종이 지리적인 고립에 의해 유전자를 교환하지 못하는 경우이다. 지리적 고립으로 분리된 개체들은 전체 유전자 풀에서 일부 유전자만을 소유하게 되고 이들 분리된 개체들이 오랜 연대를 거치면서 환경의 차이 때문에 다른 방향으로 변화해 나가게 된다. 이러한 기작에 의해 성립된 종의 분화를 타지역 종분화(他地 域 種分化, allop at r i c spe c i at i on ) 라 일컫는다. 타지역 종분화를 가능하게 하는 지리적 고립은 여러 원인에 의해 일어난다. 예를 들면 매우 높은 산이나, 사막 등에 의해 서로 떨어 진 지역, 또는 바다에 의해 고립된 섬 등에 어떤 생물이 우연에 의 해 도착하여 고립되는 경우가 있다. 또 지구 역사상 빙하가 형성되 거나 사막이 확장되는 등 여러 번의 기후 변화가 있어 왔는데, 이 때 어떤 개체군이 특정 지역으로 몰리는 현상이 일어나기도 하였 다. 예를 들면 풀라이스토세의 빙하기 동안 북유럽은 얼음에 덮이 게 되었고 이 지역에 살던 종들은 남동 내지 남서 지방의 중부 유 럽으로 고립되게 되었다. 아프리카 지방에서는 홍수기때 넓은 지역 이 홍수로 덮이고 몇몇 산 봉우리만 섬으로 남아 생물이 고립되는 현상도 일어났다. 또한 침강에 의한 육지의 하강으로 고립되기도 하였고 빙하기 이후 해수면의 상승 등으로 육지였던 부분이 물에 덮힘으로 여기에 살던 개체군이 고립되기도 하였다 (수마트라, 보 르네오, 쟈바 등의 섬은 플라이스토세의 빙하기 시대에는 육지로 연결되었던 곳 둘이다). 그러면 이러한 지리적 고립이 과연 종의 분화를 가져올 수 있을까? 각각의 개체군은 공동으로 유전자 풀을 소유하고 있다. 개체군의 어떤 부분이 고립되면 이 고립된 개체군은 전체 유전자 풀 중에 일 부만을 소유하게 된다. 고립된 부분 개체군은 따라서 돌연변이가 일어날 수 있는 조합을 모 개체군과는 다르게 가지게 된다. 이때 공간적으로 고립된 개체군은 모 개체군과 동일한 환경 조건에 산다 고 볼 수 없으므로 다른 환경에 처한 부분 개체군은 자연 선택의 기작이 그들이 처한 다른 환경 때문에 모 개체군과는 다른 방향으
로 진행 된다. 이러한 결과로 오랜 시간이 지난 후 서로 생식적으 로 격리되는 새로운 종이 형성된다고 하겠다. 지리적 고립에 의한 종의 형성 이의에 갇은 지역 내에서도 새로 운 종이 형성되는데, 이를 동일지역 종분화(同一地域 種分化, sy m p a tr i c sp e cia t i on ) 라 칭 한 다. 영 어 술 어 인 allop a tr i c , s y m p a t r ic이 동소(同所), 이소(異所)로 소개되고 있기는 하나 (예 를 들면 김 동 1982, 제 33 쪽) 어문각 편 국어대사전에는 이러한 합성어가 없다. 이 책에서는 가능한한 인위적인 합성어를 피하고 현재 우리말로 사용되는 단어 중 원어의 뜻을 가장 잘 나타내는 용 어롤 선택하는 것을 원칙으로 하였다. 따라서 동소 또는 이소의 술 어가 이미 분류학에서 사용되고는 있지만 이룰 동일지역, 타지역이 라는 술어로서 대치하며 또한 동일지역 종분화, 타지역 종분화의 술어를 사용하고자 한다. 동일지역 종분화의 과정은 유전 인자의 교환이 어느 특정한 기작에 의해 방해됨으로써 원래의 모 개체군과 는 다르게 되는 생식을 하게 되고, 이에 따라 새로운 종이 형성되 는 과정이다. 이러한 종 분화는 특히 동물보다는 식물의 종분화에 있어서 중요한 역할을 하고 있다. 예를 들면 식물은 어떤 종의 염 색체가 생식세포 형성 과정 중 정상적인 유사분열이 일어나지 않아 염색체가 반감하지 않은 채 분열되어 모 개체군으로부터 격리되는 현상을 보인다. Gran t (l963) 는 심지어 쌍자영식물이 43%, 단자영 식물이 58%, 전체 현화식물로 보면 47% 가 염색체의 배수화에 의 해 종이 분화되어 왔다고 주장하였다. 지금까지 종의 분화 과정을 간략히 살펴보았다. 종 분화의 기작 은 많은 저자들에 의해 요약되고 있으나 관심을 가전 독자는 우선 W il e y (1981) 를 참고하면 좀더 구체적인 지식을 얻을 수 있으리라 생각된다. 종이나 종의 분화 과정에 대한 지식은 분류학을 이해하 는데 반드시 필요하다. 분류학은 바로 종을 인지하고 종간의 유연 관계를 추적하는 학문이기 때문이다. 분류의 단위는 인위적인 것도 있고 자연적인 것도 있다. 이러한 분류단위로서의 종(種)이라는 단 위는 분류의 계층구조 내에서 어쩌면 인위적인 단위인 양 사용되면 서 동시에 가장 기본적인 자연적 단위로, 앞에서도 밝혔듯이 전화 적 실체로서 존재하고 있는 것이다. 따라서 분류학의 결과는 종분
화의 과정을 설명할 수 있어야 하며 분류학의 지식이 진화적 기작 울 설명하는 데 어떤 도움을 주어야 한다. 바꾸어 말하면, 비록 분 류학자가 분류학적 종을 취급한다고 하더라도 결국 종 분화라는 관 점에서 진화적 실체로서의 종의 개념을 정확히 이해한 후라야 분류 학적 작업을 수행할 수 있는 것이다. 분류의 원칙이란 결국 종을 인지하는 원칙이라 할 수 있고 종을 인지하는 원칙은 종간의 관계 에서 설정되며 종간의 관계는 종의 분화 과정에서 형성되었다 \고 생 각되므로 이러한 문제를 하나로 묶어 독립된 장으로 취급하였다. 이상으로 종의 문제를 정리하고, 제 4 장에서는 종보다는 좀더 포 괄적 의미로 사용되는 〈분류군〉에 대하여 알아보고자 한다. 종의 문제와 분류군의 문제는 그 본질적 속성이 서로 밀접한 관계를 가 지고 있어 이를 어떻게 기술적으로 분리 나열하며, 또 어떠한 순서 에 의해 기술할 것인가를 필자는 고심하였다. 이 책에서 종의 문제 를 일단 먼저 기술하게 된 이유는 분류의 대상이 되는 〈종〉이라는 실체를 먼저 설명하여 독자로 하여금 구체적 감각을 갖도록 하게 하기 위함이었다. 분류의 원칙이나 계통의 설정에 일반 단위가 되 는 분류군을 제 4 장에서 설명함으로써 분류에 관한 방법론적 이론 들을 종, 분류군, 분류군의 설정에 대한 이론의 순서로 연결시키고 자 한다. 분류군의 문제에 있어서도 역시 가장 중요한 것은 이 분 류군들이 단순히 인위적으로 편리에 의해 설정된 인위적 단위인가, 아니면 자연의 실체에 근접된 것인가 하는 문제이다. 이러한 의미 에서 자연분류군이란 술어가 분류학에서 사용되고 있다. 따라서 분 류군의 문제를 자연분류군과 연결시켜 자연분류군이란 무엇이며 자 연 분류군이 가지는 자연성의 의미가 무엇인가를 함께 논의하고자 한다.
제 4 장 분류군의 자연성 4.1 자연분류군 분류학의 원칙이 성립되고 이에 따라 분류되어진 결과들은 흔히 자연체계 (自然體系, natu r al s y s t em) 라는 말로 표현되며 자연체계 를 추구하는 분류를 자연분류 ( 自 然分類, natu r al classif ica ti on ) 라 한다. 그리고 어때 형성되는 분류군을 자연분류군(自然分類群, natu r al tax on) 이 라 부른다. 분류군이 란, 제 V 1. 1 장에 서 간략하게 소개한 바와 같이 계층구조적 분류 체계를 구성할 때 어느 수준에 서건 한 개의 단위로 인정될 수 있는 실제의 생물군이다. 그러나 자연체계, 자연분류, 자연분류군 등에서 문제가 되고 있는 것은 〈자연적 (自然的, na t ural) 〉이라는 용어이다. 따라서 자연적이라는 말이 어떤 의미에서 분류학에서 사용되는지 잠시 살펴보고자 한다. 자연적이라는 말은 일상 생활에서 매우 많이 쓰이는 말이다. 예 를 들면, 표정이 자연스럽다든가, 의상이 자연스럽게 어울린다든 가, 표현이 자연스럽다든가 등 좀더 어떤 〈이치에 맞으면〉 자연적 이라는 말을 사용하게 된다. 그러나 이때 자연적이라는 말을 정확 히 정의하기는 매우 어렵다. 이 말은 그저 매우 포괄적인 느낌을
갖게 할 뿐이다. 더구나 이 용어가 분류학이라는 특수한 분야에서 사용될 경우, 이것이 뜻하는 바가 무엇인가 를 이해하는 것은 쉬운 일이 아니다. 아주 오랜 동안 분류하는 일을 직업으로 삼고 있는 분류학자들은 직감적으로 느끼는 감각을 가질지 모르나 초보자는 어떤 의미에서 자연 분류군이라는 술어가 사용되는지를 이해하기 매우 어렵다. 분류학에서 자연적이라는 용어는 〈 인위적 〉 이 아니라는 의미로 주 로 사용된다고 믿어진다. 분류학에서 실제로 자연분류라는 술어를 정확히 정의한 학자는 많지 않다. 자연적이라는 말이 분류학자들에 게 사용될 경우는 이 언어의 모호성에 만족하면서 자신들의 분류가 자연적이라고 주장할 수 있고 따라서 자신들의 분류가 자연적임에 만족할 수 있기 때문일는지도 모른다. 어떻든 지난 수세기 동안 분 류는 자연적이어야 한다고 주장되어 왔으며 그들 자신의 분류 체계 가 최소한 , 원칙에 있어서는 자연적이라고 믿어 왔다. 그러나 자연 분류란 자연적이라는 술어가 의미하는 바와 같이 분류 그 자체가 인위적이 아니어야 한다는 뜻으로 해석할 수 있고 우리는 자연적 분류를 위하여 구체적인 자연적 특성이나 기준을 제시해야만 한다. S i m p son(1961) 은 〈 자연분류의 분류군들은 자연에 실제로 존재하 는 모든 생물군들과 어떤 관계를 가져야만 한다 (물론 이때 이 관 계가 모든 점에서 완전 일치할 필요는 없지만)〉고 말하는 동시에 이때의 어떤 관계를 전화적 관계로 해석하려 하였다. 죽 그는 주장 하기를 〈자연종 (na t ural s p e ci es) 이 존재하는 것은 틀림없다. 그러 나 문제는 왜 그들이 존재하느냐이고 이 질문에 해답을 주는 길은 어떤 분류군이 실제로 자연군과 상관성을 보이는가에 대한 기준을 제공하는 일이다〉라고 하였다. 이러한 질문을 유도한 가장 큰 이유 는 이때의 기준을 〈종은 그들이 전화했기 때문에 존재한다 {s p ec i es exis t because the y evolved) 〉는 그의 결론을 유도하기 위한 것으로 생각할 수 있다. 바로 아 점이 종의 존재에 대한 자연적 이유이며 따라서 이것이 분류의 자연적 기초를 이루어야 한다고 본 것이다. 죽 분류란 진화의 선을 따라 자연분류군을 찾는 일이고 이러한 방 식의 전화적 분류가 성취된다면, 이는 바로 자연분류의 관점에서 이루어 진 분류라고 S i m pson 은 주장하였다.
W il e y (1981) 는 자연분류 내지 자연분류군에 대한 역사적 개념을 고찰하고 현 시점에서 자연분류군의 정의를 나름대로 시도하였다. 그가 자연분류군의 개념을 구체화시키기 위하여 제시한 몇몇 역사 적 개념의 예를 들어 보자. 첫째는 아리스토텔레스적 자연성 (Aris t o t e l ean natu r alness) 이 다. 죽 분류군이 , 어 떤 필수요건 (必修 要件, essence) 을 소유하고 있으면 이룰 한 개 의 독립 된 분류군이 라고 하는, 다시 말하면 필수요건이 되는 형질을 소유하는 구성원 으로 이루어지는 분류군을 자연분류군으로 보는 견해이다. 둘째는, 위에서 언급된 S i m p son 의 주장에서도 잘 표현되어 있듯이 다윈 이 후 전통적으로 논의되어 온 전화적 관접에서 분류군을 고찰해야한 다는 계통적 자연성 (系統的 自然性, ph y lo g e neti c na t uralness) 이 다. 그러나 이러한 계통적 자연성을 구체적으로 어떻게 증명하는가 에 몇몇 방법론이 대두된다. 수리분류학자들은 그들의 정당성을 주 장하기 위하여 표현론적 자연성을 내세웠으며, 최근 대두된 분지론 자는 혈통(血統, g enealo gy)에 의거한 자연성을 주장하고 있다(표 현론이나 분지론에 대하여는 제 4.3.2 장 및 제 4.3.3 장에서 상세히 소개될 것아다). 아리스토텔레스적 자연성은 이제 그렇게 심각하게 받아들여지지 는 않는다. 논리학에 기초를 둔 필수형질이란 주로 생물의 전체 기 능을 지배하는 데 중요한 역할을 하는 형질을 말한다. 예를 들면 린네는 식물을 생식기관의 형태에 기초롤 두어 분류하고 있는데, 이는 생식기관이 바로 그 생물의 본질이며 그 생물을 영구히 존속 시키는 가장 중요한 요건, 죽 필수형질이라고 보았기 때문이다. 이 러한 필수형질의 개념은 계통적 자연성을 주장하는 학자들, 특히 분지론자에 의해서도 빈번히 이용되고 있다. 그러나 표현론적 자연 성을 강조하는 학자들에 의해서는 많은 반박을 받는다. Sokal 과 Snea t h 는 표현론을 주장한 대표적 인물이다. 이들은 논리학에 기 초를 둔 자연성 을 반박하는 이 론적 근거 를 Adanson, Jus sie n , de Candolle 등에서 찾고자 시도하고 있는 데 이는 바로 이들 학자둘 이 린네의 생식기관 갇은 필수 형질의 개념에서 벗어나 식물의 모 든 형질에 기초를 둔 분류를 시작하였기 때문이다. 수리분류학자들 은 일반적인 유사성, 죽 어떤 특별한 형질의 유사성이 아니라 모든
형질을 최대한 고려했울 때 얻게 되는 분류군 사이의 유사성으로 부터 자연성의 의미 를 찾으려 하였다. 그들은 일반적인 유사성 (이 를 전유사성이라고 표현함, 제 12 쪽 참조)을 분류군을 규정짓는 기 준으로 사용하고자 한 것이다. 현재까지 사용되어 오던 이러한 몇 가지 자연성에 기본적인 의미 를 부여하면서 W iley ( 1981) 자신은 다시 〈자연적〉이라는 용어 자체 가 가지는 의미로 되돌아가고 있다. 죽 그는 정의하기를 〈자연 분 류군은 자연에, 인간이 이를 이해하는 능력과는 독립되게, 존재하 는 분류군이 다 (a natu r al tax on is a tax on tha t exis t in natu r e ind ep en dent of man's abil ity to pe rceiv e it) 〉라고 하였 다. 이 러 한 정의는 자연적이라는 용어로서 〈인위적이 아닌 것〉이라는 개념을 근본적으로 나타내고자 한 것이며 또한 자연성을, 현상에서 어떻게 나타나전 〈자연에 내재 하는 질서〉를 인식 하고자 한 Simp son 의 의 미로 해석하고자 한 것이다. 자연의 질서라는 의미에서 W il e y는 또 몇 가지 해석을 곁들이고 있다. 죽 〈자연분류군이란 그들에 이 름을 주고 그들을 인식하는 분류학자가 있건 없건 존재한다. 그들 이 자연에 존재하기 때문에 발견되어져야 하며, 결코 인위적으로 창조되어질 수는 없다. 자연분류군은 자연적 과정에 의해 생겼으므 로 자연적 과정과 일치해야 한다〉는 등의 제한적 설명을 가하였다. 위에서 기술된 자연분류군에 대한 서술에서 우리가 느낄 수 있는 것은 분류학자들이 〈자연성〉에 대한 구체적 방향을 제시하면서도 (필수 형질, 표현적, 계통적 등의 술어를 사용하여) 동시에 이 말 이 가지는 포괄적인 의미를 배제하지 않은 채, 〈자연의 질서〉라는 의미를 내포하는 자연적이라는 의미를 자연성에 부여하고자 한 것 이다. 그러면 이제 수리분류학이 성립되기 위해서는 구체적으로 어 떠한 의미의 자연성이 찾아져야 하며 수리분류학을 뒷받침하는 이 론적 근거둘이 무엇인지 수리분류학자들의 입장에서 좀더 자세히 알아보기로 하자.
4.2 수리분류학의 입장에서 본 분류군의 자연성 수리분류학을 제창한 Sokal 과 Snea t h 는 자연성의 개념을 일반성 을 나타내는 넓은 의미에서 찾고자 하였다. 이들이 서술하고 있는 논리를 뒤쫓아서, 수리 분류학의 정당성을 뒷바침하려는 시도가 어 떻게 이루어지고 있나를 지금부터 살펴보려 한다. 이런 뜻에서 아 래의 내용은 Sokal 과 Sneath (1963, 1973) 를 대폭 참조하였다. 우리는 생물의 종류를 여러 방법에 의해 나눌 수 있으나 이러한 방법 중 생물을 나누려는 목적에 따라 그 목적에 부합되는 가장 적 당한 방법을 선택하여 생물울 나누게 된다. 생태학자들에 의한 1 차 생산자, 소비자 등의 분류는 어떤 생물의 생태적 역할에 의한 나눔 이 될 것이며 초식자, 육식자 등은 먹이의 종류에 의한 나눔이 될 것이다. 분류의 목적이 이렇게 생태적 관점에서 설정되어 목적 자 체가 생태라는 의미만으로 제한되면 이때의 분류는 〈인위분류〉라는 범주에 들어가게 된다. 자연분류는 이러한 인위분류라는 개념과는 반대 되 는 개 념 이 다. Snea t h 와 Sokal (l973) 은 자연분류를 정 의 하면 서 〈자연분류란 모든 과학자들에 의해 일반적으로 사용되어질 일반 적 배열〉임을 강조하였으며 〈일반적〉이란 술어로서 주관적 판단을 제의시키려 하였다. 이렇게 Snea t h 와 Sokal 이 일반적이라는 단어 에 의미를 부여한 것부터가 이미 수리분류학이라는 분야에 〈일반 성〉을 통하여 정당성을 부여하려고 한 시도로 볼 수 있다. 왜냐하 면 일반적이란, 많은 정보를 포함해야 하고 또 좀더 객관적이어야 한다는 조건을 만족해야만 사용할 수 있는 단어이기 때문이다. 분류학의 〈주관적〉 결점은 많은 학자들에 의해 지적되어 왔다. Danser(1950, S~ea t h 와 Sokal, 1973 에서 재인용)는 자연분류에 대 한 정확한 정의를 확실히 내리지는 않았지만 〈분류학은 언젠가 좀 더 정확한 단계에 이를 것이다, 그러나 이 사실이 우리가 과학적인 방식에서가 아닌 직관적인 방법으로 분류의 문제에 대처하고 있다 는 사실을 변경시키지는 않을 것이다〉고 함으로써 분류학의 객관적 방법의 어려움을 토로하였다. Sim p so n(1961) 역시 〈분류학사에서 보여지는 여러 이론적인 논의가 분류학의 주관적이고 개인적인 결
과에 대한 이론적 근거 를 제공하는 시도 〉 일 뿐이라고 하면서 분류 학이 가지는 주관성이, 배제하기 어려운 문제점임을 지적하고 있 다. 만일 자연과학의 방법론이 객관성에 기초하고 있다면 분류학이 가지는 주관성의 문제는 분류학자가 해결해야 할 중요과제 중의 하 나이다. 앞에서 지적한 바와 같이 분류학에서 린네 시대까지 쓰여진 방법 들은 아리스토텔레스의 논리학에 기초를 두고 있다. 이는 분류군의 실체 또는 필수요건 (essence) 을 찾고 이를 정의하는 데서부터 출발 한다. 필수요건이란, 결과가 필연적으로 나타나는 조건을 말한다. 예를 들면 평면상의 삼각형은 세 개 직선으로 연결되고 두 변의 길 이의 합이 다른 한 변의 길이보다 길다는 필수요건을 가전다. 분류 학에 도입된 이러한 아리스토텔레스의 논리학은 이렇게, 어떤 분류 군의 필수요건을 발견하고 이를 규정하도록 구성되었다. 그러나 분 류학에서는 필수요건을 기본으로 하는 아리스토텔레스의 논리학이 적용될 수 없음이 여러 학자들에 의해 보여지고 있다. 왜냐하면 분 류군은 자연성을 가져야 하기 때문이다. 〈인위분류군〉은 단순히 필 수요건 한 개의 성격에 의해서도 규정될 수 있지만 〈자연분류군〉에 서는 그럴 수가 없다. 따라서 아리스토텔레스의 논리학에서의 분류 적 필수 요건은 인위분류군을 도출하게 되므로 자연분류군을 정의 하는 데서 배제되어야만 한다고 주장되었다. 더우기 수리분류학의 입장에서는 어떤 필수요건만 가지고 〈일반적〉 또는 〈객관적〉이 되기 는 더욱 어렵다고 본 것이다. 이미 17 세기의 Bauhin 또는 18 세기 의 Mang o l 같은 학자는 비록 분류군을 규정짓는 성격을 명확하게 지적하지는 못하였지만, 최소한 자연분류군에 대한 올바론 생각을 가져야만 한다고 주장하였다. 이러한 논평이나 주장들은 자연분류 군에 대한 정확한 규정을 하기가 어려움을 나타내는 실제예가 될 수있다. 이러한 문제에 봉착하여 Beckner(1959) 는 자연분류군을 다형성 (多型性, p ol ytypi c) 이라는 개념을 이용하여 설명하고자 하였다. 다형성 또는 이와 반대되는 단형성 (單型性, mono typic)의 개념은 분류학에서 널리 사용되는 것으로 Snea t h(1962) 는 이를 다배열성 (多配列性, po lyt he ti c) 또는 단배 열성 (單配列性, monoth e ti c) 으로
사용하기 를 제안하였고, (이때 t he ti c 은 그리 스 어의 the to s ; arran g emen t에서 유래함) 이후 주로 이 용어가 사용되고 있다. Snea t h 와 Sokal 은 〈 단배 열군 (monoth e ti c gro up ) 이 란 이 군들이 확 실하고 명확한 무리들로 구성되어 있어 어떤 개체가 이 군과 단 일 개조의 공통되는 성질을 소유하기만 하여도 이 군 내의 구성원으로 규정 될 수 있다(t hey are for med by rig id and successiv e log ica l div i s i o n s so tha t the po ssessio n of a uniq u e set of fea tu r es is both suff icien t and necessary for membership in the gro up thu s defi ne d) > 고 하였다. 단배열군에 기초를 둔 분류군의 설정은 Snea t h 와 Sokal 이 지적 하고 있듯이 만일 우리가 자연분류군을 원할 경우, 분류에 오류를 범하게 한다. 만일 어느 개체가 자연분류군의 어떤 군을 형성하는 충분한 여러 분류적 형질을 소유한다 하여도 단배열군의 원칙에 의 해 분류군을 설정하면 이 개체가 단배열군에 사용된 형질을 소유하 고 있지 않을 경우는 이 분류군에서 제와되어 버리게 되기 때문이 다. 분류군의 설정에 사용된 형질이 가장 중요하고 명확한 것만 몇 개 선택되었을 경우, 자연계의 생물에는 바로 이 형질을 소유하지 못하는 예의가 있을 수 있다. 이때 예외적인 대상생물은, 비록 분 류군의 설정에 이용되지는 못했지만 기타 다른 생물둘이 가지는 많 은 형질을 소유함에도 불구하고 다른 분류군으로 규정될 수밖에 없 는 상황이 된다. 따라서 단배열의 원칙에 의해 분류군을 설정하는 것은 자연분류군에 접근하지 못하는 커다란 단점을 지니게 된다. 물론 단배열군의 원칙에 의한 분류는 분류군을 설정할 때 생물 분 류를 수월하게 이행하도록 하는 검색표의 작성이나 분류 계급의 설 정을 명확하게 하는 장점을 가지고는 있다. 다배열군의 원리는 단순히 하나의 형질(비록 이것이 매우 중요하 다 할지라도)에 기초를 두는 것이 아니라 되도록 많은 형질을 공동 으로 소유하는 개체들을 하나의 분류군으로 설정하는 것이다. Beckner(1959) 의 명확한 정의가 더욱 이 개념을 잘 나타내리라고 믿어 이 개념과 자연분류군의 개념을 여기서 잠시 비교하고자 한다 (Sokal 과 Sneath , 1963, 제 14 쪽에 인용되 어 있음) . 과(科, class) 란 이 과에 속하는 구성원이 되기 위한 필요, 충분
한 형질에 의해 규정된다. 예를 들면, 어떤 군(群) K 는 f1, f21 ° •••I f,1 •••1 f12 등의 형질조합인 G 로서 규정될 수 있다. 이때 다음과 같은 형질을 갖는 개체의 집합이 가정된다. 첫째, 각 개체가 형질 조합 G 내의 많은 형질을 소유하는 경우 둘째, 형질조합 G 내의 각 형질 f 1 가 많은 개체에 의해 소유되는 경우 세째, G 내의 어느 f 1 도 모든 개체에 의해 소유되지는 않는 경우 등이다. 이러한 여러 경우로부터 단배열군, 다배열군, 자연분류군 등의 관계를 살펴보자. Beckner 는 위의 예에서 첫째, 둘째 경우의 조건을 만족하면 다 배열성, 만일 세째 조건까지 만족하면 완전 다배열성이라 하였다. 이때 우리가 논의하는 자연분류군은 완전 다배열성이어야만 하지는 않는다. 다배열성이 되기 위하여는 첫째 조건뿐 아니라 둘째 조건 도 매우 중요하다. 예를 들어, 어떤 군 내의 한 개체가 많은 형질 을 소유하여도 각 개체가 가진 형질의 조합이 다르면, 어느 임의의 형질 f 1 가 많은 개체에 의해서 소유되지 못하므로 이를 다배열성이 라고 하기는 어렵다. 죽, 개체 l 은 a,b,c 개체 2 는 d_,e ,f 개체 3 은 g,h ,i 등의 형질을 소유한다면 각 개체가 형질조합 G(a,b,c,d,e,f,g ,h , i) 내의 많은 형질을 소유하는 부속조 (subse t)로서 이루어져 있기 는 하나 각 형질이 많은 개체에 의해 소유되고 있지 못하고 단순히 한 개체에 의해 소유되고 있으므로 다배열성이 아니다. 그러나 개 체 1 이 a,b,c, 개 체 2 가 b,c,d, 개 체 3 이 a,b,d 등을 소유한다면 각 형질이 많은 개체에 의해 소유되어 있으므로 다배열성이라 할 수 있다. 세째 경우의 조건 역시 중요하다. 둘째 경우의 조건에만 의 존한다면 f 1 가 많은 개체에 소유되어 결국은 대부분의 개체가 같은 형질을 소유하게 된다. 많은 개체가 같은 형질을 소유하게 되면 단 배열성이다. 세째 경우의 조건은 이러한 단배열성을 피하기 위한 조건이라 할 수 있다. 따라서 세 가지의 서로 상반되는 경우를 모 두 만족시키도록 조건을 제시함으로써 분류군의 설정도 가능하게 하고 동시에 단배열성이 되지 않도록 조철하여 다배열성의 특성을
나타낼 수 있다고 본다. Beckner 가 정의한 다배열군이 자연분류군과 언제나 일치하는가 에는 그러나 문제점이 있을 수 있다. 자연분류군에서는 어느 개체 가 소유한 한 형질이 그 개체가 속한 분류군 내의 다른 많은 수의 개체들에 의해 소유되지 못하는 경우가 흔히 있다. 또 분류군의 형 질이 우선 각 개체의 형질을 토대로 설정되는데 분류군을 설정하기 도 전에 어떤 형질이, 설정되어 있지도 않은 분류군의 많은 개체에 의해 소유되고 있는가를 판단하는 것은 어렵기 때문이다. 그럼에도 불구하고 다배열군은 이들이 보다 더 자연 분류군에 가깝고 따라서 많은 정보를 가지고 여러 목적에 유용하게 쓰일 수 있다고 강조되 어 왔다. Snea t h 와 Sokal 은 수리분류학의 출발점 을 다배 열군에 두었으며 다배열성 이론과 관계 있는 Adanson, Gil m our 등의 이론들을 소개 하여 수리 분류학의 정당성을 주장하였다. 18 세기 말 19 세기 초에 이미 Adanson 은 아리스토텔레스의 논리학적 귀결인, 분류에 있어 서의 서로 다른 여러 형질의 중요성에 대한 연역적인 판단(예를 둘 면, 적혈구를 가졌으므로 척추 동물이다)을 부정하고 자연 분류군 울 형질의 〈유사성〉에 기초를 두어 설정하고자 시도하였다. 죽 그 는 귀납적 분류에 준하여 모든 형질에 동일한 중요성을 부여한 후 (바로 이 점이 그 당시의 많은 학자에 의해 비난을 받았지만) 형질 의 유사성이라는 관점에서 최대 상관관계를 보이는 분류군을 찾고 자 하였다. 그러나 Snea t h 와 Sokal 은 Adanson 의 방법이 우수함에 도 불구하고 실제로는 실패한 것으로 보았다. 그 당시의 재료는 매 우 빈약하였고 또한 전자계산기가 없는 상황에서 이 유사성을 계산 하기 란 용이 한 일이 아니 었을지도 모른다. Condon 타~ Adanson 의 분류군이 그전에 행해졌던 것보다는 그래도 더 자연분류군에 가깝 다고 주장하였다. Snea t h 와 Sokal 이 수리분류학의 최초 기원을 Adanson 에서 찾고자 한 것도 바로 다배열성이 가지는 장점을 인 정하였기 때문이라 하겠다. 이러한 유사성과 관련하여 G il mour(1951) 는 분류군이 서로 더 많은 유사 형질을 소유할수록 (유사성의 비율이 클수록) 더 자연적 이라고 주장하였다. 뿐만 아니라 〈분류군을 설정할 때 가능한 많은
형질이 비교될수록 더욱 자연적이다 〉 라고 하였다 . G il mour 는 심지 어 분류의 일반성을 확장시켜, 생물 상호간의 관계도 여러 관점에 서 설정될 수 있으며 분류의 목적 자체도 여러 가지가 있을 수 있 음을 주장하였다. 분류의 기능도 분류군을 묶어 가는 일로써 이해 하려 하였으며, 어떠한 목적에 따라 분류군을 묶는가에 의해 분류 의 기본을 달리할 수 있다고까지 본 것이다. Sokal 과 Snea t h 는 G il mour 의 주장을 받아들여, 분류학이 너무 전화적 개념에 집착하 고 있음을 비판하면서 분류군의 설정에 관한 이상적 철대적 원칙이 하나밖에 없다고는 보지 않는다고 하였다. 따라서 수리분류학자들 이 주장한 자연 분류군이란 많은 형질을 비교하여 도출한 분류군이 며 분류군을 설정한 목적도 다양하다고 하겠다. 또 이러한 견해들 은 〈자연성은 일반성에 기초를 두어야 한다注근 그들의 주장을 유도 하는 과정으로 볼 수 있다. 죽 수리분류학자들은 자연분류군을 많 은 형질에서 상관성을 보이는 개체들의 묶음으로 보고 이때 분류군 의 설정에 사용되는 정보의 양을 많게 하여 일반성을 나타내고자 한것이다. 4.3 분류적 관계의 자연성 분류란 생물을 체계적으로 배열하는 작업이며 분류의 작업은 생 물과 생물 간의 관계에 기초를 두어 시행된다. 이때 분류의 시행에 있어서 나타나는 생물과 생물 간의 관계를 분류적 관계 (分類的 關 係, tax onomi c relati on ship ) 라 한다. 이 때 〈관계 〉라는 용어 자체 를 일상용어에서 쓰이는 관계라는 말과 비교하여 분류적 관계가 가지 는 의미를 유추해 볼 수도 있다. Snea t h 와 Sokal(1973) 은 관계에 대한 두 가지 의미를 인용하고 있는 바, 첫째는 〈관계되는 상태 (the sta t e of bein g relate d )> 죽 〈이미 성립된 또는 발견될 관계에 서 연 유 되 는 (connec ted by reason of an esta b li sh ed or dis c ov-erable rela ti on) 〉의 의미로서 우리가 일반적으로 〈관계〉라는 언어에 서 느끼 는 의 미 이 다. 둘째 는 kin s hip , consang uini t y, a ffi n ity로 일
종의 혈연관계이다. 이러한 뜻의 차이가 독일어에서는, 첫번째의 의 미 가 VerMltn i s 혹은 Bez i ehun g이 라는 단어 로 , 두번째 의 의 미 가 Verwandsha ft라는 단어로 표현되고 있음을 Snea t h 와 Sokal 은 소개하고 있다. 이 장에서 다루고자 하는 문제는 바로 이 관계가 분류적 관계일 경우, 이 관계가 어떠한 원칙에 근거를 두는가이다. 죽 분류의 근거, 원칙, 과정 모두에 연관되는 분류적 관계를 어떤 관점에서 보아야 하는가의 문제이다. 분류적 관계에 대한 원칙을 총괄적으로 표현하려면 자연성아라는 용어를 어쩔 수 없이 다시 사용해야만 한다. 분류적 관계는 분류군 의 자연성을 떠나서는 생각할 수가 없다. 생물군 간에 설정된 분류 적 관계는 따라서 분류군의 자연성을 가장 잘 나타내어야 한다. 이 제부터 자연성의 입장에서 보아 분류적 관계가 구체적으로 어떻게 표현되는지롤 종의 자연성 내지는 분류군의 자연성의 문제와 결부 시켜 살펴보고자 한다. 일반적으로 분류적 관계는, 계통적, 분지론적, 표현론적, 유전적 관계등을 모두 포괄적으로 나타내는 넓은 의미로 사용되기도 하고 이러한 관계 중 계통적 관계만을 나타내는 좁은 의미로 쓰이기도 한다 (분지론적 또는 또-현--론 적 관계라는 용어가 적당치는 않으나 우선 사용하고자 한다. 분지론 또는 표현론에서 주장되는 분류적 관계를 지칭하기 위함이다). 현재까지의 관습을 보면 그러나 첫번 째의 넓은 의미로 주로 쓰였으며 특히 이러한 넓은 의미 내에서도 계통적 관계가 강조되어 왔다고 하겠다. 따라서 계통적 관계란, 분 지론적, 표현론적, 유전적 관계 등과 대등한 입장이라고는 불 수 없다. 계통적 관계란, 어쩌면 종이나 분류군의 개념들에서 지금까 지 논의된 진화적 의미에서 해석되어야 하는, 따라서 분지론적, 표 현론적, 유전적 관계를 종합하는 관계로서 이해되어야 한다고 본 다. 분류적 관계를 논의하는 목적 자체가 〈분류군의 자연성〉에 가 까이 가기 위한 이론적 근거를 마련하는데 있으므로 분류적 관계는 분류군의 자연성을 가장 잘 나타내도록 설정되어야 함은 위에서도 언급한 바 있다. 이때 분류군의 자연성이란, 계통적 관점을 떠나서 는 생각할 수 없으므로 분류적 관계에 대한 관점에서 우위를 차지 하는 것은 계통적 관계라고밖에 볼 수 없다.
우리가 여기서 생각해야 할 문제는 그러면 계통적 관계를 어떻게 추적하는가이다. 이에 대한 구체적인 모든 방법을 제시하는 것은 그 양의 방대함이나 내용의 복잡함으로 인하여 일단은 불가능하다. 그러나 개략적으로 보면, 제 2 장 및 3 장에서 살펴본 전통 분류학이 나 그 밖에 최근 대두되고 있는 분지론, 또 이 책에서 설명하게 될 표현론적 분류까지도 모두 이 계통적 관계를 좀더 타당성 있게 증 명하고자 시도되는 방법들이라 할 수 있다. 수리분류학을 주창한 Sokal 과 Sneath 자신도 분지론적, 표현론적 관계를 모두 고려하여 이룰 계동적 관계로 하자고 제 의 하고 있으며 (Snea t h 와 Sokal, 1973, 제 30 쪽), 분지론자 역시 계통적 관계에 입각하여 논리를 전 개하고 있다. 분류적 관계가 이렇게 구체적으로는 계통적 관계로 나타내어짐이 타당하다고 할 때, 이러한 계통적 관계는 전통 분류 학에서 논의되는 분류적 관계나 최근 대두되고 있는 분지론, 표현 론에서의 분류적 관계들과 어떤 상관성을 가지는지 좀더 살펴보자. 4.3.1 전통 분류학에서의 분류적 관계 자연 분류군은 S i m p son 에 의해 기술된 바와 갇이 전화의 선을 따른 유연관계에 의해 분류군의 한계가 구체화되므로 자연성을 내 포하는 분류적 관계란 전통 분류학의 입장에서 보아 진화적 관계로 서 축소 해석될 수 있다. 진화적 관계와 앞장에서 논의한 계통적 관계는 완전히 동일한 의미로 사용된다고 말하기는 어렵다. 진화적 관계를 전화론에 입각한 자연분류군의 개념에서 설정된 관계라 한 다면 계통적 관계는 현대 분류학에서의 결과까지를 모두 포함하여 종합적으로 유도되는 넓은 의미에서의 관계를 나타내는 경우라 할 것이다. 전통 분류학의 입장에서 본 분류적 관계라 함은, 따라서 다윈의 진화론 이후로부터 표현론이나 분지론이 대두되기 전까지의 시대에 분류학자들이 가졌던 분류군 사이에 대한 관계를 지칭하고 자 한다. 아 시대까지의 분류적 관계에 대한 개념이 표현론 또는 분지론자를 포함하는 현대적 개념의 계통적 관계라는 관점에서 어 떻게 해석되고 있는지는 다음 장에서 논의될 것이다. 전통 분류학의 입장에서 본 분류적 관계는 계통적 관계라 할 수
있고 계통적 관계를 다시 구체적으로 표현한다면 진화적 관계라 할 수 있다. 전화적 관계란 제 3.2 장에서 살펴본 전통적 개념의 종의 문제와 상관성울 가지며 동시에 제 4.1 장에서 언급한, 자연분류군 의 전통적 개념인 진화적 관점에 의한 자연분류군의 문제와 연결된 다고 하겠다. 따라서 전통 분류학에서의 분류적 관계란, 다윈의 〈종의 기 원〉 출간 이 후 최 근의 Sim p so n, Ma y r 에 까지 이 르는 일 련 의 논의에서 취급되는, 분류군의 자연성을 진화적 실체로 인식하여 계통 체계를 수립하려 하는 관점에서 본 분류군 간의 관계를 일컫 는다. 분류군에 대한 이러한 진화적 관점은 다윈 이후 오늘날 까지 도 분류학의 기본 골격이 되고 있으며 따라서 전통분류학은 진화분 류학 (進化分類學, evoluti on ary tax onomy ) 으로 칭 해 지 기 까지 한 다. 전통적 범주 내에서의 분류학적 작업은 종의 의부 형태를 기재하 고 종의 생리적, 생태적, 유전적 특성을 조사하며 이러한 결과에 의해 현재까지 수립되어진 계통수 내에서의 위치를 선정하며 대상 분류군과의 관계를 논의하는 과정에 의해 수행되어 왔다. 형태를 기재하고 이를 비교하는 일은 전통분류학에서 매우 중요한 과정이 다. 따라서, 분류군 간의 형질의 유사성이 실제 분류를 행하는데 중요한 역할을 하게 된다. 경험적 분류학자로 널리 알려진 Cronq u is t (1968) 자산도 분류학을 이러한 관점에서 정의하였다고 여겨진다. 죽 그는 〈분류학은 생물의 닮음이나 다름의 전체성을 가 장 잘 반영할 수 있는 생물 분류의 체계를 수립하는 데 목적을 둔 학문 (a stu d y aim e d at pro duc ing a sys te m of classif ica ti on of orga nis m s whic h best refl ec ts the tot a l i ty of the ir sim ilar it ies and dif fere nces) 〉이 라고 기 술하였 다 (Cronq u is t , 1968, 제 3 쪽) . Cron qu i s t가 말한 〈닮음이나 다름의 전체성〉을 형태적 관점에서 해석할 것인가 아니면 어떤 종이 다른 종과 구별되게 하는 종의 동 일성 (the ide nti ty of the s p e ci es) 이라는 생물학적 종의 관점에서 볼 것인가는 좀더 논의되어야 할 사항이다. 그러나 분류학을 정의 함에 있어 닮음(유사성, s i m il ar ity)이라는 술어를 사용한 것은 전 통 분류학이 가지는 분류적 관계를 찰 나타낸 것이라 하겠다. 전통 분류학자들은 바로 닮음 또는 유사성을 분석하여 닮음이 진화에 의
한 결과라는 결론에 도달하였으며 따라서 분류적관계는 진화적 관 접에서 수립되어야 한다고 주장한 것이다. 분류학의 진화적 관점은 분류학의 어느 이론에서나 배제할 수 없 는 분류적 관계의 근간이다. 문제는 전통분류학이 분류군간에 내재 된 이러한 분류적 관계를 유추하는데 있어서 위에서 언급한 바와 같이 기재의 방법을 사용하고 있다는 것이다. 전통적으로 행해지던 기재에 의한 분류의 작업은 예를 들면 경험적 주관성을 배제하지 못한다는 공격을 받았고, 이러한 결접을 보충하고자 분류 작업의 객관성을 유지하려는 방법들이 대두되기 시작하였다. 이의 대표적 인 예가 표현론이다. 표현론은 닮음의 성격을 객관성에 의해 규정 하는 것으로부터 출발하기 때문이다. 물론 분지론의 경우처럼 계통 적 관계를 고수하는 데 일차적인 목표를 두고 방법론이 발달하기도 하였다. 우선 분지론의 입장부터 살펴보고 수리분류학자 또는 표현 론자로 불리어지는 분류학자의 의견을 들어 보자. 4.3.2 분지론과 분류적 관계의 자연성 분류적 관계는 계통적 관계를 근간으로 하며, 계통적 관계는 다 시 협의로 전화적 관계로 해석되어져야 한다는 의견을 받아들인다 면, 진화적 관계를 과연 어떤 방법에 의해 객관적으로 증명할 수 있는가의 문제가 대두됨은 당연하다. 이 문제에 대한 분지론, 표현 론 분류학자의 입장을 차례로 들어 보자. 〈분지론(分枝論)〉이란 술어는 영어권에서 사용되는 clad i s ti cs 를 번역 한 용어 이 다. clad i s tic s 는 그리 스어 의 Klados 로부터 유래 하는 데 , 새 싹을 나게 하다 (spr o ut) 는 뜻이 다. cladis t i c anal y s i s 는 분지 분석으로 이 책에서 번역하였다. clad i s tic s 를 〈분지학〉이라고 번역 할 경우, 학(學, lo g os) 이 가지는 넓은 범위 때문에 분류학의 한 분과인 분지론이 분류학과 대등한 입장에 놓이게 되는 위험성도 있 게 된다. 또 분지 대신에 분계 (分系)를 사용한 경우도 있으나(이, 1980, 제 5 쪽) 분계라는 단어가 합성어이기 때문에 국어사전에 소개 되고 있지도 못하고 동시에 우리가 일상 언어에서 가지는 감각도 살릴 수 없기 때문에 분계 대신에 분지라는 단어를 사용하였다. 이
병훈 교수는 〈 계통분류학의 현대적 조명 〉 이라는 제목을 가지고 개 최된 1985 년의 한국생물과학협회 학술회의에서 clad i s tic s 를 〈 분지 계통학〉으로 번역하여 소개한 바 있다. 물론 clad i s tics 의 실제 내 용이 분류군간의 〈 계통적〉 관계를 중점적으로 다루고 있긴 하나, 계통은 앞에서 지적한 바와 같이 분류학에 관계된 대부분의 이론에 서 공동으로 사용되는, 분류적 관계를 나타내는 기본 개념이므로 계통이라는 단어를 분지학의 경우에 특별히 삽입할 필요성은 철실 하지 않다고 생각한다. clad i s tic s 로 표현된 어원을 그대로 따르려 고 노력 하면서 , 동시 에 clad i s tic s 가 가전 본래 의 의 미 가 확대 해 석 되지 않음으로 해서 계통학 또는 분류학에서 가지는 정확한 위치를 판단하는 데 도움을 주도록 〈분지론〉이라는 용어를 제안하는 바이 다. 그러면 분지론을 주장하는 분지론자는 분류적 관계에 대한 자 연성을 어떠한 관점에서 주장하고 있는가 살펴보자. 분지론은 독일의 곤충학자인 W illi Henn ig에 의해서 분류군의 계통적 관계를 추구하는 구체적인 방법으로 제시되었다. 그는 이미 1950 년 에 『계 통 체 계 의 기 본 이 론 (Grundzil ge ein e r Theori e der Phy lo g e neti sc hen S y s t ema ti k) 』 이라는 책을 출간하였지만, 독일어 로 씌어전 책이었기 때문에 영어권의 나라에서 이 책의 중요성을 인식하지 못한 채 거의 10 년의 기간이 지나고 말았다. 실제로 Henn ig의 개념을 정확히 수용하기도 하고 이를 논박하기도 한 것 은 이 책이 『 계통체계학 (Ph y lo g ene tic S y s t ema tic s) 』 이라은 제목으 로 영어로 재 편집된 1966 년 이후이다. 이 책을 참고로 하여 W il e y (l981) 는 그의 저서 『계통학 (Ph y lo g ene ti cs) 』의 서론에서 분 류적 관계에 대한 Henn ig의 생각을 다섯 가지로 정리하고, 자기 스스로도 Henn ig의 기본 개념에 입각하여 그 책을 쓰고 있다고 토 로하고 있다. W il e y가 정 리 한 Henn ig의 생 각을 아래 에 잠시 기술 한다. 1) 현존하는 생물과 소멸한 생물을 서로 묶어 주는 관계는 혈통 (血統, ge nealog y) 관계 이 다. 2) 이러한 관계는 개체군 내의 개체들 사이에, 개체군들 사이에, 또 종과 종 사이에 존재한다.
3) 모든 다론 형태의 관계들은(예를 들면, 표현론적이라든가 유 전적이라든가) 선조-후손의 혈통관계에 기인하는 현상이며 따 라서 이러한 관계들은 혈통관계에 있는 후손의 변형 (진화로 표 현하기도 함)이라는 의미에서 이해될 수 있다. 4) 개체군이나 종간에 존재하는 혈통관계는 혈통관계가 기록된 바로 그 형질을 찾음으로써 발견될 수 있다. 5) 가장 일반적인 분류라면 바로 이 혈통관계를 정확하게 나타내 는 분류이다. 위에서와 같이 Henn ig는 근본적으로 혈통관계에 기초를 둔 분류 가 가장 일반적인 분류라고 주장하고 있다. Henn ig에 의해 주장된 이러한 혈통적 개념들은 이미 진화론 이후의 전통분류학에서 오랜 동안 존속해 왔었으나, Henn ig에 의해 최초로 혈통적 관계를 추구 하는 방법론이 구체적으로 제시되었으며 이 후 많은 학자들에 의해 받아들여졌다. 현재는 선조-후손의 관계를 추구하는데 전자 계산기 롤 이용한 수리적 방법까지 동원되어 (Farris, 1970) 분지론울 발전 시키고 있는 상황이다. Henn ig의 분지론 개념은 수리분류학자들 간에도 논의되기 시작 하여 Ca i n 과 Harris o n (1960) 은 분지 론적 관계 를 〈공동조상에 로의 근접성〉을 나타내는 관계로 표현하였으며 Snea t h 와 Soka1(1973) 은 분지론이란 〈일종의 진화의 경로를 추적하는 학문, 죽 얼마나 많은 계통적 분화가 일어났으며 어떤 분지가 다른 어떤 분지로부터 유래 되었고, 또 이들이 어떤 순서를 가지는가 하는 접을 강조하는 분 야〉라고 서술하였다. 죽 그들은 분리론적 관계를 〈선조-후손 관계 의 분 지 망 (a branchin g netw ork of ancesto r-descendant relati on - sh ip)〉이라고 기술한 바 있다. Ma y r 는 분지론이라는 술어 대신에 분지주의(分枝主義, clad i sm) 라는 술어를 사용하였고 이룰 〈순전히 공동 후손의 최근성에 의해 생물이 위치가 정해지고 분류되도록 하 는 분 류 이 론 (a tax onomi c the ory by whic h orga nis m s are· r an-ked and classif ied exclusiv e ly accordin g to recency of common descen t)〉이라고 논평하였다 (Ma y r 1969, 제 70 쪽). 정작 〈분지론〉 이라는 술어를 May r 자신이 사용한 것은 1982 년의 그의 저서 『생
물 사 상의 성 장 (The Growt h of Bio l og ica l Thoug h t) 』 에 서 였 다. 그는 분지론을 비평하는 입장에서 분지론을 소개하고 분지론에서의 분류적 관계에 대한 설명을 다음과 같이 첨부하고 있다 (Ma y r , 1982, 제 227 쪽). 〈분지론의 중요한 관점은 관계된 분류군을 비교 하는 데 있어, 형질을 분석하고 이 형질을 원시형질과 파생형질로 구분하는 일이다. 계통의 분지점은 파생형질을 추적하여 찾아낼 수 있다. 왜냐하면, 파생형질들은 이 형질을 소유했던 선조의 후손에 서만 발견된다고 믿어지기 때문이다.〉 그러나 실제 분지론의 주창 자인 Hennig , 또는 분지 론의 신봉자인 W iley , Farris 등에 의 해서 는 분지론의 정확한 정의나 분지론에서의 분류적 관점에 대해 명확 히 기술된 내용을 찾아보기 힘들다. W il e y (1981) 는 그의 저서 제 6 쪽에서 〈생물간의 혈통적 관계를 추적하고 이를 정확하게 반영하 는 분류를 수립하는 일〉을 〈계통체계학〉이라는 이름을 빌어 설명하 였고, 계통체계학의 이론과 실제를 계통학(t he the ory and pra c- tice of phy lo g e neti c sys te m ati cs is herein ter med ph y lo g e neti cs) 이 라고 정의하였다. 그러나 W il e y가 의미한 계통학은 어디까지나 분 지론에 근거한 계통학이기 때문에 분지론이 곧 계통학이라고 확대 해석한 예가 될 수 있다. 전통 분류학자의 범주에 속하는 S i m p son(1961) 은 분지론이라는 술어를 사용하고 있지는 않지만, 분지등급(分枝等級, clades) 이란 술어를 도입하여 이를 진화등급(進化等級, gr ades) 과 비교하였다. 그는 진화등급을 전화적 수준이 유사한 생물 집단으로 규정한 반 면, 분지등급을 유전적으로 공동기원을 갖는 생물의 집단이라는 뜻 으로 사용하였다. Hennig ( 1966) 등은 계통적 관계란 바로 분지론 적 관계를 지칭한다고 하였지만, Simp son (1 961) 이나 May r(1 965) 등은 위에서 서술한 분지론적 관계 및 표현론적 관계 모두를 함께 고려한 것이 계통적 관계라 하였다. 수리분류학의 창안자인 Snea t h 와 Sokal 은 계통적 관계를 사용되는 상황에 따라 그 의미가 협의로, 또는 광의로 쓰이고 있음을 지적하였다. 죽 계통적 관계에 대한 개념들을 명확히 나누어 쓸 필요가 있을 경우는 계통적, 분지 론적, 표현론적 관계를 구별하여 서술하여야 하나 계통적 관계를 일반적인 의미에서 광의로 사용할 경우는 분지론적, 표현론적 관계
등을 모두 포함하는 개념으로 이해하여야 한다고 보았다• 어떻든 계통적 관계에 대한 분지론의 입장은 많은 분류학자들에 게 그 중요성을 인정받기 시작하여 W i le y (l981) 는 이룰 근간으로 현재까지 분류학에서 사용되는 개념들을 그의 저서 〈계통학〉을 통 하여 다시 정리하고 있는 실정이며 또한 분지론적 접근이야말로 분 류군의 자연성에 가까이 가는 객관적인 방법이라고 주장한 바 있 다. 심지어 그는 분지론을 확대해석(?)하여 계통학으로 간주하고 분지론이라는 단어조차 거부하였다 (W il e y, 1981, 제 6 쪽). 죽, 분지 론이란 용어는 분지롤 강조하나 실제 분지론에서는 형질 진화를 취 급하고 형질 진화의 결과는 계통을 구성한다고 보아, 분지론에 상 응되는 말로 우리가 전통적으로 사용하는 계통학이라는 술어를 대 치하여 사용하고 있는 것이다. 그러나 앞에서 살펴 본 바와 갇이 분류학에 있어서의 계통학적 접근이 분지론을 중심으로 이루어져야 한다는 사실이 누구에게나 받아들여지고 있는 것은 아니다. 이제 분지론과 거의 동 시대에 출현한, 분류적 관계를 표현론적 관계에 서 보자는 수리분류학자의 변울 참시 들어 보자. 4.3.3 표현론과 분류적 관계의 자연성 Cain 과 Harr i son(1960) 은 표 현 론 적 관 계 (表 現 論 的關 係, ph eneti c rela ti onsh ip)를 〈어떤 특정 형질에 비중을 두지 않은 가 능한 모든 형질울 고려한 전유사성 (全類似性, overall sim i lar ity ) 에 의 한 배 열 (arrang e ment by overall sim i la ri ty, based on all avail ab le characte r s wi tho ut any weig h ti ng ) 〉이 라 정 의 한 바 있 다. 이때 가능한 모든 형질이란 조상과의 관계에서 나타나는 형질 뿐 아니라 현재의 대상 생물에서 발현되는 모든 형질을 가리킨다. Snea th와 Sokal 은 표현론적 관계를 〈대상 생물의 표현형적 특징의 한 조 (a set) 에 기 초를 둔 유사성 (ph eneti c relati on ship defi ne d as sim ilar ity (resemblance) based on a set of ph enoty pic characte r is- tics of the obje c ts or orga nis m s under stu d y ) 〉으로 유사성 에 주안 접을 두어 정의하고 있다. 분류군 간의 관계를 표현론적 입장에서 수행하는 분류의 행위는
실제에 있어서 우리가 전통적으로 행하는 분류의 작업 과정과 중복 되는 부분이 많이 있다. 만일 전통적인 방법에 의해 어떤 생물을 분류하고자 한다면 우선 이 생물을 대상으로 여러 가지 형질을 조 사하게 되고 이의 기준에 의하여 검색표를 작성하고 생물을 분류해 나가게 된다. 이때 조사할 형질을 선택하는 과정이나 형질을 조사 하는 과정은 전통 분류학에서와 다룰 바가 없다. 따라서 수리분류 학자들이 주장한 표현론 역시 새롭게 전개되는 분류학의 이론이라 기보다는 전통적으로 존재하던 분류학의 이론을 좀더 논리적으로 전개하여 이 논리에 따른 방법을 조직적으로 이용하고자 시도한 것 에 불과하다 하겠다. 그러나 표현론(表現論, ph eneti cs) 이 전통분 류학과 비교해 가지는 중요한 특징은 전통적 분류학에서 행해지는 것처럼 단순히 몇몇 형질의 유사성에 기초를 두는 것이 아니라 가 능한 한 모든 형질을 조사하고 이의 전유사성을 근간으로 분류의 원칙 을 삼아야 한다는 것이다. Sokal 과 Sneath 자신둘도 그러 나, 표현론적이라는 용어를 정확히 정의하고 있지는 않다. 아마도 〈걷 으로 나타나는〉 또는 〈표현되는, 식별이 용이한〉 형질들로, 대표적 인 예가 〈형태적 형질〉이 될 것이다. 이러한 형질의 종류에 대해서 는 제 5 장에서 좀더 구체적으로 다루겠다. 우리가 여기서 참시 살펴보아야 하는 것은 분류군 간의 이러한 표현론적 관계가 분류적 관계의 자연성을 어떤 관점에서 보완할 수 있는가 하는 문제이다. 분류적 관계에서 기본단위가 되는 종을 서 로 생식이 가능하고 선조 후손 간의 유연관계를 갖는 진화적 실체 라고 본다면, 이때 어떤 종에 속하는 개체들끼리의 현상적 발현은 유사할 수밖에 없다. 유전적으로 이어받은 유전 정보의 유사성이 바로 이러한 현상을 유도하기 때문이다. 현상적 발현이라는 의미에 서 Remane 등 (1978) 은 〈종이란 각 개체간의 특칭이 비슷하고 또 이들 개체들의 후손과도 유사한 특칭을 가지는 모든 개체들의 집합 체 (ein e Ar t ist die Gesamt he it all der lndiv i d u en, die in allen wesentl ich en Merkrnalen unte r ein a nder und rnit ihren Nachkorn- rpe n ti bere i ns ti rnrnen) 〉라고 정의하였다. 이는 바로 전화의 사실에 서 나타나는 생물의 여러 특칭까지도 결과론적으로 본 것이다. 형 질의 발현이 유사하게 나타난 것은 이들 생물의 생태적 지위가 유
사하여 종의 분화가 일어나는 과정에서 바슷한 유전적 성격을 갖게 되었기 때문이라고 할 수 있다. 결과적으로 보면, 생물의 성격 중 놀라운 것 중의 하나는 생물의 구조가 어디까지나 목적에 부합되도 록 설계되어 있다는, 다시 말하면 각 기관은 환경에 적응하도록 각 각 어떤 특징을 지닌다는 사실이다. 어느 형질이 유사하게 발현된다는 것은 생태적 지위가 유사하다 는 것을 시사한다. 생태적 지위가 유사함으로 인하여 이들 개체의 적응이 어느 한 방향으로 진행되고, 이의 결과로서 형질이 유사하 게 발현되었다고 볼 수 있기 때문이다. 이러한 유사성은 모체의 각 개체들 사이에서뿐만 아니라 모체와 후손간에도· 존재해야만 한다. 어떤 종에 속하는 각 개체는 서로가 생식을 통하여 유전자를 교환 하고 이룰 후손에 물려주고 있기 때문이다. 따라서 수리분류학자들 은 중간에 어떤 과정을 거쳤는지는 모르지만, 결과적으로 현재에 나타나는 형질의 발현을 기준으로 거꾸로 유추하면 종의 인식이나 • 진화의 경로를 추적하는 것이 가능하다는 사실로부터 그들의 이론 울 전개하고 있다. 그러면 구체적으로 수리분류학자의 변을 다시 둘어보자. Sokal 과 Snea t h(1963) 는 많은 분류학자들의 의견을 대변하여 〈우리는 분류에 계통학적 관점을 이용할 수가 없다. 왜냐하면, 계 통의 대부분이 현재까지 찰 알려지지 않았기 때문이다〉라고 서술하 고 있다. 죽 〈우리는 생물의 계통에서 극히 제한된 증거만을 화석 으로 가지고 있기 때문에 자연분류군을 계동에 기초를 두어 설명하 기는 매우 어렵다〉고 지적하였다. 계통적 관계란 무엇이며 언제 분 지가 시작되며 어떤 분지가 어디서 나왔는가, 또 전화는 이러한 선 에서 얼마나 빨리 진행되었는가 등의 질문에 해답을 주기는 매우 힘들다고 하였다. 우리는 단순히 몇 개의 분류군에 대해서만 고생 물학에 기초를 둔 계통의 정확한 양상을 알고 있을 따름이고 고생 물학 자체에서 조차 상상에 의해서 형성된 계통에 대한 결과들의 사실성은 매우 빈약하기 때문이다. 실제로 Chall ino r(1959, Sneath 와 Sokal, 1973 에서 재인용)는 〈화석의 증거에 의한 전화의 연구에 서 전화의 연속이 찰 이루어지는 수개의 경우만을 인용하는데, 이 때 이것이 단순히 대표적인 경우라고 표현함으로써 이러한 기록이
아주 희귀하다는 사실은 숨겨 버리고 있다〉라고 서술하였다. 이러 한 주장들을 종합하여 보면, 계통적 관계가 분류군의 자연성에 대 한 가장 적절한 관점이지만 계통적 관계를 실제로는, 추적하기 어 렵다는 것이 수리분류학자의 입장임을 알 수 있다. 계통적 관계를 Henn ig(l 966) 는 형태적, 생리적, 생태적 내지 지 리 분포적 관계로 구성되는 분류의 기본으로 보았다• 죽 반드시 화 석의 증거에만 국한되지 않는 광의의 계통적 관계로 해석한 것이 다. Henn ig의 이러한 견해는 계통적 관계가 전화적 증거인 상동성 의 원칙에 의해 증명될 수 있다는 설이 강력히 대두되면서 많은 사 람들에 의해 받아들여지기 시작하였다. 특히 그는 진화적 증거가 확실치 않음에도 불구하고 형태적, 생태적, 행동학적 분류를 통하 여 계통적 체계가 간접적으로 유도되고 설명되어질 수 있기 때문에 계통적 관계가 의미 있는 것 중의 하나라고 주장하였다. 전화의 이 론이 비록 직접 증명되지 못하는 경우들이 있으나 그럼에도 불구하 고 분류의 원칙에 가장 적합하며, 따라서 이를 근거로 한 계통적 관계는 지리적 분포, 생리적 적응, 형태적 유사성 등의 여러 생물 적 현상의 다양성에 대한 (상동성에 입각한) 가장 명확한 가정이라 고 본 것이다. Sokal 과 Snea t h 는 이러한 계통적 관계의 설정에 대하여 몇몇 가 지 문제점을 제기하고 있다. 예를 들면 진화의 속도에 대해서도 우 리가 정확한 지식을 갖고 있어야만 한다고 주장하였다. 또한 상동 성의 문제만 해도 어떤 형질이 상동성인가를 결정하는 것과 또 어 떤 형질이 독립적으로 발전해 나가는가를 결정하는 것은 계통학자 스스로 판단해야 하는 경우가 허다하다고 하였다. 심지어 Haeckel 의 〈개체발생은 계통발생의 짧은 반복이다〉라는 설도 〈동물의 어떤 발생과정이 실제로 계통적 발달을 반영하고 어떤 것이 반영하지 않 는지롤 알 수 없다〉라고 비판한 바 있다. 또한 He nnig는 형태적 유사성과 계통적 관계는 정확한 일치를 보이지 않으며 이때 계통적 관계를 더 중요하다고 생각하였다. Sokal 과 Snea t h 는 그러나 이러 한 두 관계 중 어느 것이 분류학자들에게 더 적당한 것인지는 좀더 논의하여야만 하며, 또한 이러한 문제는 이를 정량적으로 정확히 조사하여 어떤 모델을 제시할 때까지는 계통적 관계가 더 중요하다
는 데 반론이 제시될 수 있다고 하였다. 분류학의 계통적 근거에 대한 이러한 비판들은 오히려 이들 비판을 통하여 계통적 관계의 문제점들이 개선될 수도 있으나 Sokal 과 Sneath 이전의 학자들 중 어느 누구도 이를 과감히 시도하지 못한 것은 사실이다.
제 5 장 분류적 형질 생물간의 분류적 관계에 대한 관점이 분류학자에 따라 서로 다를 수 있다는 것을 앞에서 살펴보았다. 그러나 분류적 관계가 계통적 관계를 벗어날 수 없음을 우리는 알 수 있었다. 이제 우리가 실제 로 분류를 시행하는데 있어 이러한 계통적 관계를 중요한 관점으로 설정하였다고 가정해 보자. 그러면 문제는 앞에서도 지적한 바와 갇이 현재의 종이 어떤 경로를 따라 진화되었는지, 죽 현재의 후손 이 어떤 혈통과 연결되는지를 직접 관찰할 수 없다는 사실이다. 우 리가 가지고 있는 자료는 주로 현재의 생물 개체이며 그밖에 몇몇 화석 표본일 뿐이다. 분류를 뒷받침할 수 있는 자료가 이렇게 현존 생물에 국한되어 있다는 사실로부터 분류학적 방법론이 제기되기 시작한다. 이러한 방법론의 구체적 과정은 제 6 장부터 11 장까지에 서 자세히 다루키로 하고 이 장에서는 우리의 수중에 있는 분류적 증거들에 대한 정보를 분석해 보고자 한다. 5.1 분류적 형질의 정의 생물들 또는 분류군들 간의 계통적 관계를 수립하기 위하여 우리 가 갖게 되는 생물 개체에 대한 정보는 각 생물 개체가 나타내는
여러 가지 특징에 관한 것들이다. 즉, 생물 개체들이 나타내는 여 러 특칭들을 조사하고, 비교하여 우리는 어떤 종을 설정하게 되고 또 종과 종 간의 관계를 유추하게 된다. 따라서 분류군의 설정 및 분류군 간의 관계를 규정짓는 현존하는 생물의 특징이 무엇이며 이 러한 특징으로부터 어떻게 분류적 관점을 설정하여 분류군을 도출 할 것인가를 생각하여야 한다. 분류학에서는 이러한 의미에서의 생 물의 특칭 을 분류적 형 질 (分類的 形質, tax onomi c characte r ) 이 라 고 부른다. 이 장에서는 분류적 형질이 무엇이며 분류적 형질이 분 류적 관계를 설정하는데 어떻게 사용 되는지 잠시 살펴보고자 한 다. 분류학은 대상 생물에 대한 정보를 분석하고 이의 결과를 종합하 는 두 단계를 모두 포함하는데, 이러한 과정은 모두 분류적 형질에 기초를 두어 수행된다. Mayr 등 (1953) 은 분류적 형질을 〈생물 또 는 생물군의 어떠한 속성으로서 서로 다른 분류적 범주에 속하는 생물과는 다르고 서로 같은 분류적 범주에 속하는 생물과는 갇은 속 성 (any att rib u te of an orga nis m or of a gr oup of orga nis m s by whic h it dif fer s from an orga nis m belong ing to a dif fer ent tax onomi c cate g o ry or resembles an orga nis m belong ing to the same cate g o ry) 〉이 라고 정 의 하였다. 이 때 같은 분류적 범 주에 속 하는 생물 내에서의 자, 웅 또는 유생, 성체 등의 차이는 분류적 형질에서 제의된다고 보았다. 분류적 형질의 기능을 Ma yr는 이들 형질의 차이에 의해 분류군을 서로 구별해내는 식별 (d i a gn os tic)의 기능 (이는 특히 하위 분류군을 취급하는 데서 제기됨)과 분류군 사이의 관계를 제시하는 기능 (이는 상위 분류군을 취급하는 데서 제기됨)의 두 가지 관점을 가지고 있다고 주장하였다. 하였Sn다e.a t h첫 와째 So는k alM(a19 y7r3)가 은의 미형한질 이대라로는 〈의분미류를군 을좀 더구 별구하분는하 여특 칭언 —급 어(a떤 d is종 t i n류g 의u i sh생 in 물g 을fe a 다tu 른r e o종f 류 ta의x a —생물a 로ch부 a터rac t구e r 별i st하i c 도 o록f o n하e 는ki n 양d 상of orga nis m tha t wi ll dis t i ng uish it from anoth e r kin d ) 〉으로 규정 하 고 예로써 〈톱니 모양의 잎沼 7 식물의 어떤 종류를 다론 종류로부 터 구별해내므로 형질이라 불리운다고 하였다. 그러나 그는 이러한
정의가 자가당 착 의 모순 을 지니고 있다고 주장한다. 왜냐하면 형질 이란 분류군의 구성원들 사이의 차이라는 의미로 제한적으로 사용 되는데, 분류군 자체가 형질이 알려지지 않는 상태에서 설정될 수 없기 때문이라고 하였다. Snea t h 와 Sokal 이 지적한 두번째 관점은 M ic hener 와 Sokal(1957) 의 의견에 기초를 두어 분류적 형질을 〈생 물의 어떤 종류와 다른 종류 사이에서 서로 다르게 나타나는 성질 (a pro p e rty whic h varie s from one kin d of orga nis m to anoth e r) 〉이 라 하였으며 , 이 는 Ca i n 과 Harris o n (1960) 의 의 견 인 〈함께 고려 되 는 다른 사항과는 무관한 하나의 변화 양상으로 간주될 수 있는 어 떤 사항 (any thi n g th at can be consid e red as a varia b le ind epe n -dent of any oth er thi n g consid e red at the same time ) 〉의 의 미 를 지닌다는 것이다. 다시 말하면, 분류적으로 다른 항목과 구별되는 어느 독립된 특징 항목을 의미한다. 형질에 대한 이러한 두 가지 정의들을 분류군과 형질과의 관계 를 어떻게 보는가의 문제에 불과하다. 우리가 조사한 생물의 특칭 이 어느 생물을 다른 생물과 구별하게 하는 특징이 된다면 이러한 특징을 분류적 형질이라 한다는 데는 차이가 없다. 다만 어느 수준 에서 형질을 항목으로 독립시킬 것인가는 매우 어려운 문제이다(이 는 형질 단위의 문제이며 이 책의 제 6.3 장에서 취급하고 있다). 말하자면 형질과 형질상태 (形 質 狀態, characte r s t a t e) 를 구분하 는 것은 매우 어렵다. 앞의 예로 돌아가 형질과 형질상태를 구분한 다면, 〈 잎의 주변부의 성격〉이라는 항목은 분류적 형질이라고 할 수 있는 반면, 그 잎이 모가 나지 않았는가, 톱니 모양인가, 파상 인가 등은 분류적 형질상태라고 볼 수 있을 것이다. 형질과 형질상 태에 대한 이러한 구분은 Cronq u is t ( 1 968, 제 3 쪽)에 더욱 잘 나타 나 있다. 그는 서로 밀접한 관계를 가지고 변화하는 양상을 보이는 속성만을 하나의 독립된 형질이라고 하였다 (이는 유전적인 안정성 을 가지고 발현되는 여러 형질 중의 하나라고 해석됨). 또 어느 형 질이 분류학적으로 중요한가도 이 형질이 다른 형질과 얼마나 상관 이 있는가(밀접한 관계를 가지고 변화하는가)에 달려 있다고 보았 다. 현재 우리 말로는 charac t er 를 위 에서 제 시 되 어 있는 바와 같이
〈형질〉이라는 술어로 번역하여 사용하고 있다. 영어권에서 chata c- ter 라하면 지금까지 언급한 바와 같이 생물의 분류를 가능하게 하 는 분류적 양상을 뜻한다. 따라서, 우리 말의 형질 역시 분류적 형 질 이 라는 의 미로 국한시 켜 사용하여 야만 한다. 그 밖에 f ea t ure 나 att rib u te 등의 술어도 영어권에서는 어느 정도 일정한 의미로만 사용된다. 죽 fe a t ure 는 대체로 의관상으로 나타나는 특칭, 다시 말하면 형태적 특칭 같은 것을 나타내고, a tt r i bu t e 는 생태적 또는 지리적 특칭을 주로 나타낸다. fe a t ure 를 특징, a tt r i bu t e 를 속성이 라고 일반적으로 번역하고 있다. 따라서 형질, 특칭, 속성 등이 원 래의 영어권에서 사용되는 의미를 정확하게 전달하고 있지는 못하 더라도 이들 술어를 고정시켜 영어권의 characrte r , fea tu r e, att rib u te 룰 나타내고자 한다. 한 가지 특기할 것은 형질이, 특징 이나 속성을 모두 포괄적으로 나타내는 단어라는 사실이다. 위의 여 러 분류학자의 정 의 에 서 알 수 있듯이 charac t er 란 fea tu r e, att rib u te , pro p e rty 등으로 설명되고 있다. 따라서, 생물이 가지는 내적(유전적)인 현상이 의적으로 표현된 상태를 뜻한다고 본다. W il e y (1981) 는 이러한 특징 또는 속성이 발현되어 있는 상태를 charac t er 로 나타내려 하였는 바, 〈하나의 형질이란 이미 존재하던 특징이 개체발생 또는, 세포발생 과정의 산물로 나타나는 생물의 한 특징이거나, 선대의 생물이 가지던 특칭이다. 이러한 특징은 이 미 존재하던 개체발생 또는, 세포발생 계열이나 분자계열의 변형에 의 한 진 화과정 에 서 보여 진 다 (A characte r is a fea tu r e of an orga nis m whic h is the pro duct of an onto g e neti c or cyt og e neti c sequ ence of pre vio u sly exis t i ng fea tu r es, or a fea tu r e of a pre vio u s-ly exis t i ng pa renta l orga nis m (s) . Such fea tu r es aris e in evoluti on by modif ica ti on of a pre vio u sly exis t i ng onto g e neti c or cy tog e neti c or molecular seq u ence)> 라 고 설명하고 있다.
5.2 분류적 형질의 종류 그러면 이제 분류학의 과정에서 논의되는 분류적 형질은 어떤 종 류가 있으며 형질의 상태가 어떤 양상으로 나타나는지롤 알아보자. 물론 분류적 형질의 종류를 어떻게 규정할 것인 가에 대하여도 분 류학 이론들 사이에 차이점이 있다. 그러나 우선 전통적으로 사용 되는 종의 개념에 입각한 분류적 형질을 소개하고 이에 대한 수리 분류학자의 입장을 들어 보고자 한다. 대부분의 초창기 분류학자들은 형태적 형질을 기준으로 분류를 시행해 왔고 형태적 형질은 오늘날에도 가장 널리 사용되는 분류적 형질 중의 하나로 받아들여지고 있다. 그러나 Ma yr (l969) 는 분류 적 형질을 형태적, 생리적, 생태적, 행동적 및 지리적 형질의 5 가 지 항목으로 나누고 이를 아래와 갇이 세분한 바 있다(김 등 (1982) 의 제 40 쪽에도 소개되어 있다). 1) 형태적 형질 기.일반의부형태 L. 특수구조 (예 : 생식기관) 亡. 내부형태 (해부학) 근. 발생학 口. 핵학 (및 기타 세포학적 차이) 2) 생리적 형질 기. 대사적 요인 드 혈청학적, 단백질 및 그 밖의 생화학적 차이 C.. 몸의 분비물 티 유전적 불영성 요소 3) 생태적 형질 기. 서식처 및 숙주 L. 먹이
t::. 계절적 변이 릭 기생 a. 숙주의 반응 4) 행동학적 형질 기 . 구애 행동 및 기타 행동학적 격리 기작 드 기타 행동 양상 5) 지리적 형질 기. 일반적인 생물 지리적 분포 형태 L. 개체군의 동소적-이소적 관계 분류학적 형질의 이러한 나열은 여러 저자에 따라 다르고 따라서 이러한 도표는 수없이 많을 수 있다. 예를 들어, Snea t h 와 Sokal (1973) 은 1) 형태적 형질 (의부 또는 내부적 형질 및 세포학 내지 발생학 적 형질 등) 2) 생리, 화학적 형질 3) 행동학적 형질 4) 생태, 분포적 형질 (서식지, 먹이 숙주, 기생생물, 개체군 동 태, 지리적 분포) 의 네 가지 범주로 나누었다 . 이러한 분류적 형질 중 Ma y r 의 생 태적 형질 및 지리적 형질이나 Snea t h 와 Sokal 의 생태, 분포적 형 질은 최근에 많이 강조되고는 있으나 실제로 분류를 수행하는 과정 에서 직접 이용되는 경우는 많지 않다. 오히려 이들 형질은 분류 결과가 과오를 범했는지의 여부를 판단하는 데 사용되는 경우가 많 다. 생활 환경의 차이, 예를 들면 어떤 생물은 해안가의 암반 위에 서식하고 어떤 생물은 해안가의 모래사장에 서식한다면 이러한 서 식환경의 차이로 인하여 생물들의 적응방법이 달라진다. 죽 환경에 대하여 형태 또는 생리적으로 서로 다르게 적응한다고 하겠다. 결 과적으로 보면 형태 또는 생리적 형질 등의 분류적 형질이 서식지 에 따라 큰 차이룰 가진다고 할 수 있다. 환경의 차이가 분류적 형
질을 달리하게 한 것이다. 그러므로 환경의 차이가 심한 두 장소에 갇은 종이 서식하기는 어렵다. 반대로 말하면 종을 구별하는데 환 경조건을 대비시켜 보는 것은 좋은 방법이 될 수 있다. 그러나 우 리는 최종적으로 나타난 형태의 차이에 의해 분류를 시도하고 있을 뿐 생태적 차이룰 분류의 색인표에 이용하여 분류를 시행하는 경우 논 드물다. 대부분의 분류 기재에는 생태 또는 분포적 형질둘이 단 순한 참고 사항으로 기재되고 있을 뿐이다. 또한 이러한 생태적, 분포적 형질을 수리분류학에 이용하는 데도 몇몇 가지 어려움이 뒤 따른다. 어떤 대상 생물이 분포하는 지역의 환경 특징이 정량적인 방법으로 기재될 수 있는 경우도 많으나 이러한 방법에 의해 수리 적으로 표현될 수 없는 경우도 있기 때문이다. 형질에 대한 견해는 분류적 관점을 어떤 방향으로 이끌고자 하는 가에 따라 달라지기도 한다. W il e y는 앞에서 소개한 전통적인 형 질의 나열법과는 현저히 다르게 형질을 〈상속받은 것〉으로 생각하 여 형질의 종류를 논하였다• 죽 그는 구조적 형질, 기능적 형질, 계통적 형질로 형질의 종류를 대별하였으며, 상동기관의 중요성을 강조하여 그의 분지론적 관점을 주장하였다. 위에서 예시한 분류적 형질에 대한 조견표는 전 생물군을 대상으 로한 대략적인 기준만을 제시할 뿐 모든 생물군에서 실질적으로 사 용될 수 있는 성질의 것은 아니다. 각 분류군은 그들 나름대로의 생물학적 현상을 가지고 있기 때문에 이를 분류학적 형질을 선정하 는데 참조해야만 한다. 수리분류학자들은 그러나, 이러한 분류적 형질의 선정에 몇몇 원칙을 제시하고 있다. 예를 들면 대상생물의 몸의 모든 부분을 조사해야만 하고 생활사의 모든 단계에서의 형질 이 비교되야만 한다고 하였다. 이는 고생물 학자들에게는 어려움을 주는 문제이다. 화석종에 있어서는 이러한 증거가 불충분한 경우가 많고 따라서 고생물 학자들은 현재 제공되는 화석종의 어느 부분에 만족해야만 하기 때문이다. 또한 분류적 형질을 단순히 전통 분류 학에서 사용하는 형질들 이의에 대상생물의 분류군 내에서 서로 차 이룰 보일 수 있는 〈모든 형질〉이 이용되어야 한다는 것이다. 이러 한 수리분류학자들의 주장은 가능한 한 많은 형질을 이용하여, 주 관적인 것으로부터 탈피하여 분류군을 설정하려 하였기 때문인 것
으로 볼 수 있다. 5.3 형질의 유사성 분류적 형질이란 생물간의 분류적 관계에 대한 증거들이라 할 수 있다. 이제 분류적 형질로부터 분류적 관계를 어떠한 방법에 의해 설정하는가 하는 문제를 살펴보려 한다. 다시 말하면, 각 생물의 또는 각 분류군의 형질 상태를 조사한 결과를 가지고 생물간의 계 통적 관계를 어떻게 수립하는가 하는 문제라고 할 수 있다. 바로 여 기 서 설명 해 야 할 사항이 유사성 (類似性, sim i lar i ty) 이 다. 계 통 적 관계와 유사성은 밀집하게 연결되어 있기 때문이다. 계통적 관 계란 조상과 후손간의 관계인데 조상과 후손간에는 서로 〈닮음〉이 있다. 이러한 닮음이 어떠한 상태로 나타날지는 모르나 생물의 여 러 속성에 포함되어 나타날 것이다. 그러므로 생물의 속성 (분류적 형질)을 조사하면, 이러한 속성에서 생물간의 닮음을 추적할 수 있 고 조상 후손간의 계통적 관계를 유추할 수가 있을 것이다. 유사성 이란 바로 계통적 관계를 추적할 수 있는 생물과 생물간의 닮음이 라 하겠다. 생물간의 유사성은 조상 후손간의 계통적 관계에 의해서만 나타 나는 것이 아니라 다른 원인에 의해서도 나타난다. 죽 조상이 같음 으로써 이에서 유래하는 유사성이 있지만 (이룰 근연성이라 한다), 환경에 의해서 후천적으로 생길 수 있는 유사성도 있다. Snea t h 와 Sokal (1973, 제 40 쪽) 은 이 러 한 유사성 을 부계 적 유사성 (父系 的 類似性, pa rt risti c sim i lar i ty, p ar t r i s ti c 이 란 그리 스어 의 pa te r (fathe r) 에 서 온 형용사) , 죽 공동 조상과 관계 있는 유사성 과, 공 동조상과는 상관없이 현 시기에서 형성된 후기적 유사성 (後期的 類似性, homop la sti c s i m il a rity)으로 구분하였다. 유사성이란 대부 분 공동조상에서 유래되어 나온 것으로 이것이 자손대에 있어서도 서로가 유사하게 나타남으로 해서 분류를 가능하게 하나 모든 유사 성이 이렇게 꼭 선조에 의하지 만은 않는다. 위에서 지적한 바와
같이 후기적 유사성으로 표현된 것은 현재의 환경에서 어쩔 수 없 이 생겨난 유사성이다. 계통 분류에서 해결해야 하는 기본적인 문 제는 생물 개체간에 나타나는 여러 유사성이 공동조상으로부터 유 래한 것인가 아닌가를 판단하는 일이다. 그래야만 선조와의 관계를 알 수 있기 때문이다. 이러한 문제를 논의하기 위해 잠시 몇몇 술 어를 소개하고자 한다. 우선 상동성 (相同性, homolog y, 일치함이라는 뜻의 그리스어 의 homolo gi a 에 서 유래 함) 이 란 〈공동조상으로부터 의 상속에 기 인 하는 유사성 (homolog y is resemblance due to inh erit an ce from a common ancestr y , Sim p so n 1961) 〉을 뜻한다. 앞에서 소개된 부계 적 유사성과 서로 관계있는 술어이다. 상동성과 대치되는 술어로는 비상동성 (非相同性, homo p las y)이 있다. 이는 공동조상으로부터 의 상속에 기인하지 않는 유사성을 뜻한다. 상동성 내지 비상동성 이란 현재의 생물이 구조적으로 유사한데 이들 유사성의 기원이 무 엇인가에 대한 용어들이다. 우리가 흔히 알고 있는 상사성 (相似性, analog y) 이 란 공동조상에서 유래 하지 않는 유사성으로 기능적 인 측면에서의 유사성만을 뜻한다. 죽 어떤 기관이 형태적으로 유사하 기보다는(물론 그럴 수도 있지만) 기능적으로 유사한 경우를 특히 강조한 것이다. 상동성, 비상동성은 조상 후손의 관계인가 아닌가 를 대치시킨 술어이고 상동성, 상사성은 조상 후손의 관점과 기능 적 관점을 대치시킨 술어라 하겠다. 상동성에 대한 개념은 이미 16 세기부터 비교 해부학에 관한 지식 이 축적되면서 인식되기 시작하였으나, 이를 규정한 최초의 학자는 19 세 기 의 인물인 Owen 이 다. Owen 은 상동성과 상사성을 정 확히 구분하여 상동기관이란 〈구조나 기능은 다를 수 있는, 서로 다른 동물에 서 나타나는 같은 기 관 (the same orga n in dif fer ent anim als under every vari et y of for m and fun cti on ) 〉이 라 정 의 하였고, 상사 기관을 〈어떤 동물에서, 다른 동물의 기관과 마찬가지의 기능을 가 지 는 부분이 나 기 관 (a pa rt or an orga n in one •a nim al whic h has the same fun cti on as anoth e r pa rt or orga n in a dif fer ent anim a l) > 이라 정의하였다 (Sim p so n, 1961, 제 79 쪽에서 재인용). 그러나 이 때 ‘same’ 의 의미를 선천과의 관계로 규정한 것은 다윈이었고, 이
후 진화론의 중요성으로 인하여 상동성의 개념이 〈조상으로부터의 상속에 기인하는 유사성〉의 의미로서 고정되어 사용되기 시작하였 다. 그러나 실제의 관찰에서 어느 유사성이 상동성인지롤 판단하는 것은 매우 어렵다. 그렇기 때문에 분류학자들은 상동성을 판단하는 대체적인 기준을 설정하였다. 상동성의 기준이 무엇인가롤 설명하 기에 앞서 이에 대치되는 개념인 비상동성과 관계되는 몇몇 개념을 상동성과의 관계에서 살펴보기로 하자. 비상동성, 죽 조상과 상관 없는 유사성을 설명하는 술어로는 평 행성과 수령성이 있다. 평행성 (平行性, p aralle li sm) 이란 Sim ps on (1 961) 에 의하면 〈공동조상을 가지는 둘 또는 그 이상의 가계에서 바로 그 공동조상의 특칭에 기초를 두어 독립적으로 유사한 형질이 발전함 (the develop m ent of sim i lar characte r s sep a rate l y in tw o or more line ag e s of common ancestr y and on the basis of, or channeled by, characte r is t ic s of tha t ancestr y) > 을 뜻한다. 이 에 비 해 수령 성 (收敏性, converge nce) 이 란 〈공동조상을 갖지 않는 두 개 또는 그 이상의 가계에서 비슷한 생태적 상황에 적응되어 형 성되는, 유사성과 직접 관계있는 유사한 형질의 발달 (develop - ment of sim ilar characte r s sep a rate l y in ty,ro or more line ag e s wi tho ut a common ancestr y pe rtin e nt to the sim i lar it y but inv olv- ing adap tat i on to sim i lar ecolog ica l sta t u s ) > 이 라고 정 의 되 어 있 다. 형질의 유사성을 크게 부계적 유사성과 후기적 유사성으로 나누 고 후기적 유사성을 평행성과 수렵성으로 구분하여 표시하면 그립 1 과 갇다. 그림 5.1 (a) 의 A, B, C 군에서 보여주는 형질, 사각형 과 삼각형은 조상 X 를 기준으로 했을 때, 모두 부계적 형질 (상동 성) 이 된다. 이때, 사각형을 원시형질, 삼각형을 파생형질이라 부 른다(원시형질 및 파생형질에 대하여는 제 11 장에서 다시 상세히 소 개됨). 물론 우리는 조상 분류군 X 에서의 형질 상태가 사각형인지 삼각형인지롤 알 수 없으므로 현재의 분류군 A, B, C 에서 나타나 는 사각형 및 삼각형 형질 중 어떤 것이 원시형질인가를 판단하기 는 어렵다. 이러한 문제에 대하여는 제 11 장의 분지 분석 방법의 설 명 과정에서 다시 한 번 언급될 것이다.
A B C A B A B C D
그림 5.1 (b) 는 평행성을 나타내고 있다. 이때 물론 조상 X 를 기준으로 한다면, 넓은 의미에서 상동성이라고 표현할 수 있지만 현재의 분류군 A, B 를 대상으로 할 경우, B 의 삼각형 형질은 Y 의 사각형 형질에서 유래되었으므로 A, B 군의 유사성은 후기적 유사 성이라 할 수 있다. 동시에 A, B 의 삼각형 형질은 각각 독립적으 로 발달했으므로 평행성의 성격을 지닌다고 하겠다. 죽 Simp son 의 평행성에 대한 정의인 〈공동 조상을 가지는 둘 또는 그 이상의 혈 동에서 바로 그 조상의 특징에 기초를 두어 독립적으로 유사한 형 질이 발전함〉의 의미를 내포함을 그림 5.1 (b) 로부터 알 수 있다. 수령성은 평행성의 형질 전위과정과는 뚜렷히 구별되는 톡칭을 지 닌다. 그립 5.1 (c) 의 분류군 B, C, D 에서 나타나는 원으로 표시된 형질은 그 조상이 뚜렷히 다름에도 불구하고 현재의 분류군에서 유 사한 형질이 나타난 경우이다. 죽 B 의 형질은 조상 Y 에서 유래되 었고, C 및 D 는 조상 Z 에서 유래되었음에도 불구하고 현재는 유 사한 형질을 가지고 있는 이러한 경우를 수령성으로 설명하고 있
다. 상동성, 평행성, 수령성 동에 관한 설명을 Snea t h 와 Sokal 은 분 지 분석법에서 주로 사용하는 분지도의 형식을 빌어 시도하고 있 댜 그림 5 . 2 를 통하여 그들이 나타내고자 했던 의미를 파악해 보 자. 그림 5 . 2(Snea t h 와 Sokal, 1973, 제 38 쪽에서 인용함)는 어떤 가상되는 형질 (1-8) 의 상태 (—1, 0, 1, 2) 를 각 분류군 별로 선조 분류군과 함께 나타낸 것이다. 이때 원시형질이란 두 개의 후손 분 류군에서 같고 그들의 최근 공동조상에서 같은 형질이라 할 수 있 으므로 위의 그림에서 보면 분류군 C, E 에서의 형질 1 과 2 가 된 다. 이 형질들은 이들 분류군의 공동 조상인 A의 형질 1, 2 와 그 형질상태가 같다. 파생형질은 후손 분류군에선 같으나 선조에선 다 른 형질로서 그림 5 . 2 에서 보면 C, D 의 형질 3, 4 가 된다. 평행성 이란 분류군 C, D 에서 독립적으로 발달한 형질 6, 7 을 말하며 수 령성이란 C, D, E 에서 나타나는 형질 8 을 말한다.
ChaSrta ac t te e 『 0/1213 4I 5t-61- 17 8I 0102I3 4I 25.:61- 17 8I 01020304-15 6I I! EI!
생물 간의 유사성이란 실제 그 기원을 살펴보면, 위에서 언급한 바와 같이 몇 가지 부류로 나누인다. 유사성이 생물의 분류만을 목 적으로 사용되어질 경우라면 유사성의 기원이 무엇이든 상관이 없 다. 그러나 우리는 생물의 분류를 단순히 생물의 종류를 구별하고 자 행하는 것이 아니라 생물군 간의 관계를 설정하고자 실시하며 이때 계통적 관계가 가장 중요한 관점이 됨은 여러 번 지적한 바 있다. 따라서 유사성도 이러한 관점에서 고려되어야만 한다. 그러 나 형질의 선택이나 선택된 형질로부터 도출되는 유사성의 중요도 에 대한 견해가 분류학의 몇몇 이론에 따라 차이가 난다. 수리분류 학의 경우는 결과적으로 생물에 나타나는 유사성에만 관심이 있을 뿐 이의 기원이 무엇인가는 일단 방법론상에서는 고려하지 않는다. Snea t h 와 Sokal(1973) 이 지적한 대로 수리분류학은 모든 형질에 대한 중요도를 동일시하기 때문이다. 따라서 선조가 같기 때문에 나타나는 유사성과 선조에 기인하지 않는 유사성을 서로 동등하게 취급하여 수리적으로 분류를 시행하면서 이의 결과로부터 어떻게 선조와의 관계를 찾을 수 있겠는가가 수리분류학에서 해결해야 할 가장 중요한문제이다. 수리분류학자들은 비록 우리가 이러한 어려운 접을 안고 있긴 하 더라도, 일단 현존하는 생물에 대한 정보를 철저히 분석하여 계통 적 관계를 수립하는 방법을 받아들이는 수밖에는 없다고 생각하였 다. 죽 현재 분류군들끼리 가지는 유사성 (수리분류학자들은 이를 표현론적 유사성이라고 표현하였다. 제 6 장에서 다루게 된다)에 의 미를 부여한 것이다. 현존하는 분류군의 형질을 분석하는 것은 중 요한 의 미 를 갖는다. Sim p so n (1961) 역 시 상동성 의 기 준을 제 시 하 면서,현재의 분류군에 대한 유사성울 분석하는 것은 상동성을 판단 하는 좋은 방법이라고 서술한 바 있다. 또한 이때 현재의 분류군이 가지는 분류적 형질을 가능한 한 많이 분석해야 한다고 하였다. 더 구나 아주 혼한 일반적 형질들도 많은 상동성을 내포하고 있으므로 이러한 형질의 관찰에만 의존하여도 상동성을 유추할 수 있다고 까 지 주장하였다. 일반적으로는 발생과정이 좀더 많은 상동성을 반영 하고 생태적 관찰 결과 역시 상동성이나 수령성에 대한 기준을 제 공하는데 중요한 역할을 하고 있다고 본다. 그러나 수리분류학은
형질의 중요도를 어느 형질이건 같다고 보았으며 유사도 역시 가능 한 한 많은 형질을 근거로 한 유사도를 기준으로 하고자 하였다. 제 6 장에서는 수리분류학이 형질이나 유사도의 설정을 어떠한 근거 롤 중심으로 수행하고 있는지 살펴보고자 한다. 구체적인 형질 설 정의 방법도 제시될 것이다. 수리분류학의 결과에 대한 계통학적 해석의 문제논 제 12 장에서 상세히 다루겠다. 또한 공동 조상으로부 터 유래한 유사성을 최대로 강조하여 이를 근간으로 출발한 분지론 에서의 유사성 문제는 제 11 장에서 상세히 언급될 것이다.
제 6 장 수리분류학과 분류적 형질 6.1 수리분류학의 특징 Sokal 은 분류학에 있어서의 수리적 방법론이 이미 1898 년 He i ncke 가 시도했던 청어를 대상으로 한 생물통계적 방법론으로 부터 출발했다고 보았다. 그러나 분류학자들에게 관심울 끈 최초의 통계 적 방법은 Pearson 의 〈종족 유사성 계 수〉의 사용이 라고 Sokal 은 소개하고 있다. Anderso~ 됴 1930 년 대에서 이와 비슷한 방법을 사용하였으나 그 당시까지만해도 이들 방법이, 분류의 대상이 되는 개체를 이미 존재하는 분류군에 적당히 배열하는 것에 지나지 않았 으며 분류적인 차이점에 의해 분류군을 설정하는 일이 행해지지는 못하였다. 또한 선택되는 분류적 형질들도 분류군들 사이에 크게 차이를 보이는 형질만이 선택되었기 때문에 많은 형질이 함께 비교 될 경우 분류군이 불안정함을 보였다. 이러한 방법을 개선하여 현 대적 개념의 수리분류학이 발달하기 시작한 것은 1950 년대 이후이 다. Snea t h 와 Sokal(1973) 은 그들의 저서에서 1957 년 이후의 수리분 류학 내에서의 중요 업적을 잘 정리하고 있다. 그들에 따르면 수리
분류학의 이론적 발달시기를 1957-1961 년 사이로 보며 1963 년의 그 들에 의한 『 수리분류학의 원리 』 라는 책의 출간을 하나의 전환접으 로 보았다. 이후 수리분류학에서는 전통 분류학자들이 수리분류학 의 문제점으로 지적한, 수리분류학적 결과의 계통적 해석에 관한 문제점을 이론적으로 보완하는 방향으로 관심이 집중되었다. Snea t h 와 Sokal 역시 바로 이 문제를 1973 년의 저서에서 상세히 다루고 있다. Snea t h 와 Sokal 의 이러한 지대한 노력으로 수리분류 학은 정착되었고, 1982 년 7 월 독일의 바드 윈즈하임에서 열린 학술 회의에서는 수리분류학적 접근의 최신 경향을 종합한 60 여 편의 논 문이 일시에 발표되는 성황을 이루었다 (Fe lsenste i n , 1983). 이러 한 과정에서 수리분류학자들은 통계적 혹은 수리적 방법에 의한 분 류의 결과로부터 가능한 한 계통적 결론까지를 얻고자 무한히 노력 하고 있음을 알 수 있다. 동시에 수리분류학은 전통적인 분류학에 서 발견되는 오류까지도 시정하려 하였다. 가장 중요한 점이라면 수리분류학적 과정을 통하여 전통 분류학에서 문제가 되는 주관적 결과를 객관화하고자 시도한 것이라고 하겠다. Sokal 과 Snea t h(1963) 의 의견을 빌면 수리분류학의 뚜렷한 장점 은 결과의 반복성과 객관성에 있다. 비록 우리가 어느 사실에 대해 서 항상 의견의 일치를 보이는 것은 아니지만 반복성에 의해서 그 사실 자체에 여러 사람이 동의하도록 하는 것이 자연과학적 방법론 이다. 수리분류학이 목적하는 바도 바로 반복성에 의한 분류결과의 객관화라고 볼 수 있다. 죽 서로 동떨어져 독립적으로 일하고 있는 분류학자들이 두 개의 서로 다론 생물개체를 비교할 때 이 생물체 의 형질을 갇은 방법으로 측정하도록 하는 것이다. 방법을 이렇게 같게 하면 반복성을 가질 수 있다. 이러한 반복성이 객관성과 밀접 하게 연결되어 있음은 당연하다. 물론 객관성 역시 실제로는 상대 적 개념이라고 주장될 수도 있으나, 최소한 주관적 편견을 완화하 고 객관성을 높히고자 시도할 수는 있다고 본다. 수리분류학에서는 가능한 많은 분류적 형질을 조사하여 (어떤 주관적인 형질의 선택 울 배제하고) 이 자료를 처리하고, 결과를 정리하여 분류적 기준을 설정하는 것에 의해 객관성울 높이고자 시도하고 있는 것이다. 이 러한 수리분류학의 입장을 Snea t h 와 Sokal(1973) 은 불란서의 식물
학자 Adanson(1727-1806) 에서 찾고 있으며 neo-Adanson i an 이라 부르는 수리분류학자들에 의한 분류 원칙에 대한 견해롤 다음과 갇 이 정 리 한 바 있다 (Snea t h 와 Sokal 1973, 제 5 쪽) . 1) 분류군에 대한 정보가 많을수록, 더욱 많은 형질을 고려할 수 록 좋은 분류가 된다. 2) 연역적으로 모든 형질은 자연분류군을 설정하는 데 같은 중요 도를 가져야 한다. 3) 어느 두 개체 사이의 전유사성은 비교하려 하는 형질의 각각 의 유사성과 함수관계에 있다. 4) 분류군이 구별되는 것은 형질의 유사성이 다르기 때문이다. 5) 계통적인 추론은 전화의 경로나 기작을 암시하는 분류적 구조 나 형질의 상관관계로부터 가능해진다. 6) 분류학이란 일종의 경험적 과학이다. 7) 분류는 표현론적 유사성에 기초를 둔다. 이러한 견해를 기초로 한 수리분류학이 객관성 및 반복성을 가지 면서 전통적 분류학과 비교해 가져온 몇몇 장점을 Sokal 과 Sneath (1973) 는 다음과 같이 지적하고 있다. 1) 수리분류학은 형태학, 생리학, 화학, DNA 배열의 유사성, 단 백질의 아미노산 서열 등에서 유래하는 많은 종류의 자료를 종 합하는 능력을 가전다. 2) 분류적 과정의 부분이 자동화됨으로 작업효율이 크다. 따라서 많은 분류적 작업을 고도로 숙달된 전문가가 아니라도 수행할 수 있다. 3) 수리적 형태로 기록된 자료는 분류를 시행하는 기관의 전자계 산기에 종합되어 기재, 색인, 종 목록, 지도 또는 그 밖의 다 른 기록들을 작성하는 데 사용될 수 있다. 4) 정량화되어 있기 때문에 분류적 차이나 분류군 사이의 한계를 설정하기가 용이하다. 따라서 이는 전통적인 방법에 의한 분류 보다 더욱 좋은 분류와 색인표를 제공할 수 있다.
5) 수리분류학을 위한 명확한 자료표의 작성은 이 분야에 종사하 는 학자에게 더 많은, 잘 기재된 형질을 사용하도록 해왔다. 이는 필연적으로 전통 분류학의 질을 개선하게 될 것이다. 6) 수리분류학의 근본적인 이점은 분류학의 원칙이나 분류의 목 적을 재고하게 한 것이다. 7) 수리 분류학은 생물학의 몇몇 개념을 재해석하게 했고 새로운 생물학적, 전화적 의문을 제기시켰다. 수리분류학의 수행은 대상생물이 선택되면 이 생물의 분류학적 형질이 조사되고 생물체간 형질의 유사성이 계산됨으로써 이루어진 다. 이러한 과정을 거친 후에야 비로소 분류군의 설정이 가능하다. 이제 분류적 형질의 선택이나 형질의 유사성 산출, 이의 결과를 토 대로 분류군을 설정하는 문제들을 수리분류학에서 어떻게 해결하고 있는가를 살펴보자. 6.2 형질의 선택과 전유사성 분류의 원칙이 자연성에 있으므로 이러한 자연성을 있는 그대로 파악하기 위하여 생물 개체가 가지는 형질이나 이들 형질에 의해 설정되는 유사성 등에 관한 일반적인 개념들을 제 5 장에서 살펴보 았다. 수리분류학자들은 이제 자연성에 입각한 개념들에서 벗어나 지 않으면서 분류의 원칙 문제를 어떻게 해결하고 있는가를 실제 문제를 중심으로 알아보고자 한다. 우리가 분류를 시행할 때 사용하는 재료는 대부분 채집된 후 보 관된 상태로 되어 있는 생물체이다. 그러므로 우리는 실제로 죽어 있는 생물의 의부 형태에 의존하여 분류하는 경우가 허다하다. 심 할 경우는 몸체의 어느 한 부분의 골격만을 가지고 색인표를 만들 며 분류를 시행하기도 한다. 이러한 분류의 방법은 수리분류학의 입장에서 보면 찰못된 것이다. 형태적 비교란 아주 가까운 종들 사 이에서는 이들을 구별하는 특칭으로 사용될 수 있으나 약간 상위
분류군만 되어도 상위 분류군의 설정을 위하여는 좀더 많은 형질을 필요로 하게 된다. 실제로 분류가 되어지는 것은 생물체이지 형질 이 아니라고 보기 때문이다. 따라서 전체 생물 개체의 모든 특성을 전부 관찰한다는 의미에서 생물의 전 형질이 분류에 고려되어야 한 다는 것이 수리분류학자의 입장이다. 죽 그들은 가능한 한 많은 형 질을 고려하고자 한 것이다. 단, 이때 형질을 선택하는 데 있어 수 리분류학적 입장인 〈함께 고려되는 사항과는 무관하며, 변화하는 양상으로 간주될 수 있는 어떤 사항〉(이 책의 제 60 쪽)의 의미에서 형질의 종류가 선택되어져야 함은 물론이다. 많은 형질을 고려하는 것이 타당하다는 사실이 누구에게나 받아 들여지는 것은 아니다. 수리분류학자들만이, 많은 형질이 고려되어 야 하고 또한 모든 형질은 자연분류군을 설정하는 데 갇은 정도의 중요도를 가져야 한다고 주장하 것이다. 바로 이러한 관접둘이 전 통적인 분류학과 서로 대치되는 접이다. 제 4 장에서 이미 언급한 바와 같이 생물간의 유사성이란 생물군 간의 관계를 설정하기 위해 서만 논의되어야 한다. 이때 생물군 간의 관계란 계통적 관계를 지 칭하기 때문에 유사성의 기원이 전화적 관계에서 출발한 것 만이 생물군 간의 관계를 나타내는 유사성이라고 전통 분류학자들은 주 장하였다• 죽 유사성을 상동성에 입각해서 보고자 하였다. 그러나 수리분류학자는 이러한 유사성에 전유사성의 개념을 도입하여 이 문제를 해결하려 한 것이다. 물론 우리가 전유사성의 절대값을 측 정할 수는 없지만, 전유사성이란 어디까지나 비교하고자 하는 많은 형질의 각각의 유사성과 함수 관계에 있으므로 대상 형질의 수가 많으면 많을수록 전유사성의 값이 더욱더 신빙성을 갖게 된다고 본 것이다. 대부분의 분류학자들은 그들이 시행한 분류가 안정성을 갖기를 바라기 때 문에 이 러 한 관점 에 맞추어 Snea t h 와 Sokal (19 73) 은 전 유사성의 장점을 크게 두 가지로 부각시켰다. 첫째는, 만일 처음 시행한 분류가 가능한 한 많은 형질이 고려된 유사성에 기초를 두 어 시행되었을 경우 어느 정도 새로운 형질에 대한 정보가 나중에 추가되더라도 최초에 행한 분류가 틀리게 될 확률은 적다는 것이 다. 또 언제나 새로운 분류군이 추가될 수 있고 최초에 설정된 분
류군의 한계들이 검정을 받을 수 있으며 분류학자들 사이에 분류의 기준이 서로 쉽게 통일될 수 있음을 강조하였다. 그러나, 전유사성 을 기초로 하는 수리분류학의 장점을 쉽게 몇 마디로 표현하기는 매우 어렵다. 현재까지 많은 학자들이 이 수리분류학에 종사해 왔 고 또한 많은 비판을 받아 오기도 했다. 특히 이 유사성에 관한 문 제는 상동성이나 부계적 유사성의 문제와 함께 분류학에서 논의되 는 가장 어려운 문제이다. 6.3 형질의 단위 제 5.2 장에서 서술한 형질의 종류는 다만 어떤 관접에서 대상 생 물을 관찰하는가에 대한 윤곽을 제시하고 있을 뿐이며 위에서 소개 한 전형질의 선택은 전유사성 이라는 수리분류학의 기본 입장울 강 조한 것에 지나지 않는다. 우리가 분류를 시행하는 데 실제로 부딪 치는 최초의 문제는 분류적 형질울 어느 범위에서 한계를 그어 〈분 류적 형질의 단위〉로 설정하는 가이다. 예를 들면, 어느 생물의 〈길이〉라는 항목을 조사할 경우, 단순히 길이를 하나의 형질로 볼 것인가, 이 길이를 다시 세분하여 길이의 어떤 범위둘을 한 개의 형질로 볼 것인가 하는 문제이다. 분류적 형질의 범위를 Snea t h 와 Sokal 은 단위형질(單位形質, unit charact er ) 이 라 부르고 이 를 정 의 함에 있어 수리 분류학의 근 간울 이루는 정보 이론을 도입하였다. 죽 단위형질이란 〈부호(符 號)화하는 방법의 차이 때문에 나타나는 세분화를 제외하곤 더이상 논리적으로 나뉘어질 수 없는 대상생물의 둘 혹은 그 이상의 상태 룰 가전 분류적 형 질 (a tax onomi c characte r of tw o or more sta t e s , whic h wi thi n the stu d y at hand cannot be subdiv i d e d log i- cally, excep t for subdiv i s i o n broug h t about by chang e s in meth o d of codin g ) > 라고 정의하고 있다• 예를 들면, 곤충에 있어서 머리 부 분에 돌기가 있고 없음이 만일 우리가 이 돌기의 미세구조를 알지 못하여 이를 더이상 세분화할 수 없다면 하나의 단위형질이 될 수
있다고 본 것이다. 죽 단위형질이란 더이상 세분화하기 어려운 최 소 단위가 되는 특성을 일컫는다고 하겠다. 단위형질을 좀더 구체적으로 설명하기 위하여 Sokal 과 Snea t h 는 수리분류학에서 단위형질로 사용할 수 없는 몇몇 형질을 소개하고 있다. 우선 논리적으로 연관성이 있는 특징들은 앞의 정의에서도 지적하였듯이 각각이 독립된 단위형질로 사용될 수 없다. 예를 들 면, 피의 헤모글로빈의 유무와 피가 붉은 색인가 아닌가는 서로 연 관성이 있는 형질이므로 이 둘 중에 하나만을 선택하여야 한다고 하였다. 이와 같은 예는 매우 많다. 어느 생물의 전체 길이와 전체 길이의 반(半)이라든가 둥근 모양일 때 이의 직경과 반지름 등이 다. 이러한 논리적 관계가 부분적으로 중복되는 경우도 있다. 만일 어떤 형질 아)가 다른 형질 때에 부분적으로 의존관계가 있다면 이 때 아)를 독립된 형질로 선택하는가의 문제는 때 가 유전적인 변이 로 간주될 수 있는가의 문제에 달려 있다. 또한 형질들 중에는 유 전적 성격 내지 유전형 (迫傳型, g eno typ e) 이라고 간주될 수 없는 경우가 많다. 환경에 의한 변이가 매우 심하여 어떤 형질이 환경에 의해 결정된 것인지 유전적으로 결정된 것인지롤 판단하기가 어려 운 경우가 흔히 있기 때문이다. 이러한 형질들은 단위형질로 선택 되기 어렵다. 또한 여러 분류군 사이에 일정하게 같이 나타나는 형 질은 그들이 아주 성격이 다른 분류적 형질의 경우라도 의미가 없 는 형질이 된다. 이러한 형질의 사용은 단순히 유사지수의 정도를 높혀 주기는 하나 두 개의 분류군을 서로 식별하는 데는 도움을 주 지 못하기 때문이다. 6.4 운영분류단위 Sokal 과 Snea t h 가 제 안한 op e rati on al tax onomi c un it를 일단 〈운영분류단위 (運 營 分類 單 位)〉라는 말로 번역하여 사용해 보고자 한다. 운영분류단위는 분류군이라는 분류단위와 유사한 의미에서 사용되었다고 볼 수 있다. 그러나 이 두 단어가 완전히 같은 의미
는 아니다. 분류군이란 제 1 장에서 언급한 대로 계총 구조의 어느 단계에서의 단위를 말하며 가장 최소 단위를 종(種)이라고 규정하 였다. 따라서 분류군은 생물학적 종의 개념에서 출발한 전통적 의 미에서 사용된 술어이다. 이에 비해 운영분류단위는 이를 처음부터 생물학적 개념을 도입시켜서 생각할 수는 없는 일종의 인위적 단위 이다. 죽 분류군은 이것이 가지는 자연성의 성격에 의해 한 개의 단위로서 정의되고 한계지어침에 비해 운영분류단위는 현재로서는 그 실체를 알 수 없는 일단은 가정된 어떤 무리라 하겠다. 이런 의미에서 보면 생물 개체 하나라도 경우에 따라서는 하나의 분류 단위가 될 수 있다. 더구나 이제 분류군 대신에 운영분류단위 라는 술어를 사용함으로써 이러한 의미는 더욱 강해진다. 이 술어 를 제안한 Snea t h 와 Sokal 자신들은 안타깝게도 그들의 저서 어디 에서건 이 단어를 정확히 정의하고 있지 않다. 그러나 운영분류단 위란, 수리분류학의 과정 중 나타나는 생물의 무리를 일단 묶어내 는 하나의 인위적 단위임을 수리분류학을 공부해 감으로써 터득하 게 될 것이다. 여기서 참시 Sokal 과 Snea t h 가 왜 자연성을 지니는 분류군의 개념에서 출발하지 않고 운영분류단위의 사용을 제안하고 있는지 그들의 변을 들어 보도록 하자. Snea th와 Sokal 은 수리분류학에서 분류되는 분류단위는 무엇 일 까라는 질문을 스스로 설정해 놓고 이때 분류되는 단위는 기본적으 로 각각의 생물개체라고 대답하고 있다 (1973, 제 69 쪽). 아러한 견 해는 제 4 장에서 기술한 분류군의 자연성과는 일단은 그 출발에서 큰 차이가 난다. 결국 분류과정 중 언젠가는 아 자연성의 문제에 복귀하여야만 하는 전제 조건하에서만 수리분류학의 출발이 가능하 다. 바로 어 문제에 대해서는 제 12 장에서 다시 논의될 것이므로 일단 〈기본 단위는 개체이다〉라는 문제로 다시 돌아가 보자. Hennig ( 1966, 제 6 쪽)는 분류의 기본단위는 개체이기 이전에 하 나의 생 활사 단계 (sema phoron t라고 표기 됨 ) 라고 보았다. 즉 각 개 체는 그들의 생활사 중 여러 형질을 변화시키며 살아가고 있으므로 바로 어떤 특별한 시기의 형질을 기준으로 보아야 한다고 주장하며 이 러 한 단위 를 〈형 질을 소유하는 생 활사 단계 (characte r beari ng semaph oront) > 라고 표현하고 있다. 다시 말하면 우리가 조사하는
대상은 어쩔 수 없이 하나의 생 활 사 단계에 속한다고 본 것이다. 형질의 판단은 어느 생활사 단계에서 생리, 생태, 형태 를 모두 고 려하여야 한다고 주장하였으며 이 룰 모든 형질의 전체성 (tot a l ity of all characte r s) 또는 전 형 태 (全形態, tot a l form , holomorph ) 라고 표현하였다. 그러나 Sokal 과 Snea t h 는 생활사 단계를 하나의 분류 단위로 보는데 전적으로 동의하지는 않았다. 그들은 분류의 단위를 개체로 보고 이때 개체를 생물의 모든 형질을 포함한다는 의미로 취급한 것이다. 다시 팔·하면, 비록 Sokal 과 Srea t h 가 개체를 분류 단위로 표현하였지만 이때 개체를 생활사 단계의 복합체로 이해하 여야 하며 이러한 의미의 개체가 하나의 단위로 성립되어야만 분류 가 생물학적 의미를 지니게 된다고 할 수 있다. 이제 또하나의 중요한 문제인 〈분류의 단위는 개체이다〉라는 말 을 〈분류의 단위는 분류군이다〉라는 말과 비교해 보자. 지금까지 살펴본 바로는 분류의 단위는 분류군이어야만 한다고 하였다. Sokal 과 Sneath 역시 분류의 단위는 분류군이 어 야 함을 부정 한 것 은 아니다. 분류는 수행할 때 우선 생물 개체를 우리가 대하게 되 므로 일단 분류의 실제 대상이 개체에 지나지 않지만 하나의 단위 로 취급되어야 한다고 하였을 뿐이다. 개체, 분류군, 분류단위, 운 영분류단위를 Sokal 과 Snea t h 가 어 떻게 연결시 키고 있는가 살펴보 자 . Sokal 과 Snea t h 는 일단 Henn ig의 의견을 이용하면서 자신의 분 류단위 문제를 개체로부터 더욱 발전시켜 나갔다. 개체가 하나의 기 본단위 가 될 수 있을까 ? Sokal 과 Sneath 자신도 비 록 분류가 개체에서 출발을 하지만, 개체를 단위로 할 수 없음을 몇몇 이유를 들어 설명하고 있다. 첫째, 개체를 단위로 할 경우, 종 간의 변이 둘 사이에 관계되는 상관성에 대하여는 많은 사실을 밝힐 수 있지 만 속이나 그 이상의 분류군 수준에서의 비교는 쉽지 않다고 보았 다. 뿐만 아니라 개체를 단위로 할 경우, 그 자료의 방대함으로 인 한 계산상의 어려움이 있다고 하였다. 따라서 상위 분류군에서는 개체들의 어떤 평균이 필요하게 되는데, 이를 하나의 단위로 가정 하고자 하였다. 죽 분류를 시행하는 데 개체라는 기본적인 단위보 다 좀더 포괄적인 집합체로서의 단위가 · 필요하다고 본 것이다. 다
시 말하면 기본단위 (fun damenta l un it)보다는 (이 경우는 개체가 기본이므로 개체가 하나의 단위가 될 수 있다. 또는 Henn ig의 생 활사단계도 하나의 단위가 될 수 있다) 포괄적 집합체로서의 〈운영 분류단위 (op e rati on al tax onomi c un it)〉가 필요하다고 그들은 주장 하였다. 물론 이때 운영분류단위는 개체로부터 시작하여 종, 속 등 의 모든 범주를 의미할 수 있다. Sokal 과 Snea th는 운영분류단위의 설정을 장황하게 설명하고 있 으나 결국 운영분류단위란 수리분류학의 과정 중 나타나는 하나의 인위적 단위라고 볼 수 있다. 문제는 이러한 인위적 단위가 어떠한 근거에서 자연성을 가지게 되는가이다. Ma yr (1982) 는 운영분류단 위의 설정 자체를 〈종의 개념을 거부함으로 해서 생물 개체의 서로 다른 부위의 형질이나 서로 다른 성(性, sex), 서로 다른 생활사 의 단계가 독립적으로 조사되어질 수 있고, 이로부터의 유사성에 의해 같은 생물이라 할지라도 부위나 성, 생활사에 따라 서로 다른 운영분류단위로 설정될 수 있는 가능성을 배제하지 못한다〉고까지 혹독하게 비판하고 있으나, 현 단계에서는 계속 수리분류학자의 입 장에 우리의 생각을 고정시키고 수리분류학의 제반 문제에 좀더 접 근해 보려 한다. 6.5 형질의 적정 갯수 분류의 결과가 신빙성을 갖기 위하여는 기술적으로 우리가 몇 개 의 형질을 선택해야 하는가가 문제가 된다. M ic hener 와 Sokal 등 은 최소한 조사하는 형질의 수가 60 개 이상은 돼야 한다고 감히 표 현하고 있으나 이 문제에 대하여 일반적인 적정 수를 제안하는 것 은 불가능하다. 앞에서 지적한 대로 가능한 한 많은 양의 정보에 기초를 둘 경우, 분류의 결과는 더욱 안정될 것 이라는 가정 하에 서 수리분류학의 방법이 출발하므로 가능한 한 많은 형질을 조사해 야 함은 틀림없다. 죽 우리는 이 적정 갯수에 대한 일반적인 해답 울 줄 수는 없으나 이 문제의 기본 골격에 대한 생각을 줄 수 있고
또한 이 문제를 해결하기 위한 지침을 몇몇 원칙에 의해 마련할 수 있다 하겠다. Sokal 과 Snea t h 는 이러한 적정 갯수의 문제에 봉착하여 몇 가지 관점을 유도하고 있다. 예를 들면 표현된 형질이 특정한 유전자와 만 관련이 있지는 않다는 문제로부터 출발하기도 한다. 죽 형태적 으로나, 생리적으로 영향을 미치는, 또는 머리, 몸통, 뼈 등의 생 물의 어떤 특정 부위에 영향을 미치는 유전자가 어떤 무리로서 존 재한다는 사실이다 . 바록 어떤 유전자가 몸의 어느 한 부위나 일정 한 형질에만 주로 영향을 미칠지라도 동시에 몸의 다른 부위나 다 른 형질에도 어느 정도는 영향을 미친다는 것이다. 따라서 모든 형 질이 갇은 의미의 중요성을 가지며, 어떤 예의적인 경우에서 오는 분류의 혼란을 막는 방법은 가능한 한 많은 형질을 조사하는 일이 라고 주장하였다. 필요한 형질의 수를 결정하는 실제적인 방법은 통계적인 방법들 로 예를 들면, 〈점근선〉의 방법이다. 죽 우리가 조사하는 형질의 수를 중가시킬수록 처음에는 중가되는 정보의 양이 많으나, 형질이 추가되는데 따른 정보의 증가는 빠르게 감소할 것이고 어느 일정한 수를 지나면 이 이상의 형질 수의 증가가 무의미할 정도로 어떤 점 근선에 다다르게 된다. 물론 정보 취득의 비율이 분류단위의 성격 울 규정하는 데 불충분한 정도에서 이미 감소하기 시작하는지도 유 의해 보아야 한다. 그러나 이러한 방법들을 통하여 매 대상 종에 따라 형질의 적정 갯수를 검증하기는 어렵다• 실제로는 가능한 한 도 내에서 많은 형질을 대상으로 조사를 하게 되는 경우가 대부분 이다. 6.6 형질의 상대적 중요성 전통 분류학이나 분지론 등에서는 형질의 종류에 따라 그 형질이 갖는 중요도가 다르게 취급된다. 죽 계동을 가장 잘 나타내리라고 생각되는 형질들을 중심으로 분류적 관계를 수립하게 된다 (분류
과정에서조차 반드시 그런 것 은 아니다). 이에 비해 수리분류학에 서는 모든 형질이 동등한 중요성을 갖도록 취급되고 있다. 모든 형 질을 동등하게 취급하는 것은 수리분류학에서 가장 중요한 원리이 다. 수리분류학은 이렇게 각 형질이 갖는 상대적 비중이 동일하다 는 가정 하에서 출발하고 있으므로 이를 정당화시킬 수 있는 이론 적 근거를 마련해야만 한다. 이룰 위해 Snea t h 와 Sokal 이 내세운 몇 가지 주장을 들어 보자. 그들은 우선 자연 분류군은 많은 정보를 가지고 있어야 하므로 이러한 정보를 수집하기 위해서는 분류군의 형질을 많이 조사해야 하는데, 이때 정보의 양이 형질의 종류에 따라 차이가 나지는 않는 다고 보았다. 뿐만 아니라 M ic hener 와 Sokal(1957) 의 〈비록 형질 에 따라 어떤 비중 (we ig h t)을 두는 것이 바람직하다 할지라도 이 때 비중값을 어떻게 배분하느냐 하는데 대한 특별한 방법이 없다〉 라는 주장을 인용하면서 Sokal 과 Snea t h 는 그들의 견해롤 관철하 고자 노력하였다 (we ig h t를 주로 〈평가〉라고 번역하여 사용하고 있 으나 이 책에서는 의미하는 바에 따라 평가, 비중, 가중치 등으로 표현하겠다). 이러한 의견들을 집약하여 Sokal 과 Snea t h(1963) 는 모든 형질을 동등하게 취급하여야 한다는 논리를 다음과 같이 제시하고 있다 (Sokal 과 Sneath 1963, 119-120 쪽) . 1) 대상 형질에 어떤 비중을 두어야 할지 모른다면 이들에게 모 두 같은 비중을 두어야만 한다. 2) 만일 우리가 분류군을 새로이 설정하려 한다면 분류에 사용하 게 될 각 형질에 어떠한 비중을 줄 것인가를 먼저 결정해야만 한다. 그러나 분류군이 존재한다는 선입견을 가지고 미리 기준 울 정할 수는 없는 것이다. 죽 우리가 어떤 특별한 형질을 선 택할 수가 없다. 선택된 형질이 적철한지 알기 위해서는 현재 있지 않는 새로운 분류군이 먼저 설정되어야만 한다. 3) 분류적으로 〈중요성〉이라는 개념은 정확한 뜻을 가지지 못한 다. 만일 중요성이라는 단어가 〈내가 그것에 관심이 있어 중요 하다〉 라고 해석이 된다면 이는 어떤 특정한 이유가 되어 버린
다. 또 만일 중요성이 기초적 또는 기본적 임을 뜻한다면 이는 몇몇 다론 형질들의 합을 뜻하게 된다. 이때 형질들이 알려지 지 않은 것들이면 이는 가상적인 것이고 만일 알려진 것들이면 이는 한 개가 아니라 몇 개이다. 만일 중요성이 생존을 위한 필수조건을 뜻한다면 분류란 어떤 생존성을 측정하는 것이지 유사성을 측정하는 것이 아니다. 만일 중요성이 〈다론 형질들 과의 상호관계〉를 뜻한다면 이는 다른 형질들이 중요하게 취급 되어야만 함을 뜻한다. 그러나 이렇게 되면 상호관계는 다른 형질들에 의해 좌우되므로 원래의 중요성이라는 의미가 없어진 다. 4) 만일 우리가 형질에 따라 서로 다르게 가중치를 주자는 의견 울 수용하려면 이 가중치를 산출할 수 있는 정확한 규칙을 만 둘어야 한다. 죽 깃털을 소유한 사실에 발톱을 소유한 사실보 다 두 배 또는 이십 배 또는 이백 배 중 어떠한 가중치가 주어 져야 할지를 알아야 하고 또한 그 이유를 찾아야만 한다. 바로 여기에 대해서는 어떠한 방법도 우리는 알지 못하며 설령 이에 대한 방법이 개발된다 하더라도 수백 개 형질을 필요로 하는 분류학자들이 이러한 방법을 사용하는데 홍미를 가지게 될지 몹시 의심스럽다. 5) 분류학의 성격은 그 목적에 따라 다르다. 우리는 생물을 여러 방법으로 배열할 수 있는데, 이중에 어떤 목적에 부합되는 한 가지 방법을 택하게 된다. 자연적 또는 공인되는 분류란 여러 방향의 학자에게 일반적으로 사용되도록 시도된 일반적인 배열 이다. 따라서 어떤 한 종류의 형질에 큰 가중치가 주어질 수 없다. 만일 그렇게 되면 이는 일반적 배열이 되지 않는다. 가 중치가 주어지는 것이 분류학자들 자신의 관접 때문인지가 항 상 명확하지는 않지만, 분류학자들 자신의 특별한 발견들과 비 교하기 위해서라도 일반적 배열은 필요하게 된다. 일반적이 된 다는 것은 일반적 목적에는 가장 합당하나 누구에게나 완벽하 다고는 할 수 없다. 6) 〈자연성〉의 속성은 자연군이 가지는 함축된 많은 정보의 양에 기인한다. 가령 젖먹이 동물이라 하면 우리는 당장 아주 확신
울 가지고 이의 구성원에 관해 많은 것을 알 수 있다. 그러나 검은 동물이라 하면 그 동물이 검다는 사실밖에 알지 못한다. 7) 많은 형질을 사용하는 것은 각 형질이 유사지수에 기여하는 정도를 평준화시켜 준다. 따라서 실제로는 이러한 방법아 동일 평가 방법이라 할 수 있다. 위에 인용한 몇몇 관점을 강조하여 Sokal 과 Snea t h 는 원칙적으 로 모든 형질을 동등하게 취급해야 한다고 주장하고 있으며 이러한 방법만이 실제적인 해결법이고 또 우리가 얻고자 하는 자연분류를 가져다 준다고 주장하였다. 제 6 장을 동하여 수리분류학자들은 그들의 분류 이론을 어떤 관 접에서 구축하고 있는가를 살펴보았다고 생각한다. 분류학에 엄연 히 존재하는 자연분류군의 개념을 무너뜨리지 않으면서, 분류군을 인식하는 데 겪고 있는 우리의 어려움을 해결하기 위해 수리분류학 자들이 많은 노력을 기울였음을 알았다. 특히 수리분류학에서의 분 류적 형질의 성격이나 형질의 유사성에 대한 논의를 통하여 형질의 단위에 대한 기준을 정리할 수 있었고 형질의 중요도를 형질의 종 류에 관계없이 동등하게 취급하고자 한 수리분류학자들의 의도를 파악할 수 있었다. 이러한 과정을 통하여 우리가 알 수 있었던 것 은 수리분류학자들이 분류의 원칙을 비중을 두지 않는 형질의 선택 이나 가능한 한 많은 형질에서 유도되는 전유사성에 두었다는 사실 이다. 이제 전유사성에 의하여 도출되는 분류군이 가장 일반적인 분류군, 죽 자연 분류군이라는 그들의 주장을 어떻게 받아들일 것 인가를 우리는 생각하여야만 한다. 수리분류학자들이 전개한 논리 를 비판하기 위해서는 우선 수리분류학의 구체적인 방법론을 이해 하여야만 할 것이다. 이 책의 제 7 장부터 제 11 장까지는 바로 수리 분류학의 방법론을 다루고 있다. 이 부분에서 쓰여진 수리분류학적 방법의 과정을 이해한 후 수리분류학자들이 주장한 분류의 원칙에 대한 타당성을 검토해 보고자 한다.
제 7 장 분류적 유사성의 계산 지금까지 우리는 수리분류학이 가지는 특칭과 수리분류학을 위하 여 쓰이는 방법들의 원칙, 특히 분류하고자 하는 대상 생물의 형질 의 선택기준 등에 대해서 알아보았다. 이 장에서는 이러한 원칙 아 래서 수리분류학이 실제로 어떤 계산과정울 통하여 이루어지고 있 는 가를 살펴보려고 한다. 일반적으로 수리분류학에서 사용되는 방법들은 통계학의 범주에 속한다고 하겠으나 통계학 교과서에 소개되는 내용과는 그 범위가 다르다. 죽 수리분류학자들은 중간값, 표준편차, 확률 검정, 회귀 분석 등 전통적으로 통계학에서 사용되는 기술통계의 방법들을 이 용한다기 보다는 집 괴 분석 (集魂分析, cluste r analys i s ) 이 나 배 열법 (配列法, ordin a ti on ) 등 수리 적 분류를 위 해 경 우에 맞게 개 발된 방법들을 이용하고 있다. 그럼에도 불구하고 이룰 통계학의 범주에 속한다고 생각하는 이유는 이들 방법들도 기술통계학(記述統計學, descri ptive s t a ti s tic s) 의 성격을 가지며 이로 인하여 최근에 발간 되는 통계학 책에서까지 소개하고 있기 때문이다. 그러나 이 방법 둘의 계산 원칙은 지극히 산술적인 단계를 벗어나지 못하고 있으며 대개의 경우, 수학적으로 전개되는 공리나 정의 등의 단계롤 거치 는 논리적 체계를 정립하고 있지도 못하다. 이들 방법들에 대하여
는 여러 사람에 의해, 각 경우에 따라 적합한 공식이 제안되고 있 어 그 과정도 매우 다양하다. 따라서 수리분류학이 객관성을 추구 하는 데 목적을 두고 있으면서도 방법론상의 다양성으로 인하여 본 래의 목적에서 다시 벗어나는 결과를 가져올 위험성을 지니고 있다 고 본다. 어떻든 이러한 문제는 제 12 장에서 다시 논의하고자 한다. 그러면 이제부터 수리분류학에서 쓰이는 방법들은 어떤 것이 있 고 동시에 어떤 과정을 통하여 실행되는지 구체적으로 살펴보자. 독자의 이해를 돕기 위하여 가능한한 쉽게 기술하려고 노력하였다. 또 계산예들을 제시하여 계산과정때 생기는 착오를 방지하고 계산 과정을 이해하는데 도움을 주도록 하였다. 7.1 자료의 종류 우리가 자연 현상에서 얻는 자료는 기재(記載)에 의한 것일 수도 있고 수리적인 것일 수도 있다. 수리적 자료의 경우는 다시 크게 두 가지로 대별된다. 첫째는 각 대상(對象, ob j ec t)에 있어서 어떤 속성 (屬性, att rib u te , pro p e rty ) 이 나타나는가 안 나타나는가 (有 無)의 문제만을 취급하는 정성자료와 둘째는, 이러한 속성이 나타 날 경우, 그 속성의 상태가 정도의 차이에 의한 수치로서 나타나는 정량자료이다. 속성이란 용어는 대상물의 성질을 나타낸다는 일반 적인 의미에서 사용하였다. 그러나 속성을 생물 분류학에 적용한다 면 지금까지 사용한 술어인 형질이라는 말로 대치될 것이다. 이 장 에서는 일단 형질이이라는 술어 대신에 속성이라는 술어를 사용하 고자 한다. 이는 이 장에서 취급하고자 하는 유사 지수가 이미 통 계학 분야에서 주로 취급되어 왔으므로, 분류학에서 쓰이는 분류군 및 형질이라는 술어를 대상 및 속성으로 표기하여, 이 장에서 소개 되는 방법들이 분류학에 한정되지 않고 일반적인 의미를 가지도록 하기 위함이다. 정성, 정량 자료를 좀더 구체적으로 설명하고 이 자료를 기본으 로 수리적 분류의 방법을 소개하기 위해 우선 우리가 가전 자료롤
도표화한다고 가정해 보자. 이때 자료는 정성의 성격을 가지건 정 량의 성격을 가지건 자료행렬 (資料行J 1 J, dat a mat ri x ) 이라는 형 식으로 표로써 정리된다. 자료 행렬의 예가 아래에서 보여주는 행 렬 (1) 이다.
소-, Ao대 1 상 x1 X2 x3 ... x, X J ... Xn ...l X... u X...1 2 X...1 3 ... X...u X..• u .. . X...1 n Nk... XX...kN 1I X.X..Nk 22 XX...Nk 33 ...... XX...Nk lI XX...Nk J 』 .... .. X...XNk nn (1)
이 때 조사되어지는 대상은 열 (~1J , colwnn), 이들의 속성은 행 (行, row) 으로써 표시되는 것이 생물분류학에서 쓰이는 일반적인 관례이므로 여기서도 이 방법에 준했다. 따라서 (1) 에서 제시된 행 렬 자료에 의한다면, 대상의 수는 n 개이고 이들 대상에서 N 개의 속성이 조사되었다고 할 수 있다. 이러한 자료 행렬을 XN,n 으로 표시한다. 분류자료 형렬로 이용하려면 대상란에 운영분류단위를 속성란에 분류적 형질을 기록하면 된다. 그러면 이러한 자료 행렬 에 기록되는 정성 내지 정량 자료란 무엇인지 좀더 살펴보자. 7.I .I 정성자료 정성자료란 생물 형질울 예로 든다면 이들 형질이 두 가지 상태 로 표현되는 경우로서, 각 형질의 소유 여부에 따라 유무(有無)만 을 판정하는 것으로 +와 —, 혹은 l 과 0 등의 기호로서 형질 상태 룰 표시한다. 물론 이때 생물의 어떤 형질이 정성자료의 범주에 해 당될 것인가를 판정하는 것은 쉬운 문제가 아니다.
Snea t h 는 정성자료란, 생물의 어떤 형질이 단 한 가지의 상태만 으로 표현될 수 있어 이때 제공되는 정보가 한 가지로만 규정될 때 이러한 형질에서 취해지는 자료를 정성자료라고 하였다. 예를 들면 어떤 박태리아가 그람 염색액에 염색이 되는가 안 되는가, 어떤 식 물의 꽃의 색깔이 붉은 색을 띠고 있는가 안 띠고 있는가, 또는 생 태학에서 어떤 종이 특정지역에 출현하고 있는가 출현하고 있지 않 는가 등의 문제들은 모두 정성자료의 성격을 가진 형질들이라 할 수 있다. 또한 이러한 정성적 자료의 성격이 사회학에서 취급하게 될 문제의 하나인 교동사고의 유형에 대한 문제라면, 사망자가 있 었는가, 희생자가 횡단자인가, 사건은 횡단보도에서 일어 났는가, 운전자는 술을 마신 상태인가 등 〈예〉, 〈아니오〉로 대답될 수 있는 유형의 자료에 대한 결과들이 정성자료이다. 이러한 예를 (1) 에서 나타낸 형식에 의해 표기하면 행렬 (2) 와 같다.
대상 소-, A0구 X1 X2 x3 x. Xs 1 1 1 。 1 。 2 。 1 1 。 1 3 1 1 1 1 。 4 1 。 。 1 1 5 1 1 1 1 。 (2) 6 1 I 。 1 1 7 。。 1 。 1 8 1 。 1 1 1 9 。。 。 1 1 10 1 1 。 1 1
7.1 .2 정량자료 정량자료란 속성의 상태가 숫자에 의해 양적으로 표현된 자료를 말한다. 예를 둘어 어떤 식물을 대상으로 하여 잎의 길이, 잎의 넓 이, 잎맥이나 기공의 수, 염색체의 수 등을 조사하였다면 이러한 결과를 정량자료라고 할 수 있다. 그 밖에 생태학의 분야에서 예를
든다면 여러 조사 정점에서의 물리화학적 환경요인이나 생물의 현 존량 등이 정량자료로 표시될 수 있고, 또한 사회과학 분야 등에서 도 대부분의 자료가 이러한 형태로 취해진다고 하겠다. 정량자료는 그 값의 성격이나 혹은 최소, 최대값의 현격한 차이 때 문에 그 값을 직 접 사용하지 못하고 전이 (轉移, tra nsfo rm a- ti on) 시켜야만 하는 경우도 있다. 예를 들면 어떤 속성의 값이 1, 10, 100, 10,000 등으로 나타난다면 이들을 상용대수에 근거해서 0, 1, 2, 4 등으로 전이시키게 된다. 물론 통계학에서 사용되는 표 준화(標準化, sta n dardiz a ti on ) 방법에 의해 이들 값을 조절할 수 도 있다. 그러나 표준화 작업은 각각의 속성이 서로 다른 단위에 의해 측정되어 각 속성간의 값이 매우 다론 범위를 나타날 때 이를 평준화하기 위해 시행되므로, 위의 경우와 갇이 특정한 속성의 값 이 심한 격차를 보인다고 하여 이를 표준화시키지는 못한다고 하겠 다. 상용대수나 그 밖에 임의적인 계수를 사용하여 값을 조정하는 것 울 Sokal 과 Snea t h(1973) 는 형질의 중요도평가 (we ig h ting)의 범주 에 집어넣고 있으며 불가피한 경우에 한하여 이를 허락하고 있다. 그러나 생태학 분야의 많은 결과들은 종의 특성으로 인하여 지역에 따라 대단히 큰 출현 개체수나 현존량의 차이롤 나타내곤 한다. 또 한 심한 경우는 어떤 한 지역에서만 많이 출현하고 그 밖의 모든 지역에서는 전혀 출현하지 않는 경우도 있어 이 자료를 표준화시키 기기조차 어려운 경우가 있다. 이러한 상황에서는 표준화 과정을 넘어서 단순히 출현 여부만을 기술하여 정성자료로 환원하여야 한 다고까지 말해진다. 따라서 정량자료라 할지라도 자료의 성격이나 각 속성의 상태에 따라 정성자료로 변형이 가능하다고 본다.
7.2 유사도의 계산 7.2.1 유사지수 및 거리지수 위에서 제시한 자료를 중심으로 우리가 시행하여야 할 다음 단계 의 작업은 유사도의 계산이다. 유사도는 지금부터 소개되는 몇몇 저자에 의한 유사지수 공식으로부터 계산된다. 영어권에서의 simil ar ity라는 용어롤 앞 장에서 유사성 (類似性)으로 번 역 하여 사 용한 바 있으나, s i m il ar ity가 유사정도를 나타낼 경우는 유사도 (類 似度)라고 하였다. 또 구체적으로 유사도가 공식으로 표현되거나 공식으로 부터 계산된 값들일 경우, 죽 sim ilar i ty i ndex 의 의미가 강할 경우는 유사지수(類似指數)라고 하였다. 물론 유사도가 유사 지수의 의미까지 포함하고 있기는 하나 유사도가 구체적인 값을 가 질 경우 지수라는 단어를 사용하였다. 이러한 원칙에 따르면 dis t a n ce i ndex 는 거 리 지수 (距離指數) 가 될 것 이 다. coe ffi c i en t는 계수 (係數) 로 번 역 하였다. 지 수와 계 수의 의 미 상의 차이를 보면 계수는 곱해지는 수를 나타내며, 지수는 상대적인 상 태 또는 정도를 나타내는 수라고 할 수 있으므로 각 상황에 따라 유사지수, 거리계수, 조합계수 등으로 구분해서 서술해야 되는 경 우가 많았다.지수 또는 계수에 대한 술어를 정리하는 것이 어려웠 지만 그 의미하는 바와 영어권에서 사용되는 관습을 따라 술어를 정하였다. 그러나 지수 또는 계수 모두가 유사도를 나타내는 의미 로 사용되고 있으므로 유사계수 또는 유사지수 모두 통용될 수 있 는 술어라고 생각한다. 수리분류학에서는 유사지수가 운영분류단위 사이의 분류적 유사성을 숫자로 나타낸 것이라고 볼 수 있다. 유사도를 값으로 나타내는 방법은 이미 통계학에서 찰 설명되어 있다• 그러나 수리분류학자들은 그들이 사용하는 유사지수를 통계 학에서 칙접 인용하는 경우는 많지않고 그들 나름대로 독창적인 방 법을 이용하여 수리분류학에서 제시되는 자료를 처리할 수 있도록
고안해 놓았다. 그러나 이러한 독창적인 방법이라 할지라도 통계학 에서 사용되는 유사지수의 산정 원칙이 고수되어야 함은 당연하다. 유사지수가 어떤 절대적 유사값을 나타낸다고는 보지 않는다. 죽 서로 다론 생물군에서 각각의 유사지수가 동일하게 나타났다고 해 서 이들 생물군의 유사 정도가 동일하다고는 볼 수 없다. 이들은 단순히 분류적 비교를 위해 특별히 선택된 형질을 중심으로 측정되 었기 때문이다. 수리분류학자는 어떤 철대적 값에 근접하기 위하여 가능한 한 많은 형질을 비교하여 전유사성을 측정하고자 노력하고 있을 따름이다. 수리분류학에서 사용하는 유사지수들이, 신뢰도를 이용하여 검정 할 수 있는 확률론을 근거로 한 통계적인 것인가, 아니면 단순히 사실을 숫자로 기술한 주관적인 것인가도 문제가 된다. 수리분류학 울 옹호하는 입장에서 보면 수리분류학에서 사용하는 유사지수는 아마도 이 둘의 중간적 성격을 가진다고 하겠다. 유사지수가 많은 형질에 기초를 두기만 한다면 유사지수 자체 역시 일반적 의미의 신뢰도를 논할 수 있기 때문이다. 어떻든 유사지수의 이론적 신뢰 성 문제에 관심을 가전 독자는 Snea t h 와 Sokal(l973) 의 제 4.10 장 을 참고하기 바라고 여기서는 다음 문제로 넘어가고자 한다. 일반적으로 수리분류학에서 사용되는 유사지수는 크게 네 가지 종류로 나뉜다. 첫째는 동계학에서 많이 쓰이는 상관계수(相關係 數, correlati on coeff icien t) 를 그대 로 이 용한 유사지 수이 다. 자료 행렬 (1) 을 예로 들어 표시하면 tN (xk1-X,) (xkJ- Xi) rlJ = mk= l _ n (3) ~ (xk1-Xi ) 2!!(xki- Xi) 2 k=l l=l 가 된다. 이때 X j=\홀I XkI, Xj =\tXkJ 이다. 죽 어떤 두 대상 X 와 X 강의 유사성은 둘 사이의 표준편차의 관계로서 나타나 있 다. 이는 대부분 정량자료를 대상으로 했을 경우에 주로 사용하는 유사지수로서 이 상관계수에 관한 제반 이론은 통계학 교과서에 취 급하고 있으므로 여기서는 생략한다.
이 상관계수가 수리분류학에서 사용되기 시작한 것은 Mi ch ener 와 Sokal(1957) 에 의해서였고 이후 식물분류학, 동물분류학, 생태 학 등에서 빈번히 이용되고 있다. 또한 Kershaw(1964) 등이 식물 군집을 분류하는데 사용하기도 했으며 동물의 분포를 논하는 데도 사용되고 있다. 이 유사지수의 특칭은 후술할 정성자료롤 대상으로 한 J accard 지수 등과는 달리 그 값 자체가 +1 에서 -l 의 범위를 가지고 있다. 이때 -1 이란 관계가 있기는 하나 이 관계가 역관계 임을 뜻하는 반면 0 은 전혀 관계가 없음을 나타낸다. 수리분류학에서 사용되는 유사지수의 두번째 예는 거리계수 (距 離係數, dis t a n ce coeff icien t) 이 다. 거 리 계 수는 각 대 상이 가지 는 정량적인 값들에 의해 각 대상이 공간상의 한 점으로 나타나므로 점과 점 간의 거리를 산출한 값으로 대부분 삼각형의 빗금 길이를 구하는 방법에 의해서 구한다. 이러한 연유로 인하여 이룰 유클리 드 거리계수라 하기도 한다. 거리계수의 유도과정을 Sokal 과 Snea th가 도시한 예에 의해 참시 설명하면 다음과 같다. 예를 들어 a, b, c 의 대상을 아래 그림 7.1 과 같이 2 차원 상에 나 타낸다면 이때 a, b 사이의 거리는 삼각형의 빗금거리를 구하는 공 식에 의해 구해질 수 있다. 죽 dt b= (Xa-Xb) 2+ (ya -Yb)2 (4) 으로 표시된다. 윗식을 일반식으로 나타내는 . 동시에 이때 우리가 구하고자 하는 거리계수를 행렬 (1) 에 의해 대상 XI 와 Xj 사이에서 구하는 것으로 나타낸다면 du = {~N (xk1 -XkJ) 가+ (5) k=l 이러한 유클리드 기하에 의한 거리의 계산 이외에 거리계수를 유 사성 과는 반대 되는 개 념 의 비유사도 (非類似度, dis s im i lar i ty) 로 해 석하여 사용하는 경우도 빈번하다. 어떠한 종류의 유사지수라 하더 라도 이를 환산하여 비유사도를 나타내는 지수로 사용할 수가 있 다. 이때 이러한 비유사도의 지수 역시 거리지수의 범주에 집어넣 으며 일반적으로
d=l-s (6) 의 형식을 빌어 표기한다. 이때 s 란 유사지수를 나타낸다.
Y
수리 분류학에 서 사용하는 또다른 유사지 수는 Goodall (1966) 등 이 정성적 자료를 중심으로 사용한 확률론에 기초를 둔 유사지수를 들 수 있겠다. 이는 특히 식물군집학자 (예를 들면 Orlo ci)들에 의 해 많이 사용되고 있는 바 〈정보이론〉에 그 근거를 두고 있는 것으 로 H1 = 철l P1 g ln P1g (7) 로서 표시된다. 윗식의 유도과정을 모두 소개하는 것은 매우 복잡 한 일이므로 여기에서는 생략한다. 단, 위의 식이 나타내는 뜻은 어떤 형질에서의 정보의 양의 합이 형질에서의 각 상태를 전체에 대한 부분으로 환산하여 더한 값이라고 할 수 있다. 실제로 수리분류학에서 가장 많이 사용되는 유사지수는 그러나 다음에 소개하는 지수로서 Snea t h 와 Sokal 은 이를 조합계수(組合 係數, assoc iat i on coeff icien t) 라고 칭 하였 다. 이 때 조합이 란 단어
는 원래 통계학에서 사용되는 카이제곱 (x2) 검정에 관한 술어이 다. 이 책에서는 이를 조합이라고 번역하여 사용하고자 하나 실제 내용상으로 본다면 조합이라는 말보다는 우연성이라는 말이 타당하 다 하겠다. 왜냐하면 통계학에서 보면 2X2 도표에서 이러한 카이 제곱의 값을 구한 이유는 현재 2X2 도표 내에 기재된 값(관찰값) 이 우연에 의한 것인가 아니면 필연적인 아유가 있어서인가를 검정 하는 기준으로 사용되기 때문이다. Snea t h 와 Sokal 이 조합계수라 고 명한 것은 검정과는 전혀 관계가 없고 다만 카이제곱 값을 구하 는 2X2 도표의 작성이나 조합계수의 값 계산법이 카이제곱 값의 계산법과 유사하기 때문인 것으로 생각된다. 어떻든 동계학에서 사용되는 이러한 기본 입장을 이해하고 조합 계수가 나타내고자 하는 것이 무엇인가롤 상세히 알아보고자 한다. 수리분류학에서 아주 많이 쓰이는 유사지수들이 대체로 이 조합계 수의 일종이다. 특하 정성자료를 대상으로 할 경우는 대부분 이 유 사지수에 의해 계산하는 것이 일반적인 추세이다. 따라서 조합계수 에 대한 항목을 하나의 독립된 장으로 취급하고 또 실제 예도 제공 하여 계산법을 상세히 소개하고자 한다. 7.2.2 조합계수법에 의한 분류적 유사지수 조합계수는 어떤 두 대상 사이에, 형질의 상태가 서로 일치되는 형질이 얼마나 많은가에 따라 결정되록 기준이 정해져 있다. 조합 계수는 정성자료를 토대로 하는것이 대부분이다. 정성자료란 어떤 형질이 〈유〉, 〈무〉 내지는 〈예〉, 〈아니오〉로 대답될 수 있는 성격의 자료이다. 만일 어느 두 대상이, 서로 같은 형질을 많이 소유 (이 때 소유란 〈유〉 또는 〈예〉로 대답되는 경우를 말한다) 하고 있다면 이 두 대상은 매우 유사하다고 할 수 있다. 이때 유사의 정도는 소 유되는 형질의 수가 많이 일치할수록 크고 일치되는 형질의 수가 적을수록 그 유사도는 적다고 할 수 있다. 수리분류학에서 정성자 료에 의한 유사도 산출은 대부분 이러한 원칙에 의거하여 실시되고 있다 (J accard 지수, S imp son 지수, Sokal 과 Snea t h 지수 등). 그러 나 이때 어떤 형질을 소유한 사실만을 중시하지 않을 수 도 있다.
어떤 형질을 소유하지 못한 사실이 다른 대상에서도 나타난다면 이 대상은 그 형질을 소유하지 않고 있다는 면에서는 일치하고 있기 때문이다. 그러므로 어떤 저자들은 이들 〈아니오〉로 대답될 수 있 는 형질이라 할지라도 〈아니오〉로 나타난 형질의 일치, 불일치의 정도를 유사지수의 크기에 고려하여야 한다고 주장하였다. 조합계수의 성격을 가지는 유사지수 산출은 그 원칙이나 과정 자 체는 간단하다 할지라도 조사대상에 따라 우리가 얻게 되는 자료의 성격이 다르기 때문에 산출 방법이 다양하다. 저자에 따른 여러 방 법들을 통합하여 S t e i nhausen 과 Lan g er(1977) 는 다음과 갇은 일반 식을 제안하였다. S1J =a+ada++/3ad( b +c) (8) 이 식은 a 및 /3값이 견해에 따라 0 과 1 이 선택되도록 구성되어 있 다·· 아래에 각 저자에 따른 유사지수의 산출방법 및 실제 예를 제 시한다. 비교하고자 하는 대상을 XI, X J라고 하자. 유사지수를 산출하기 위해서는 우선 비교되는 대상의 형질의 일치하는 빈도는 얼마인가, 일치하지 않는 빈도는 얼마인가를 알아야 한다. 이때 +또는 1 로서 표시되는, 〈예〉라는 성격으로 표현되는 형질이 일치되는 빈도수를 au, !_ 혹은 0 으로 표시되는, 〈아니오〉라는 성격을 가진 형질이 일 치되는 빈도수를 du 라 하자. 또한 X1 에서는 +이나 X1 에서는 -로 나타나는 형질의 빈도를 bu, X JoJ]서는 -이나 X1 에서는 +로 나타 나는 빈도를 Cu 라하자. 이들 값은 통계학에서 흔히 다음과 갇은 2X2 도표로 나타낸다. x, l 。 XJ 10 au bIJdIJ (9) Cu 예를 들어 (2) 의 정성자료로부터 X1 과 X2 의 대상을 비교한다면,
X1 1 。 X2 10 52 12 (10) 의 값을 얻게 된다. 이때 X, 와 X 자의 유사지수를 Su 라 하면 이 Su 는 앞에서 설명한 대로 au, bu, Cu, du 의 값으로부터 얻어지나, 이때 저자에 따라 a, b, c, d 값 중 어떤 값을 중요시하는가에 대한 관점이 다르다. 저자 에 따른 이런 차이룰 취급하기 이전에 이들 유사지수의 계산을 편 리하게 하기 위한 전단계로 a, b, c, d 의 값을 행렬로써 일단 정리 해 보자. 우리는 앞의 예에서처럼 두 개의 대상만을 취급하는 경우 는 없고 일반적으로 n 개의 대상을 취급하고 있으므로 이때의 각 au, bu, cu, du 값을 n 개 의 대 상으로부터 모두 구해 행 렬 형 식으로 나타내고 이로부터 유사지수를 구하는 것이 편리하다. (2) 의 예로 부터 au 의 값을 구해 행렬로 나타낸다면 아래와 갇다. X1 X2 x3 x4 x6 X1 7 5 3 7 4 X2 5 6 3 5 3 x3 3 3 5 3 3 :A (11) x. 7 5 3 8 5 x5 4 3 3 5 7 A 는 두 대상 모두에서 +로 나타나는 형질의 수인 a 값을 n 개 대 상에 대하여 구한 행렬로써 자료 (2) 로부터 값을 구하여 행렬 A 에 서 첫째 열부터 살펴본다면 X1, X2 대상 간의 a12 값은 5, X1 및 x3 대상 간의 a13 값은 3, X1 및 X4 의 a 값은 7, X1 및 a15 값은 4 임을 알 수 있다. 이와 마찬가지 방법으로 (2) 의 예로부터 bu, cu, d tJ의 값을 구한 예를 제시하면 아래와 갇다. X1 X2 x3 x4 x5 X1 。 2 4 。 3 X2 2 。 3 1 3 x3 4 3 。 2 2 :B (12)
xx5. 。3 13 22 。3 3。 X1 X2 x3 x. x5 X1 。 1 2 1 3 xXxx352. 2131 。234 254。 322 。244 : C (13) 。 XI X2 x3 x. Xs X1 3 2 1 2 。 Xxxx532. 122。 142。 251 2。1。 1。3 : D (14) 。 。 그러면 이렇게 계산된 au, bu, cu, du 의 값으로부터 유사지수 Su 롤 구하는 방법은 어떤 것이 있나롤 살펴보자• 현재까지 문헌상에 소개되고 있는 유사지수의 산출범은 저자에 따라 그 방법이 다르므 로 실제 이를 이용하는 사람에게 혼란을 가져올 수도 있다. 그러나 유사지수란 원래 비교하려는 대상이 얼마나 그 속성들이 비슷한가 를 나타내는 정도이므로, 위에서 계산된 au, bu, cu, du 의 값 중 어 느 값에 비중을 두어 유사지수를 계산하는가 하는 견해가 다를 뿐 이다. 이때 비중이란 형질의 중요도를 평가한다는 의미는 아니다. 수리분류학에서 주장하는 원리는 모든 형질을 동일하게 취급하자는 것이다. 따라서 수리분류학에서 사용하는 이러한 방법들을 형질 비 평가 방법이라고 부른다. 그러나 조합계수의 계산에서 쓰이는 비중 이라는 단어는 형질의 〈상태〉에 대한 값을 그 중요도를 달리 하자 는 의미로 사용되었다. 죽 두 대상 모두에서 +로서 대답된 a 값 에 비중을 두느냐, 아니면 bu 나 Cu 값에 비중을 두느냐, 또는 du 값 에 비중을 두느냐 등이다. 유사지수의 산출 방법중 문헌상에서 사용 빈도수가 높은 방법 10 가지를 택하여 표 7.1 에 나타내었다. 표 7.1 은 S t e i nhausen 과 Lang e r(1977) 및 Sokal 과 Snea th (l973) 에서 소개된 유사지수 산
출의 방법을 다시 요약한 것이다. aIJ, bIJ, Cu, du 를 각각 a, b, c, d 로 약기하였다. 표 7.1 조합계수 방법을 근거로 한 유사지수 산출식의 예 (1) Jac card; (6) Tanim oto ; a a+d a+b+c a+2(b+c) +d (2) Sim a p+ lde matc h in g ; (7) aYdu— leb;e a+b+c+d ad+bc (3) Di ce ; (8) Sokal and Sneath ; 2a a 2a+b+c a+2(b+c) (4) Sim ps on; (9) Sokal and Sneath ; a 2(a+d) a+b 2(a+d) +b+c (5) Phi- c oeff iacdie—n tb; e (10) Hamann; (a+d) 一 (b+c) (a+b) (a+c) (b+d) (c+d) a+b+c+d 위에서 나열된 유사지수 산출식 중 가장 빈번히 사용되는 것은 J accard 지수이다. 이 지수는 이 미 1908 년에 식물의 분포를 논하는 데 사용되 었고 그후 Sneath (1 9 57) 에 의 해 본격 적으로 사용되 기 시 작한 것으로 b+c 의 값이 0 에 가까울수록 유사지수의 값 s 는 커지 고 a/b+c 의 값이 0 에 가까워질수록 적어지며 s 값의 상 하한치는 l 및 0 이다. Di ce(l945) 지수는 J accard 지수와 그 원칙이 동일하나 어느 형질이 +로서 일치하는 사실에 중요성을 부여하여 이를 2 배 한 것이다. 어느 형질이 일치하지 않는 경우를 강조하는 저자 (Sokal 과 Snea th)도 있다. 또한 d 값을 어떻게 취급하는 가에도 저 자에 따라 서로 다른 견해를 보인다. 이 d 값도 a 값과 동일하게 비 중을 두는 Snea t h 에 의한 단순결합 유사지수가 있다. 그 밖에 Yule 이나 Ro g ers 와 Tanim oto ( 1960) 등은 비록 어떤 형질이 -의 성격을 갖는다 하여도 이 형질들이 두 대상 간에 일치할 경우는 그 중요성이 고려되어야 한다고 하였다. 여기서 위에서 소개된 여러 유사지수의 산출범을 일례를 들어 설
명해 보자. 만일 우리가 J accard 지수를 취한다면 표 7.1 의 (1)에 의해 SI J= a lJ +bauIJ+ c, 』 이므로 X2, X3 의 대상을 비교한다고 가정하면, 죽 i= 2, j =3 이라 면 S23= a23 + ba2233 + c23 이다. 따라서 이 값을 (11), (12), (13), (14) 의 행렬에서 취하면 a23=3, b23=3, C23=2 이므로 S23= 3+33 +2 의 값을 얻는다. 죽 X2, X3 간의 유사지수는 J accard 지수를 사용 할 경우, 0.375 라 할 수 있다. x2, x3 간의 유사지수뿐만 아니라 x1, …X 5 간의 모든 유사지수를 구한다면 이는 아래와 같은 행렬 S 로 나타내진다. 이때 행렬 S 를 유사지수행렬(類似指數行列, sim i lar it y ind ex matr ix) 이 라 한다. X1 X2 x3 X4 x5 X1 1 0.625 0.333 0.875 0.400 X2 1 0.375 0.556 0.300 x3 1 0.300 0.333 :S (15 ) x. 1 0.5 0 0 x5 1 지금까지 수리분류학에서 쓰이는 유사지수에는 어떤 것이 있는 가를 알아보고 흔히 사용되는 조합계수롤 중심으로 실제 계산 예를 제시해 보았다. 수리분류학적 과정이 바로 운영분류단위 간의 유사 성이 수리적으로 표현된 유사지수로부터 출발하므로, 유사성이 무 엇인가 하는 분류학적 고찰도 필요하지만, 유사지수를 실제로 계산 할 수도 있어야 한다. 이러한 의미에서 몇몇 예를 위에서 제시한
것이다. 위에서 제시한 유사지수의 산출과정에서 우리가 생각해야 할 중 요한 문제는 유사지수 자체가 매우 다양하다는 것이다. 죽 어떤 유 사지수를 사용하는가에 따라 분류의 결과가 달라질 수 있다는 사실 이다. 이러한 다양성은 유사지수의 산출과정에서 뿐만 아니라 다음 장에서 소개되는 집괴분석 과정에서도 보여진다. 수리분류학에서 주장하는 것이 객관성이라면 계산 과정중의 다양성은 객관성을 주 장하는 데 어떤 모순점으로 등장하지는 않을까 하는 의문이 제기된 다고 하겠다. 바로 이 점이 수리분류학이 해결해야 할 또 하나의 과제이다. 이 문제에 관하여는 일단 수리적 과정의 소개가 다 끝난 제 12 장에서 취급하고자 한다.
제 8 장 운영분류단위의 체계적 배열 지금까지 소개한 유사지수는 각 대상간의 유사 정도를 잘 나타내 긴 하나, 이들 유사지수는 단순히 2 개의 대상만을 선택하여 서로간 의 유사성을 비교하도록 되어 있다. 따라서 유사지수가 직접, 모든 대상이 서로 어떤 동질성에 의해 유기적 관계를 가지며 분류될 수 있는가에 대한 해답은 주고 있지 못하다. 그러나 우리는 모든 대상 이 서로 간에 어떤 관계에 놓여 있는가를 총체적으로 알기 원한다. 죽 n 개의 대상에서, 각 대상끼리의 유사 정도뿐만 아니라 이 n 개 의 대상을 몇 개의 무리로 나눌 수 있는가, 또는 이 때 몇 개의 무 리로 나뉘어지는 대상의 구성원은 누구인가 등을 알고자 한다. 이러한 시도를 분류학적 의미를 가미하여 해석하자면, 이는 바로 운영분류단위로부터 분류 체계를 어떻게 수립하는가 하는 문제와 동일하다고 볼 수 있다. 죽 운영분류단위를 유사성에 근거하여 몇 개의 무리로 묶어야 하며 또한 이를 기준으로 분류 체계를 어떻게 구성하는가 하는 문제라 하겠다. 이러한 과정은 두 가지 의미에서 중요하다고 볼 수 있다. 첫째는 우리가 모든 대상이, 서로 간에 어 떤 관계에 놓여 있는가를 알고자 함에도 불구하고 유사지수행렬로 부터 모든 대상의 상호관계를 아는 것이 불가능하기 때문이며, 둘 째는 모든 대상의 유사성만을 나열하는 것은 분류학적으로 어떤 의
미를 가지지 못하기 때문이다. 이러한 점에서 운영분류단위들은 일 단 체계있게 배열되어야만 한다. 일반적으로 이러한 체계의 수립은 몇몇 이접을 가져온다. 많은 생물 내지 분류군의 모든 형질이 기억되기도 어렵고 이들 모두의 목록이 작성될 수도 없다. 그러나 이렇게 많은 생물 또는 분류군들 이 체계적으로 배열된다면, 어느 특정한 방향으로 일정한 양상을 나타내는 형질을 소유하는 작은 몇몇 무리로 나뉘어짐으로 해서 기 억하기 쉽고 또한 어떤 예견성까지도 가질 수 있다. 이때의 예견성 이란, 나뉘어진 작은 무리들이 어느 일정한 방향의 형질을 소유하 게 되기 때문에 여기에서 유추되는 방향성 있는 속성으로 인하여 생긴다고 할 수 있다. 그러나 무엇보다도 중요한 것은 우리는 운영 분류단위의 체계 있는 배열을 통하여 분류적 체계를 수립하고자 하 는 것이라 하겠다. 우리가 구성할 수 있는 분류 체계는 목적하는 바에 따라 여러 가 지가 될 수 있다. 우리는 〈자연적〉 체계를 원하고 있고 따라서 유 사행렬로부터 수립되는 체계는 자연적이어야 하는 필연성을 가전 다. 그러나 유사행렬로부터 유도되는 운영분류단위에 대한 체계가 과연 자연적일 수 있는가가 문제가 된다. 이는 바로 유사지수란 무 엇인가 라는 문제와 함께 수리분류학이 해결해야 할 〈자연성〉에 대 한 가장 심각한 문제이다. 어떻든 이러한 체계의 자연성을 제의하 고라도 우리가 살펴보아야 할 중요한 문제는 어떻게 이러한 체계를 구성하는가에 대한 방법론적인 문제이다. 이에 대한 명확한 해답과 그 배경을 이해하고 난 후에야 우리는 비로소 자연성에 대한 문제 로 돌아갈수 있겠다. 일반적으로 수리분류학에서 쓰여 온 체계의 수립 방법들은 몇몇 가지가 있다. 예를 들면, 어느 일정 수준 이상의 유사도를 행렬표 에서 검게 칠하는 방법을 쓰기도 한다. 그러나 이는 유사 정도가 큰 두 개의 대상을 선택하여 이룰 나타내기는 편리하나 모든 대상 을 일목요연하게 나열시키지 못하는 단점을 지닌다. Sokal 과 Snea th가 수리분류학을 서술하면서 가장 중요하게 다루었던 방법 은 집 괴 법 (集魂法, cluste r in g meth o d) 이 다. 이 는 유사지수를 근거 로 각 운영분류단위를 수지도(樹枝圖, dendro gr am) 로 나타내는
방법이다. 집괴라는 술어 대신에 유집(類集)이라는 술어를 사용한 경우도 많다(예 : 정과 정, 1982). 유집이라는 합성어를 사용하여도 좋으나 가능한한 국어사전에서(이 경우는 어문각 발행 신국어 대사 전) 표준말로 기록된 단어를 선택하고자 한 필자의 의도 때문에 집 괴 라는 용어 가 사용되 었다. 물론 cluste r anal y s i s 라 하면 이 방법 이 실제로는 비슷한 것끼리 묶는 방법이므로 의미상으로 보아 유집 이라는 단어가 사용될 수가 있으나 이렇게 하면 clus t er 라는 원래 의 뜻에서 의역될 위험성이 있다. 운영분류단위를 묶는 방법에는 집괴법 의에도 두 개 운영분류단 위를 유사 정도에 따라 2 차원상에 점으로 표시하여 이 점들의 근접 정도에 따라 운영분류단위의 무리를 한계 짓는 배열법(配列法, ord i na ti on) 이 있다. 이 책에서는 이러한 방법 중 가장 널리 쓰이 는 집괴법에 대해서 주로 소개하고자 하며 배열법에 대한 소개는 다음 장에서 간략히 하고자 한다. 8.1 집괴분석 분류를 수리적 방법에 의해 시도할 때 우리가 얻으려 하는 것은 자연에 모호하게 존재하는 어떤 유형(類型, p a tt ern) 을 좀더 뚜렷 이 부각시키고자 하는 일이다. 유형을 찾는 일이 수리적 방법에 의 해 가능한 이유는 각 대상이 공간상의 점으로 표시되고 이 점들의 무리가 정확히 식별되기 때문이다. 각 대상은 속성이 가지는 값에 의해 공간상에 좌표로 표시되고, 이 좌표에 의해 공간상에 점으로 표시된 대상들은 무리를 이루기도 하고 산만하게 분포하기도 한다. 이때 무리를 이루는 대상들을 하나의 유형으로 식별해낼 수 있다. 공간상의 대상들이 어떤 무리로 존재할 때 무리의 한 덩어리가 집 괴 (集魂, cluste r ) 라는 개 념 의 기초가 된다. 집 괴분석은 유사성으 로 인하여 공간에 나타나는 무리의 덩어리들을 평면차원으로 환원 시켜 찾는 방법이다. 공간적 차원에서 이러한 유형을 찾을 경우 이 는 배열법이라는 범주에 속한다고 하겠다.
그러면 이제 유사성으로 인하여 공간에 나타나는 무리의 덩어리 들을 평면적 차원에서 찾는다는 의미가 구체적으로 무엇인가 알아 보자. 제 7 장에서 제시한 유사지수행렬이 분류 체계의 수립을 위한 집괴분석의 출발점임을 우리는 알고 있다. 집괴법은 유사지수행렬 로부터 계층적 구조를 축조해 나가기 시작하는데 이러한 이유로 인 하여 집괴법을 계층법 (階層法, hie r archic me t hod) 이라 칭하기도 한다. 계층적 구조를 수립하는 원칙은 유사지수행렬로부터 유사도 가 큰 대상을 차례로 찾고, 이때 차례로 선택된 대상을 계단식으로 나열하는 것이라고 할 수 있다. 계층구조의 수립 과정은 계층의 축 조 방향에 따라 크게 집 적 법 (集積法, agg lo merati ve meth o d) 과 분 화법 (分化法, div i s i v e meth o d) 의 두 가지로 나누인다. 집적법이란, 개개의 대상을 무리로 묶고 이러한 무리를 다시 좀 더 큰 무리로 묶어 최종적으로는 전체가 하나의 무리롤 이루게 하 는 과정을 말하며 분화법이란, 반대로 큰 덩어리로부터 단계적으로 쪼개어 나가는 과정을 말한다. 예를 둘어, n 개의 모든 대상이 과 정의 맨 마지막에서 하나의 무리에 속하게 될 때 이를 집적법이라 고 하며 n 개의 모든 대상이 하나의 무리라고 보아 출발하여 이들 대상이 여러 조로 나누어지게 되면 이를 분화법이라고 한다(그립 8.1 참조).
鼻
이러한 두 방법 중 수리 분류학에서 많이 사용하는 방법은 집적 법이다. 왜냐하면 집적법이 본래 분류학에서 시도 하는 분류 체계 의 형성 원칙에 부합되기 때문이다. 죽 분류군의 도출 과정이란 바 로, 각 분류군의 차이점을 알아내고 형질을 공통으로 소유하는 분 류군들끼리 묶는 작업을 일컬음으로 이는 하부로부터 출발하여 전 체로 향하는 집적 과정이라 할 수 있다. 이러한 과정은 분류학이, 〈생물을 공통 형질을 소유하는 무리로 배열하는 것이다〉 라는 정의 와도 일치한다 (물론 분류학에 대한 이러한 정의가 타당한가는 다 시 논의되어야 하겠지만). 따라서 이 책에서는 집괴분석 중 집적법 에 대해서 설명하고 또 실제 예를 제시하여 독자에게 도움을 주고 자한다. 8 . 1. 1 집괴 분석 의 과정 집괴분석은 유사지수행렬로부터 출발하고 있음을 이미 앞에서 지 적한 바 있다. 따라서 제 7.2 장에서 소개한 유사지수의 자료행렬 (15) 로부터 시작하여 집괴분석의 과정이 구체적을 어떻게 진행되는 지 살펴보고자 한다. 분석 과정을 때부터 때까지 단계별로 나누어 서 아래에 설명하였다. 아) 만일 우리가 X1,X2,… .X1,X1,… .Xn 의 n 개의 운영분류단위 로부터 출발한다면, 때 n 개의 운영분류단위 중 우선 유사도가 가장 높은 두개의 대 상을 찾아야만 한다. 죽 유사도가 가장 높은 두 운영분류단 위를 X1, X 라 하고 이때의 유사도를 S p라 한다면 (유사지수 롤 제 7 장에서는 소문자 s 로 표시 하였으나 이 장에서는 이 유사지수를 인쇄의 편의상 대문자 S 로 표시하였다. 제 7 장 과 비교할 경우는 소문자 s 로 이해해 주기 바란다), SP=rnax Su (i타)가 되는 대상 X1, X 를 찾는다. 때 이러한 조건을 갖는 대상 X1, X 가 찾아지면 이 X1, X 를 합 쳐서 다시 한 개의 독립된 단위로 생각하여, 이를 X1, X i로 구성되는 운영분류단위 C 쵸 L 설정한다 (그림 8.1).
(태 때에서 설정된 새로운 대상 cp를 X1, X 』 이의의 다른 대상과 동일하게 취급하여 이들 각 대상간에 새로이 형성되는 유사 지수를 계산한다. (o}) 새로 산출된 유사지수행렬 자료로부터 다시 때에서와 마찬가 지 과정을 통하여 가장 유사도가 높은 두 개의 운영분류단위 를찾는다. 빼 나(래 과정을 되풀이하여 최종적으로 n 개의 운영분류단위가 모두 어떤 무리에 속하게 되면 이를 수지도로 나타낸다.
III'L
위에서 설명한 집괴분석의 과정 중 아)-(!;» 과정은 제 7 장에서 기 술한 방법에 의해 계산된 유사지수를 직접 이용하나, (래의 과정에 서는 가장 유사도가 높은 대상의 무리인 c p를 새로운 운영분류단 위로 가정하여 이와 나머지 다른 대상들간의 유사도를 다시 산출하 게 된다. (7l-)-때의 과정은 유사지수가 1 일 경우, 두 대상의 유사도 가 가장 높은 것이므로 1 에 가까운 값을 가지는 두 대상을 선택하 면 된다. 그러나 (래의 과정, 죽 일단 선택된 군 CP 와 그 밖의 다 른 대상과의 유사지수를 새로이 산출하는 방법은 저자에 따라 의견 이 다르다. 바로 이 과정이 집괴분석의 가장 중요한 과정이다. Lance 와 W illiam s (1967) 는 여러 저자에 의한 서로 다른 산출범을 동합하여 이를 하나의 일반식으로 아래와 같이 나타내었다. Cp , X1
등이 이제부터 소개되는 여러가지 식에서 인쇄의 편의상 작은 글자 크기의 Cp, X1 등으로 표현되었다. 식 안에 기재된 Cp, X1 등은 본문 의 Cp , X 로 이해하기 바란다. Scpx k = a1Sx1xk + a2SXJ X k +{J Sx1x 』 + rlSx1xJ -Sx1x 」 (1)
표 8.1 운영분류단위 G 와 나머지 운영분류단위 사이의 유사지수 계산 에 있어서 일반식 내의 a, S, r 값을 변화시킨 예 유사지수 산출방법 명 a1 . a2 /3 r 1. 단일결합 (s i n g le link ag e) T1 12 。 _T1 2. 완전결합 (com p le t e link ag e ) 12 12 。 T1 3. 평균결합 (avera g e link ag e ) 3a. 산술평균결합 (arith me ti c averag e link ag e ) 3aa. (비un가we중ig h평 te 균d 결a합ve rag e lin- 12 12 。。 kag e ) 3ab. e가d 중av er평a g균 e 결 li n합k ag( ew) eig h t- 뜨n 프n 。 。 3b. 중앙결합 (med i an meth o d) 21 T1 _T1 。 3c. 중심 결 합 (centr o id meth o d) 쁘n nnc p ncnpn 2 cp 。
대상 C p와 xk 간에 새로 계산되는 유사지수 Sc p xk 는 X1, Xk 나 xJ , xk 혹은 X,, XJ 대상간의 유사지수, 예를 들면 Sx,xk 등과 함수관계를 갖는데 이때 이들 관계에 영향을 주는 값들로는 a1, a2, /3, r 와 갇은 계수들이 있다. a1, a2, /3, r 와 갇은 계수는 상수로서 바로 이 계수가 저자에 따라 이들이 어떠한 값을 갖게 하는가에 의 견을 달리하게 된다. 이들 지수값이 가지는 성격에 따라 단일결합 (單一結合, sin g le link ag e ), 완전결합(完全結合, comp le t e lin- kag e ), 평균결합(平均結合, averag e link ag e ) 등 그 산출범의 명
칭까지도 다르다. 현재까지 알려진 방법은 대체로 10 여 가지가 되 나 그 중 일반적으로 널리 통용되는 방법과 이들 방법에 있어서의 a1, a2, /J, r 계수의 성격을 각 방법의 명칭과 함께 나타내면 표 8.1 과 같다. 이들 각 방법을 지금부터 상세히 소개하고자 한다. 8 . 1. 2 단 일 결 합 (sin g le link ag e ) 이 방법은 Florek 나 Snea t h 에 의해 수리분류학에 최초로 도입된 것으로 Lance 와 W illi ams 가 식물 생태학에서 군집을 분류하는데 사용하면서 일반화되기 시작하였다. 이는 최단거리법 (neares t neig h bour tec hniq u e) 또는 최소법 (mi ni m u m meth o d) 이 라고도 불 리우는데, 이러한 이름들은 이 방법의 원칙에 입각하여 주어진 이 름들이다. 죽 a1=a 는§, /3=o , r= -강 값을 식 (1) 에 대입하여 정리하면 Scpx k=max(Sx,xk, SxJS xk) (2) 로 표시할 수 있다. 바꾸어 말하면, 최대 유사도를 나타내는 대상 XI 와 X J로 구성되는 새로운 대상 CP 와 그 밖의 임의의 대상 xk 간 에 형성되는 유사지수 Sc p xk 는 XI 와 xk, X i와 xk 간의 유사지수 Sx,xk, Sxix k 중 큰 값을 취한다는 것이다. 그러나 이들의 명칭아 최단거리법 또는 최소법으로 주어진 이유는 그림 8.1 에서 보는 바 와 같이 유사지수가 클수록 이들 사이의 거리는 가깝고 가장 인접 해 있는 대상이 되기 때문이다. 또한 제 7.2 장에서 설명된 바와 같 이, 유사지수가 클수록 거리지수는 적어져 최대 유사지수를 갖는다 는 것은 최소 거리지수를 갖는다는 것과 동일한 의미이므로 이러한 거리지수의 개념에서 비롯된 명명법이라고 할 수 있다. 8.1. 3 완전결합 (com p le t e link ag e) 이는 위에서 설명한 단일결합과는 정반대의 개념에서 출발한 것 으로그 일반식은
Scpx k=mi n (Sx1xk, Sx1Sxk) (3) 으로 표시된다. 죽 C p와 임의의 대상 Xk 간의 유사지수 SC p Xk 는 Sx,xk, SxJx k 값 중 적은 값을 취하는 것이다. 이러한 이유로 인하 여 이를 거리지수의 개념에서 보아 최대거리법 (farthe st neig h bur tec hniq u e) 또는 최 대 법 (maxim u m meth o d) 이 라 부르기 도 한다. 이는 위의 단일결합에 비해 전체적으로 각 대상 간의 유사지수가 낮아지는 결과를 가져오고 따라서 단일결합에 비해 좀더 엄밀한 분 류결과를 나타낸다. 8 . 1. 4 평 균결 합 (averag e link ag e ) 단일결합이나 완전결합이 최대 내지는 최소값의 유사지수를 취하 고 있어 너무 편중된 값을 갖는 취약접이 있다. 이러한 결점을 보 완하기 위하여 제안된 방법이 평균결합이다. 죽 Sx1xk 와 Sx J Xk 의 두 값이 그들의 크고 적음울 불문하고 이들 값이 같은 비중으로 새 로 산출되는 유사지수 값 SC p Xk 에 영향을 주도록 고안된 방법이 다. 이는 Sokal 과 Snea t h 에 의해 최초로 제안되었는데 Sx1xk 및 Sx1xk 값을 어떠한 형태로든 평균하고 있다. 그러나 이때 평균값 울 산출하는 절차의 차이에 의해 크게 네 가지로 그 방법이 분류된 다. 보통 우리가 평균이라 하면 두 값을 합쳐 이를 2 등분 하는 것 이 상례이나 이 경우에 있어서는 이러한 평균 이의에도 각 무리에 속하게 되는 대상의 , 수를 고려하여 이 값을 곱하기도 하는 변형을 취하고 있다. 산술평 균결 합 (arit hm eth ic averag e link ag e ) 비 가중 평 균결 합 (unweig h te d averag e link ag e ) 이 는 주로 UPGMA (unweig h t ed pa ir grou p meth o ds usin g ar ith- meti c avera g es) 로 표기 되며 대부분의 수리분류학자가 가장 적 합
하다고 추천하는 집괴분석 방법이다. 구체적 방법은 우리가 보통 평균값을 구하는 방식대로 X1 와 xk, x j와 Xk 간의 2 개 유사지수 값을 합쳐 이룰 2 등분하여 아 값을 새로 형성되는 Sc p xk 의 값으로 취급함으로써 이루어진다. 죽 Scpx k =t1 (Sx, 쟈 +Sx1xk) (4) 로써 일반식과 함께 살펴보면 a i =a2= 강, /l =r=O 의 경우가 된다 고하겠다. 가중 평 균결 합 (weig h te d average link ag e) 비가중 평균결합법이 평균값을 갖게 하는데 반하여 이는 단순한 평균값이 아니라 각 군에 속하게 되는 대상의 수를 참작하여 이 수 에 따라 비중을 달리하는 방법이다. 이 방법은 다음과 같다. 만일 G 라는 군과 c q라는 두 개의 군이 형성되었다면 이때 C p에 속하게 되는 대상의 수를 IlCp , C q에 속하게 되는 대상의 수를 nc q라 하고
Cp q
이때 C p와 cq 사이에 새로이 형성되는 군의 명칭을 c pq라 하자. 우리는 C pq와 여기에 속하지 않은 임의의 대상 xk 간의 유사지수 를 구하고자 한다. 그림 8 . 3 에 이러한 상황을 나타내었다. 이때 새 로이 구하는 유사지수의 값을 SC pq Xk 라 한다면 SCp qX k= ncpS cnpx c kp + + nnccqq S cqX k (5) 가 된다. 이때 nc p +nc q =n 으로 표시하면 SCp qX k=—n nc— p Scpq X k+n~ncS q Cp qX k (6) 로서 표 2 에서 나타내어진 식과 동일한 결과가 된다. 이를 일반식 (I) 과 비교하면 a 尸뜨in , a2= 뜨n노 의 값을 가지고 /3= r=O 인 경우 가된다. 중앙결합 (med i an meth o d) 일반식 (1) 에서 a 론½, a2=½, /3= _-¼, r=O 인 경우로 Scpx k =lt (Sx,xk+ Sxix k) 一tl Sx1x 』 (7) 로 나타내진다. 이는 대상 X1 와 xk, x 』와 X 려 유사지수 값 뿐만 아니라 X1 와 XJ , 죽 본래 G 의 군에 속하는 X1 와 X 자의 유사지수 값까지 고려한 것이다. 이의 산출 원칙을 살펴 보면 XI , X 』 및 xk 의 값을 공간상에 나타내고 이들 3 개 값을 삼각형의 정접으로 보아 X1 와 X 』를 밀변으로 하여 Xk~ 부터 이 밀변에 가장 가까운 거리 인 수직의 선을 긋고 이 때 수칙거리의 값을 X1 와 X J로 이루어진 군 G 와 xk 에 대한 유사지수 값으로 간주하는 방법이다. 중심 결 합 (centr o id meth o d) 중앙결합과 매우 유사하나 XI, XJ , xk 값을 정점으로 하는 삼각형
에서 xk 에서 X1 와 X J로 이루어진 변에 수직거리가 아니고 XI, X 沮 에서 먼저 중심점을 구하고, xk 로부터 이 중심접까지의 거리를 새 로이 산출되는 유사지수 값으로 취급하는 방법이다. 뿐만아니라 비 가중 평균결합법에서와 유사한 방법으로 각 군에 속하게 되는 대상의 수가 유사지수 값에 동시에 영향을 미치도록 고려하였다. 죽 SC pq Xk= 뚱 Scpx k +뚱오 Scqx k-~ScpC q (8) 로a2 =나 뚱타내 /진3=다 (-n단cn p2n • n=cnq ,c pr+ =n0c 의q ) . 값일을반 갖식는 (1경) 과우 이비다교.하 면 a1=—n ncp ' 8.2 집괴분석법에 의한 계산 예 위에서 살펴본 바에 의하면 각 대상간에 있어서 최초의 유사지수 를 산출하는 방법이 다양할 뿐 아니라 이 유사지수를 기초로 각 군 을 형성해 가는 과정도 여러가지가 있음을 알 수 있다. 최초의 유 사지수를 산출하는 방법은 이미 제 7 장에서 실례를 들어 상세히 설 명하고 있어 누구나 충분히 이해하고 있을 줄로 믿고 아래에서는 그 다음 단계인 집괴분석의 방법 중 실제값을 이용한 예를 들어 그 과정을 다시 한 번 기술하고자 한다. X1 X2 x3 x4 Xs XI 1 0.625 0.333 0.8 7 5 0.400 X2 1 0.375 0.556 0.3 0 0 x3 1 0.300 0.333 (9) x. 1 0.5 0 0 x5 1 만일 우리가 제 7 장에서 제시된 유사지수행렬 (15) 에서 출발한다 고 하자. 편의상 이 유사지수행렬을 다시 한번 표시하면 위의 (9)
와같다. 위의 유사지수행렬을 기초로 한 집괴의 구성은 전술한 바와 갇이 b})- 맨의 과정 (제 107 쪽 참조)을 되풀이하여 이루어진다. 때는 하 나의 출발점을 제시한 과정에 불과하므로 때의 과정부터 살펴본다 면, 때의 과정은 유사지수행렬 (9) 로부터 가장 유사지수가 큰 두 개 의 대상을 찾는 일이다. 이 두 대상을 유사지수행렬 (9) 에서 찾아보 면 대상 X1 과 X 가 0.875 로써 이 두 대상간의 유사지수가 가장 높 음을 알 수 있다(유사지수 1 로써 표시된 경우는 X1 과 XI, x2 와 X2 등의 같은 대상의 경우이므로 제의시켜야 함). 이를 수지도의 형태 로 표시하면 아래와 같다. C, I A ` X, X4 0. 8 75 그 다음 때의 과정은 이렇게 선택된 X1 과 x. 로 구성되는 운영분 류단위를 새로운 대상으로 묶는 일이다. 이 때 X1 과 x. 로 이루어 진 군을 C1 이라 하자. (태의 과정은 이 C1 과 여기에 소속된 대상 x1, X 遷· 제의시킨 X2, X3, Xs 간의 유사지수를 새로이 산출하는 일이다. cI, x2, x3, x5 사이의 유사지수를 계산하는 방법에는 앞에 서 언급한 대로 저자에 따라 여러가지 방법이 제안되고 있다. 따라 서 본 란에서는 이 중 산술평균법의 일종인 비가중 평균결합을 예 로 설명해 보려 한다. C1 과 X2 의 유사지수는 Se p쟈 =了1 (Sx1 쟈 +Sx 凶) 롤 근거로 하면 Cp = Ci, X1=X1, Xi = X., Xk=X2 이므로 Sc1x2 =1t (SX1 X2 + Sx.xz)
가 된다. 따라서 Sx1X2, Sx.x2 의 값을 유사지수 행렬 (9) 에서 찾으 면 각각 0.625, 0.556 이 되므로 Sc1x2 =1t (0 . 6 25 + 0 . 556) = 0 . 591 을 얻게 된다. 마찬가지 방법으로 C1 과 X3 의 유사계수는 Sc1X3= 랑 (SX1Xa+Sx 찍 =감 (0.333+0.300) =0.317 이다. 이러한 방법에 의해 C1, X2, X3 』& 대상간의 유사지수를 구 해 행렬로 나타내면 아래와 같다. C1 : (X1+X4) X2 x3 x5 C1 : (X1+X.) 1 0.591 0.317 0.450 X2 1 0.375 0.300 (10) x3 1 0.333 x. 1 이렇게 새로운 대상 C1 과 나머지 대상 X2, Xa, Xs 와의 유사지수 가 산출되면 (o B 에서 언급한 대로 다시 때-(래의 과정을 모든 대상이 한 개의 무리에 속할 때까지 되풀이하여야 한다. 따라서 다시 때의 과정으로 돌아가면, 위의 유사지수행렬 (l0) 으로부터 가장 유사도가 높은 대상이 C1 과 X2 임을 알 수 있으므로 이 두 대상을 합쳐 1 개 의 새로운 대상 C2 를 설정하게 된다. 이룰 앞에서와 마찬가지로 수지도로 나타내면 아래와 같다. c. X, , C^I `X • Xa 0.8 I7 5 0.5 9 1 다음 단계는 (래의 과정을 되풀이해야 하므로 C2 와 X3, Xs 간의 유사지수를 계산하면, 이때 Ci,= C2, X1=C1 , Xi = X2, Xk=X3 이므로
Scpx k = t1
위의 유사지수행렬 (11) 로부터 우리는 다시 때의 과정을 되풀이해 야만 한다. 이 과정에 의해 가장 높은 유사지수를 가지는 대상의 군 C2 와 X5 를 찾을 수 있고 이를 수지도로 나타내면 위의 그림과 같다. 죽 C2 와 X5 간에 형성되는 새로운 군을 c3 라 할 수 있고 이 때의 유사지수는 0. 37 5 임을 알 수 있다. 그러나 현재까지도 대상 x3 는 어떤 군에 소속되고 있지 않아 다시 때-(라)의 과정을 되풀이 하여야 한다. 죽 c3 와 x3 간의 유사지수를 산출하여야 하는데 이 역시 위에서와 마찬가지 방법으로 SC3X3=t 1
게 된다. 수지도에 의한 분류적 등급의 설정에 대한 일반적 기준은 어느 수준(유사도에 의한)에서전 일직선 상의 기준선이 그어져야 한다는 것이다. 이러한 기준선에 의해 운영분류단위 사이의 분류적 등급의 차이는 비록 아주 미소하더라도 뚜렷이 나타날 수 있다. 이 때 분류된 각 단위는 운영분류단위라고 말해진다. 이렇게 설정된 운영분류단위는 전통적 분류학에서 사용되는 종, 속, 과 등과 대비 되어 같은 의미로 사용될 수 있다. 그러나 수리분류학자들은 종, 속, 과 등이 전통분류학에서 진화적 의미를 가지고 있고 또한 분류 적 등급, 명명 등의 술어들도 전통적 의미를 지니고 있으므로 수리 분류학의 결과를 직접 종, 속 등으로 표현됨을 피하려 하였다. Snea th와 Soka l( 1973) 은 수리적 방법에 의해 도출되는 단위를 표현군 (表現群, ph erio n ) 이 라 부르고 이 의 명 명 (命名) 을 표현군이 설정되는 유사 정도에 의해 시행하고 있다. 죽 80- 표현군 이라고 표기되었으면 이는 80% 이상 되는 유사도에 의해 나뉘어지는 운영 분류단위를 일컫는다. 표현군이라는 술어는 유사지수나 집괴분석의 방법이 서로 다를지라도 적용될 수 있는 수리분류학적 결과에 대한 일반적 술어이다. 비록 이 표현군이 수리분류학적 결과에 의해 도 출되었기 때문에 분류군이라는 술어와 완전한 동의어는 아니나, Snea t h 와 Sokal(1973) 은 분류군에 대비되는 분류적 등급의 어느 수준을 지칭하는 말로서 사용될 수 있다고 주장하였다. 그들은 분 류군을, 자연의 어떤 수준에서라도 나타나는 분류적 군에 대한 약 자로서 사용할 수 있다고 함으로써 (Snea t h 와 Sokal, 1973, 제 4 쪽) 분류군 자체를 일반화된 개념으로까지 해석하였다. 이들에 의해 제 안된 집괴분석의 결과에 의한 표현군의 구체적 예를 아래에 제시한 다 (Snea t h 와 Sokal, 1973, 제 29 쪽 참조) . 그립 8.4 는 표현군의 경계를 여러 수준에서 나타내는 하나의 예 이다. 만일 우리가 75% 의 유사도에 해당되는 75- 표현군을 설정한 다면 그림 8.4 에서 보면 1,2,5,7,9 와 6,7,10 과 4 및 8 의 네 개 표 현군이 분리된다. 이때의 표현군을 Snea t h 와 Sokal 은 (1···9), (6… 1 0) 등으로 표기하자고 제안하고 있다. 괄호 안의 점은 몇몇 운영분류단위가 포함되고. 있음을 의미하며, 이때의 각 단위는 반드 시 가나다 순이나 숫자의 크기 순으로 나열될 필요가 없다고 하였
다.만일 우리가 그립 8.4 로부터 65- 표현군을 설정한다면, 3 개의 군 이 형성될 것이고 또한 2 개의 군을 이끌어내고자 한다면 55- 표현군 의 선을 택할 수 있을 것이다. 그러면 이때 분류적 등급을 설정하 는 기준은 무엇일까가 문제가 된다. Snea t h 와 Sokal 도 이 문제에 관하여는 정확한 해답을 주고 있지 못하다. 단, 수리분류학에서 취 급되는 대상이 다양함으로, 일률적인 기준을 제시하기 어렵다고 지 적하면서 간격이 넓은 표현군을 선택하도록 제안하고 있을 뿐이다.
40 ...
몇몇 용어에 대하여 언급한다면 수지도, 표현도, 표현군 등의 용 어가 논란의 대상이 될 수도 있다. 영어권에서의 dendro gr am 은 수지도로, p heno gr am 은 표현도로서 표기하였으나 이 모두 수지도 라고 하여도 우리말로는 어색하지 않다고 여겨진다. p henon 을 표 현군이라고 한 것은 원어의 의미를 그대로 보호하기 위함이었다. 정과 정 (1982) 은 p heno gr am 을 전형질도 (정과 정 1982, 제 89 쪽) 로 번역하여 사용하고 있으나 필자는 가능한 이 책에서 원어의 의
역을 피하고자 하는 원칙을 고수하려 했기 때문에 수지도 또는 표 현군 등의 술어를 택하였다. 수리분류학적 방법에 의해 도출된 표현군에 대한 명명은 어떠한 방법으로 이루어지는 것이 타당한가에 대한 문제에 관하여 Sneath 와 Sokal 은 명확한 해답을 주고 있지 못하다. S i m p son(1961) 은 명명에 대한 일반적인 원칙을 잘 정리하고 있는 바, 명명은 (1) 어 느 분류군에라도 응용이 가능하며 (2) 명확성이 있어야 하고 (3) 안 정성을 가져야 한다고 주장하였다. 린네에 의해 이명법(二命法)이 제안된 이후 분류군의 명명은 주로 분류군의 식별과 분류적 관계의 표시라는 두 가지 관점에서 보완 수정되어 왔다. Sokal 과 Snea t h 는 명명의 목적을 분류군의 식별에 두고자 하였 으며 분류적 등급이나 분류적 관계 등을 식별하는데 용이하도록 명 명 을 이 용하려 하지는 않았다. 죽 S i m p son 이 주장한 명 명 의 안정 성에 주안점을 두어, 수리분류학적 과정에 의한 결과로 나타나는 표현군이 가지는 안정성의 장점을 강조하는 명명의 원칙을 고수한 것이다. 다시 말하면 그들은 명명을 분류군을 단순히 식별하는 작 업으로 본 것이다. 게다가 수리분류학자들은 수리분류학적 방법에 의해 명확해전 분류군의 한계에 만족치 않고, 이러한 분류군을 현 대적 개념에서 빠른 속도로 찾아 내고 수정하는 작업까지롤 기계적 으로 처리할 수 있는 방법들을 고안해내고자 하였다. 그러나 명명 에 관한 수리분류학자의 주장이 대부분의 학자에게 받아들여지기는 어렵다고 본다. 현재까지 쓰여지는 수리분류학의 결과를 보면 기존 의 분류군을 검정하고, 기존의 분류군에서 명확치 않았던 한계를 설정하여, 이를 지금까지의 결과와 비교 논의하는데 만족하고 있는 실정이다. 8.4 분류학에서의 이용 예 집괴분석을 분류에 응용한 논문은 1970 년대 이후 Taxon, Sys t e m ati c B ota n y, Sys t e m ati c Zoology 등의 분류학 전문 잡지들에
서 종종 찾아볼 수 있다. 우리나라에서도 유 (1980) 는 부추속의 식 물을 비교하는 연구에서 이미 수리적인 방법을 소개한 바 있다. 정 과 정(1 982) 에 의한 비비추속의 연구나 이(1 984) 에 의한 개나리속 식물의 비교연구에서도 집괴분석은 참고자료로서 적절히 이용되고 있음을 알 수 있다. 정과 정 (1987) 은 또한 수생식물을 대상으로 집 괴분석을 이용한 예를 최근 발표한 바 있다. 그러나 수리적 방법을 이용한 논문들이 분류학 전문 잡지들에서 주류를 이룬다고는 결코 말할 수 없다. 또한 수리적 방법들이 어떤 한 가지 방법에 의해 결 론을 직접 이끌어내는 데 쓰이는 경우도 많지 않다. 수리적 방법의 결과가 전통 분류학의 결과와 일치되는 경우 이를 인용하거나, 전 통적인 분류 방법만으로는 명확한 한계를 찾을 수 없는 경우에 주 로 사용되고 있다. 아래에 소개하는 J acobson(1979) 의 집괴분석의 예 역시 이 러한 범주에 속한다. J acobson 의 논문을 인용하는 특별 한 이유는 이 논문이 집괴분석의 결과를 제 10 장에서 소개하는 요 인분석의 결과와 같은 재료를 가지고 비교하였기 때문이다. J acobson 은 분류적으로 매우 유사한 두 종의 양파 Alliu m cernuum 과 Alliu m s te lla tu m 을 집괴분석을 이용하여, 보관된 상태 의 표본들의 분류를 시도하였다. A. cernuum 은 북아메리카 대륙 에서 산간 지방이나 그 밖에 한냉한 기후를 가전 지역에 주로 분포 하는 종이고 A. s te lla tu m 은 북아메리카의 중부 지대의 석회질 토 양을 가진 지역에 분포하는 종으로서, 이들 두 종은 형태적으로 매 우 유사하여 두 종의 분리 가 매우 어 렵 다고 하였다. J acobson 은 이들 두 종의 표본을 약 400 개 이상 조사하고 분류적 형질로서 62 개 형질을 선택하여 형질의 상태를 정량화하였다. 약 400 개의 표본 중 대표가 될 만한 표본만을 다시 각종에 대하여 45 개씩 선택하고 이들 각각의 표본을 운영분류단위로 설정하였다. 각 운영분류단위 에 대한 형질의 상태는 형질에 따라 2 에서 21 종류로 나누어 정량 적으로 기재하였다. 예를 들어 꽃잎의 색깔이 자주빛이면 010, 분 홍이 면 020, 노란색 이 면 030 의 값을 주었으며 어떤 중간색 이 나타 날 경우, 예를 들어 분홍과 자주빛이 섞여 있으면 015 의 값 등을 주었다. 이러한 자료로부터 실제의 표본이 어떠한 양상으로 분류되 는가를 조사한 결과는 그립 8.5 와 같다. 집괴 방법은 비비중 평균
결합 (UPGMA) 의 과정을 취했다. 그립 8.5 의 결과에서 알 수 있는 바와 갇이 관찰된 약 90 개의 대 상 표본은 두개의 무리로 정확히 구별되어전다. 물론 이때 각 표본 둘은 서로 유사성이 아주 높은 경우가 있기도 하고 그렇지 못한 경 우가 있기도 하지만 중요한 것은 이들이 두 개의 무리로 나뉘어서 결과적으로 Alliu m cernuum 과 Alliu m s t ella tu m 이 구분되는 경향 울 보인다는 것이다. 수리분류학은 이와 같이 분류군의 구분이 명 료하지 않은 상태에서, 이를 분리해내는 객관적 논리를 전개하는데 보조적인 수단으로 쓰일 수 있는 장접을 지니고 있다. 위에 제시한 예 이외에도 집괴분석을 이용한 논문의 예는 분류학의 전문 잡지에 서 종종 취급되고 있으므로 관심있는 독자는 이들 잡지들을 일별하 기 바란다. Snea t h 와 Sokal(1973) 의 부록 I 에도 현재까지 수리분 류학이 이용된 모든 논문의 예가 수록되어 있다.
제 9 장 배열법에 의한 분류군의 배열 9.1 집괴분석과 배열법의 관계 이 장에서 의미하는 배열(配列, ord i na ti on) 이란 분류의 대상이 공간상에 배열됨을 말하며 이때 각 대상의 위치는 유사도에 의해 결정된다. 예를 들어 어느 두 대상간의 유사도가 크면 두 대상은 다차원 공간에서 아주 가까이 위치하게 되고 유사도가 작으면 이들 은 멀리 위치하게 된다. 이러한 결과로 유사성이 큰 대상끼리 하나 의 무리를 형성하게 되는데 이 무리를 하나의 분류군으로 취급하게 된다. 따라서 배열법이란 제 8 장에서 다룬 집괴법의 한 방법이라고 할 수 있다. 집괴방법 중의 하나로 간주되는 배열법은 그러나, 생 물의 분류에서 많이 사용되지는 않았다. 그럼에도 불구하고 이 장 에서 배열법을 독립시켜 취급하는 이유는 첫째, 배열법이 생물의 분류에서 사용될 수 있는 큰 가능성을 지니고 있기 때문이다. 이 배 열법은 지 금까지 식 생 (植生, vege ta t i on ) 의 분류에서 집중적으로 사용되어 왔다. 오늘날 분류학자가 수리적 분류를 수행할 때 집괴 분석 방법을 주로 이용하고 배열법을 드물게 이용하는 것은 하나의 관습이라고 생각된다. 배열법이 집괴범과 분리되어 독립된 장으로
취급되는 둘째 이유는, 방법상의 원리가 집괴분석법과 유사하긴 하 나 유사지수를 계산하는 과정부터 결과를 배열하는 과정까지 그 구 체적인 방법이 다르기 때문이다. 또 배열법은 주로 식물사회학에서 사용되고 있어 출현 배경이 집괴분석과 다른 점도 이 장을 독립시 킨 중요한 이유라 하겠다. 식물 사회학에서는 집괴분석이나 배열법 모두를 빈번히 이용하며 그 결과를 서로 비교하는 경우도 많다. 그러나 분류학에서는 배열 법을 이용하더라도 주성분 분석의 결과 등에 의한 배열법이 주로 이용되고 이 장에서 소개되는 방법은 드물게 이용된다. 어떻든 배 열법은 분류방법 중의 하나이며 식물사회학에서 차지하는 위치가 확고하므로 수리분류학을 취급하는 입장에서 배열법을 하나의 중요 한 내용으로 선택하여 소개하는 바이다. 더우기 수리적 분류의 실 제를 철저히 다루고자 함이 이 책의 중요한 목적 중의 하나이므로 비록 배열법이 식생의 분류나 기타 생태학의 제 분야에서 주로 사 용되고 있긴 하지만 수리적 분류 방법의 하나이므로 이 책에서 중 요한 장으로 취급하고자 하는 것이다. 우선 배열법의 출현 배경을 이해하기 위해 식물사회학에서 식생의 분류방법이 어떤 과정을 거 쳐 정착되었으며 식생의 분류에서 갖는 배열법의 중요성은 무엇인 가를 살펴보기로 하자. 9.2 식생의 분류와 배열법 배열법은 식생 연구가들에 의하여 산림이나 초원 등을 규모있게 이용하려는 목적에서 개발되기 시작하였다. 육지 표면의 대부분은 식물에 의해 덮혀 있는 바 이들 식물은 그 종류가 다양할 뿐만 아 니라 각 종에 따라 분포를 달리하고 있다. 산림학자들은 지구상에 분포하는 식물을 대상으로 식물 종의 분포를 식생이라는 관점에서 이해하려 하였으며 이때 식생을 환경 특성과 함께 논하고자 하였 다. 죽 식생은 환경의 구배에 따라 형성된다고 본 것이다. 다시 말 하면 식생을 기재함에 있어, 서로 다른 식물상의 출현이 어떻게 환
경을 반영하는가, 어떠한 과정을 통하여 식생이 형성되고 하나의 계를 이루게 되는가에 대한 문제를 취급하기 시작한 것이다. 죽 식 생 연구가들은 어떤 식생이 다른 식생과 가지는 관계 및 환경과 가 지는 관계에 관심을 집중시켰다고 볼 수 있다. 식생과 환경의 문제에 대한 해답을 얻기 위해서는 방법론적으로 자연히 식생이나 환경에 대한 관찰된 사항을 어떻게 요약할 수 있 겠는가를 생각하게 된다. 왜냐하면, 실제의 관찰 사항은 그 양이 방대하여 이로부터 직접 주된 경향을 파악하는 것이 불가능하기 때 문이다. 이러한 요약은 자연과학에서 어떤 결론을 이끌어내는 일반 적 과정 중의 하나이다. 산림학자들 역시 식생을 대상으로, 식생에 영향을 미치는 환경 요인이나 식생의 종류를 요약된 형태로 나타내 고자 노력하였다. 이러한 방법 중의 하나로 발달된 것이 배열법이 다. 특히 식생의 연구에서 중요한 것은 식생을 구성하는 식물종은 무엇이며 일정한 지역에 몇 종류의, 서로 구별되는 식생이 있는가 를 파악하는 일이다. 다시 말하며 혼재되어 있는 식물종을 식생별 로 무리로 나누는 일이라 할 수 있다. 식생 연구가들은 이러한 작 업을 식생의 분류라고 일컫는다. 배열법은 바로 식생을 분류하는 과정에서 사용되는 방법 중의 하나이다. 그러면 식생분류에서의 배 열법과 생물 분류에서의 배열법이 어떤 상관관계가 있는가 우선 살 펴보기로 하자. 식생의 연구는 유럽을 중심으로 발달하기 시작하였다. 이 중 가 장 주류 를 이룬 것이 Braun-Blan q ue t를 중심으로 한 츄리히 몽뺄 리 에 학파라 할 수 있으며 , 이 학파는 !Uxen 이 나 Ellenber g로 이 어 지 는 전통을 갖게 된다. 이 의 에 U pp sala 학파의 Du R i e t z 를 들 수 있고, 최근에는 영국 학파인 Whit tak er 등이 활발한 활동을 하 고 있다. 이들은 대체로 식생 연구의 방향을 식생의 분류 (classif ica ti on ) 와 식 생 의 등급분석 (等級分析, grad ie n t analys i s ) 이라는 두 가지 관점에서 정립하여 왔다. 이 두 가지 관접은 서로 그 방향을 달리하기는 하나, 서로 보완적인 입장에 서 있다고 볼 수있다. 식생의 분류란, 지구상에 분포하는 전 식물을 식생이라는 관접에 서 분류하는 것을 뜻하며, 이때 분류의 단위는 전동적인 분류학에
서 사용되는 강, 목, 과, 속, 종들의 분류 단위에 대응되는 식생의 분류 단위를 고안하여 사용하고 있다. 이러한 분류의 등급들은 그 이름이 저자에 따라 다르나, 강에 해당되는 말로써 연 (I楠 , for mati on ) , 속에 해 당되 는 말로써 조 (組, assoc iat i on ) 등이 주로 사용된다(fo rma ti on 이나 assoc iat i on 등에 해당되는 우리말 술어를 선정하기가 매우 어려우나 일단 연, 조 등으로 이 를 표기하고자 한 다). 그러면 이러한 식생의 분류는 그 원칙이 무엇일까? 이에 대하여 도 여러 의견이 있으나, 공통되게 주장되는 원칙은 식생의 분류가 상관(相觀, phy s i o gn om y)에 의하여 이루어져야 한다는 것이다. 이때, 상관이란 식생의 의형적 특칭을 일컬으며 이러한 특징을 규 정짓는 성격으로 색상, 번무정도, 계철성, 대체적인 종조성 등, 일 별하여 빠르게 파악되어질 수 있는 성격을 들고 있다. 이러한 상관 에 대 한 성 격둘을 종합하여 Ca i n 이나 Castr o 등은 〈상관이 란 식 생 의 형 (fo rm) 과 구조, 죽 우점하는 식물종의 생활형에서 비롯되는 식 생 의 의 형 (ph ys io g n o my -the for m and str u ctu r e of veg e ta t i on : the app e arance of vege ta t i on tha t results from the life for ms of pre domi na nt pla nts ) 〉이 라고 규정 하였다. 이 러 한 성 격 을 가지는 상 관에 의해 나뉘어전 분류등급 연, 또는 조 등은 다음과 갇은 의미 로 정의되고 있다. 죽 연(聯)이란, 어느 한 지역이나 대륙에서 유 사한 상관을 가지며 기후 환경이 유사하여 비슷한 상관을 보이는 식물 군집의 무리를 일컫는 바, 이는 주로 식물 지리학자들의 관심 대상이 되어 왔다. 조에 대한 정의는 학자들에 따라 조금씩 차이가 난다. 츄리히 몽벨리에 학파는 이를 종의 구성에 의해 구분되는 식 생의 단위로 보았고, 영국 학파는 식생의 상층부에서 (충서 구조적 측면에서) 가장 우접하는 종에 의해 식별되는 식생의 단위라고 주 장하였으며, 이 밖에 식물 기후학적으로 보아 안정된 상태에 들어 간 대표적 군집의 단위라고 주장하는 학자들도 있다. 어떻든 식생 의 분류는 식물상관에 의해 이루어지며 식물상관을 분석하고 기재 하는데 출현 종의 종류나 의형이 중요시되고 동시에 기후 등 식생 울 지배하는 환경적 요인이 고려된다고 하겠다. 그러면 등급분석에 의한 식생의 연구는 어떤 방향을 일컫는가?
식생의 분류가 식생을 군집형으로 분리하고 이로부터 환경 요인이 나 종의 구성, 군집의 성격을 유추하는 반면, 등급 분석은 식물의 종을 환경의 변화 방향에 따라 나열함으로써 종의 구성에 따른 환 경 등급을 직접적으로 연계시켜 줄 수 있게 해준다. 이러한 등급분 석 의 방법 에 는 직 접 등급분석 (dir e ct grad ie n t analys i s ) 과 간접 등급 분석 (ind ir e ct grad ie n t anal y s i s) 의 두 가지 방법이 있다. 직접등급 분석이란, 조사된 자료를 환경의 변화추이에 따라 정리하는 방법이 고 간접등급분석이란, 환경의 변화 추이를 고려하지 않은 채 군집 의 유사 정도롤 유사지수를 이용하여 측정한 후 이를 기본으로 군 집의 변화를 대표하는 축을 설정하는 방법이다. 그러나 이러한 두 가지 방법은 엄밀하게 분리되어 있지는 못하고 이용자들에 의해 혼 합되어 사용되기도 한다. 직접등급분석이나 간접등급분석 공히, 조 사되는 종이 환경 변화 추이 또는 요약된 축에 의해 나열되게 되는 데 , 이 룰 바로 배 열 (配列, ordin a ti on ) 이 라 한다. 배 열은 따라서 , 등급분석 중 나타나는 과정이라고 할 수 있다. 오늘날에 있어서의 식생의 연구는, 식생의 분류만이 독립적으로 시행된다기보다는 환경 요소의 변화에 따른 해석을 함께 하고 있 다. 따라서 전통적인 개념의 식물지리학과는 약간 그 방향이 다르 다. 죽 식생의 분류에 주안점을 두어 기후 등과 연관시키기보다는 서식 장소의 좁은 환경 내에서 가지는 군집의 특성과 군집과 군집 간의 상호 관계를 중요시하고 있다. 전 지구의 식생을 논하는 거시 적 관점에서 식생과 환경을 논하는 미시적 또는 식물사회학적 관점 으로 그 방향이 전환 되었다고 하겠다. 식생의 연구는 식생의 분류로부터 출발하여, 좀더 구체적으로 환 경과의 관계를 논하기 위한 등급분석으로 발전하여 왔지만, 오늘날 에 있어서는 이 두 가지가 엄밀하게 분리되어 사용되지는 않는다. 비록 식생의 분류를 거쳐 식생을 구성하는 종이 배열되지만 이때 종이 배열되는 것은 환경 때문이라고밖에 볼 수 없다. 생물이란 각 각이 서식할 수 있는 생태적 환경 범위를 가지고 있고, 따라서 환 경의 변화 추이에 따라 서식 종이 달라질 수밖에 없는 것이다. 배 열법은 이러한 원칙에서 식생을 분류하는 수단으로 사용되었다. 이 제 우리가 배열법의 방법론적 원리를 생물 분류학에 적용시켜 생물
의 특성을 환경이란 관점에서 조사하지 않고 분류적 형질이란 관점 에서 조사한다면, 이 방법을 분류에 이용하는 것이 가능해진다고 하겠다. 9.3 배열법의 과정 Goodall(1954) 은 배열을 〈단위를 일차 또는 다차원 공간 내에 정 렬 시 킴 (an arrang em ent of unit s i n a uni- o r multi dim ensio n al order)> 이 라고 정의하였다. 식물사회학에서는 배열법을, 관찰 대 상을 좌표를 이용하여 배열함으로써 식생의 분류를 가능하게 하고 서식지 환경과의 관계를 좀더 명확히 요약하여 표현되게 하는 과정 중의 하나로 사용하고 있다. 이를 동식물의 분류에 이용하고자 한 다면, 좌표상에 배열된 대상을 모이는 정도에 따라 몇 개의 무리로 나누는 방법으로 사용할 수 있다고 하겠다. 배열법은 대상 간에 존 재하는 유사도로부터 출발한다. 다시 말하면, 숫자로 표시된 유사 도를 좌표상의 거리로서 나타내는 방법이다. 좌표의 축은 한 개의 축이 사용되 기 도 하고 (unid i m e nsio n al ordin a ti on ) 몇 개 의 축이 사용되 기 도 한다 (multid i m ensio n al ordin a ti on ) . 배 열 법 에 서 제 안 된 방법론적인 중요한 착상온 축을 설정한 일과, 축에서 각 대상의 좌표 설정을 가능케 한 일이라 하겠다. 그러나, 이 방법이 완전히 정립되었다고는 볼 수 없다. 예를 들면 설정된 축에 의해, 각 대상 이 가지는 유사도가 어느 정도 반영되겠는가가 문제될 수도 있다. 배열법의 제안자들은, 각 대상 간의 유사도와 좌표에 의해 배열된 각 대상 간의 거리가 어느 정도 일치하는가를 검정함으로써, 배열 법에 의한 결과의 신뢰도를 표시하여 좌표에 의한 배열의 타당성을 인정하도록 하였다. 이 장에서는 좌표를 이용하여 대상을 배열하는 방법과 결과의 검 정 방법을 구체적으로 기술하고자 한다. 대부분의 논문이 다차원 상에서의 배열을 주로 취급하고 있으므로 다차원 배열만을 소개한 다. 방법 자체도 어디까지나 기술 통계학의 범주에 속하는 관계로
저자에 따라 그 방법이 매우 다양하다. 여기서는 배열법의 원칙을 이해시키는 데 주안점을 두었으며 따라서 배열법의 원칙을 가장 찰 이해할 수 있는 과정, 하나만을 소개한다. 배열법의 여러 변형에 대하여는 Whit tak er(1982) 등의 저서에 자세히 기술되어 있다. 아 래에 소개되는 배열법의 과정은 Bra y와 Cu rti s(1957) 의 방법에 따 론것이다. 9.3. I 좌표축의 설정 및 좌표값 생물 개체를 대상으로한 분류적 기초자료는 각 개체의 분류적 형 질이 정성 또는 정량적으로 조사된 자료이며 이는 보통 행렬로 정 리된다. 배열법은 집괴분석법과 마찬가지로 이 자료행렬의 유사지 수행렬로부터 출발한다. 따라서, 제 7 장의 101 쪽에서 계산 예로써 소개한 유사지수행렬 (15) 를 직접 이용하여 배열법의 과정을 설명하 겠다. 일반적으로 배열법에서는 좌표상에 나타난 개체들 간의 거리 개념을 이용하기 때문에 유사지수보다는 거리지수를 주로 사용한 다. 유사지수행렬 (15) 의 유사지수를 거리지수로 환산하여 거리지수 행렬로 나타내면 표 9.1 과 같다.
표 9.1 유사지수행렬(1 5) (제 101 쪽)로부터 환산된 거리지수행렬 대상 X1 X2 x3 x. x5 XI 0.0 0 0 X2 0.375 0.000 x3 0.667 0.625 0.000 x4 0.125 0.444 0.700 0.000 x5 0.600 0.700 0.667 0.500 0.000
표 9.1 에는 대상과 대상간의 유사도가 상대적인 거리로서 기재되 어 있다. 이제부터 우리가 시도하는 일은 이 거리를 그대로 유지하 면서 각 대상이 한 공간에 배열되도록 하는 일이다. 만일 우리가 단순히 두 개의 대상만을 가지고 있고 이들이 가지는 거리에 의해 두 대상을 공간에 표시하려 한다면, 직선을 긋고 이 직선상에 두
대상의 위치를 그들이 가지는 거리에 의해 설정하면 될 것이다. 그 러나 우리가 가지고 있는 대상은 여러 개이고 이 대상 모두를 한 공간에 나타내면서 동시에 각 대상끼리 갖는 거리가 표 9.1 에 나타 난 거리와 비례하도록 하는 일은 쉽지 않을 것이다. 지금부터 소개 하는 내용은 바로 이 문제롤 다루는 것이다. 표 9.1 의 대상 X1 부터 Xs 까지를 좌표에 나타내기 위하여는 x 축, 또는 y축과 갇온 축이 필요하게 된다. 또 각 대상이 축에서 가지는 상대적 좌표값을 알아야 한다. 이때, 상대적 좌표값은 위의 거리지수행렬로부터 계산되어야 한다. 또한, 상대적 좌표값을 설정 하기 위하여는 각 축의 길이, 죽 초기점과 최종점의 위치를 알아야 한다. 우선 x 축 및 x 축의 초기점 설정 문제부터 살펴보기로 하자. x 축 에서의 초기점과 최종점이 되는 두 개의 대상은 거리지수가 가장 커서 최대 길이를 가지게 되는 두 개 대상을 선정함으로써 이루어 진다. 표 9.1 의 예라면, x3 과 x.( 거리지수 0.700) 또는 Xs 와 X2 (거리지수 0.700) 가 되는데, 이들 두 쌍의 거리지수가 우연히 동일 하므로 임의로 x3 과 X4 롤 선택하기로 하자. x3 과 X4 가 선택되면, 이들 중 하나를 초기점, 다른 하나를 최종접으로 하고 X3, X, 간 의 거리지수를 x3 과 X4 의 x 축 상의 거리로 놓을 수 있다. Beals 는 각 대상이 갖는 거리지수의 합이 가장 큰 대상을 초기점으로 설 정하자고 제안하였는 바, 이 원칙 역시 모든 대상이 설정된 x 축 상에 오도록 하기 위한 것이다. 이 의 에도 Newsome 과 D ix는 초기 점이 되는 대상은 기타 대상과 유사성이 50% 이상의 관계를 가지 는 대상 3 개를 가져야 한다고 주장하였다. 이 문제에 더 관심있는 독자는 MUller-Dombo i s 와 Ellenber g (1974) 의 저서 『식생생태학의 목적과 방법』 제 10 장을 참고하기 바란다. 위에 예시한 이러한 조건들은 초기점으로 선정된 대상이, 경우에 따라서는 관찰시의 특수 상황이나 실수로 전체 자료의 성격에서 예 의적인 대상이 될 수 있는 · 가능성을 배제하기 위한 것들이다. 이 장에서는 Bra y와 Cu rti s 의 원칙을 따라 X3 과 X4 를 선택하였다. 이제 초기점과 최종접으로 선정된 x3 과 x. 를 x 축상에 놓고 이들 두 대상간의 거리들 Lx 로 놓으면 Lx=0.700 이 되며 이를 x 축 상
에 그림으로 나타내면 다음과 같다. &) Lx=O. 70 0 ( 凡B、'’ ` 그러면, X3 과 X4 이의의 다론 대상 X1,X2,X5 는 x 축 상에 어떤 좌표값을 가지게 될까를 생각해 보자. 배열법에서는 이 문제를 해 결하는 방법으로 거리지수를 피타고라스의 정리를 이용하여 해결하 고 있다. 두 개의 대상이 x 축에서 가지는 점을 각각 A, B, 새로 이 설정되야 하는 대상의 x 축 상의 위치를 P, A 로부터 P 까지의 거리를 x 라 하면 점 P 의 x 축상의 좌표값이 되는 KF 의 거리값 x 는 식 (1) 과 같다. x= L 났 +d2AL2x- dB2 (1) 그립 9.1 에 점 P 에 관한 상황을 나타내었다. 그림 9.1 로부터 피타 고라스의 정리를 이용하여 KF 의 거리값인 동시에 점 P 의 x 축상에 서의 값인 x 를 구하면 식 (1)을 얻는다(아래에 소개한 유도과정을 참고할 것).
P'
dA2=x2+e2 -) dA2— ddBB 22== x(L2 -x-(xL )x22+ -e22L x•x+x2) +e2-e2 =2Lx• x-Lx2 :. x= L 났 +d2AL2x- dB2 예를 들어, 대상 X2 의 x 축에서의 좌표값을 구해 보면, dA( 초기접인 대상 X3 과 대상 X2 간의 거리지수) =0.6 2 5 dB( 최종점인 대상 x4 와 대상 X2 간의 거리지수) =0.444 이므로 x= o. 72 + 20 X. 6 O2 .정 7 0-0 0 . 4442 =O.489 가 된다. 위의 예에서와 마찬가지로 식 (1) 에 의하여 각 대상이 x 축에서 갖는 좌표점을 거리지수행렬인 표 9.1 로부터 구하면 표 9.2 와같다.
표 9.2 X 축에서 각 대상이 갖는 좌표 (Lx=O.7) 대상 dA2 dB2 X X1 0.445 0.016 0.656 X2 0.391 0.197 0.4 8 9 x3 0.000 0.490 0.000 x4 0.490 0.000 0.700 Xs 0.4 4 5 0.2 5 0 0.4 8 9
또한 표 9.2 에서 얻어진 대상의 각 x 값을 AB 직선 위에 (x 축에) 좌표로 나타내면 다음 그림과 갇다. A XJs B f t f f x3 X2 X1 X. 이제 y축의 설정 방법을 알아보자. y축의 설정 역시 x 축의 설정
과 그 원리는 마찬가지이다. 그러나, 각 대상을 새로운 축 y에 나 타내야 하므로 각 대상이 x 축으로부터 떨어진 거리를 계산해야만 한다. 죽 x 축에서 각 대상의 x 좌표값은 거리지수행렬로부터 쉽게 구할 수 있었으나, y좌표의 경우는 x 축 전체에 대한 각 대상의 y 좌표값을 구해야 하는 것이다. y축의 설정 역시 초기점과 최종점, y축의 길이 등이 결정되어야 함은 물론이다. 초기접은 x 축과 가장 관계가 적은, 다시 말하면 x 축으로부터의 거리가 가장 큰 대상으 로 선정한다. 이는 초기점이 y축 좌표상에서 0 에 해당되는 원점이 되어야 하므로, x 축과 가지는 관계가 적은 대상이 선택되어야만 하기 때문이다. 또한, 초기점이 이렇게 선정되어야 이 대상과 거리 계수가 가장 큰 대상을 최종점으로 함으로써 모든 대상이 y축의 범위 내에 들어오도록 y값이 정해질 수 있다. y축에서의 최종점은 x 좌표값이 x 축 길이의 중간값에서 10% 의 오차를 가지는 값을 가 진 대상이 선택되어야만 한다고 주장하는 학자도 있다. 이는 가능 한 한 y축을 x 축에 직각이 되도록 하기 위 함이나, Bra y와 Curt is 는 이 문제를 중요하게 취급하지 않았다. 다시 초기점을 선정하는 실제 예로 돌아간다면, 초기점이란 x 축 으로부터 떨어진 각 대상의 길이이므로 이는 그립 9.1 의 e 값에 해 당된다. 그림 9.1 에서 보면, e2=dA2-x2 이므로 각 대상의 e 값을 구하여 정리하면 표 9.3 을 얻는다.
표 9.3 각 대상이 갖는 x 축으로부터의 수직거리 (편의상 e 값 대신 한의 값을 기록함) 대상 | dA2 dB2 X e2=dA2-x2 X1 0.4 4 5 0.016 0.656 0.015 X2 0.3 9 1 0.197 0.489 0.1 5 2 x3 0.000 0.490 0.000 0.000 x. 0.4 9 0 0.000 0.700 0.000 Xs 0.4 4 5 0.2 5 0 0.489 0.2 0 6
표 9.3 으로부터 x 축으로부터의 수직거리 e 값이 최대인 대상은 대상 X 대을 알 수 있다. 따라서, 초기접은 대상 X5 가 된다. 최종
점은 x 축의 설정에서와 마찬가지로 대상 Xs 와 가장 관계가 빈약 한, 죽 거리지수가 가장 큰 대상을 선택하면 된다. 따라서 최종점 은 거리지수행렬을 나타내는 표 9.1 로부터 대상 X2( 거리지수 0. 7) 임을 알 수 있다. 이때, y축의 길이는 대상 X2 와 Xs 의 거리지수 0 . 7 이 된다. 이제 초기점과 최종접의 대상 및 y축의 길이가 결정되었으므로 각 대상이 축에서 갖는 y좌표값을 구해야 한다. 이는 그 원리가 x 축에서 x 좌표를 결정하는 방법과 동일하다. 죽 y축의 초기점만 결 정되면 (x 축으로부터 각 대상이 가지는 수직거리에 의해) x 축으로 부터의 거리는 더이상 고려되지 않으며 , y좌표값은 거리계수행렬 로부터 직접 구하게 된다. 표 9.1 에 제시된 거리지수행렬로부터, 예를 들어 대상 X3 의 y좌표값을 구해 보자. x 축에서와는 달리 y축 의 경우, 초기점이 대상 Xs 였으므로 대상 Xs 로부터 갖는 각 대상 의 거리지수를 기초로 계산하여야 한다. 따라서, 표 9.1 로부터 dA( 초기접인 대상 X5 와 대상 X3 간의 거리계수) =0. 66 7 dB( 최종점인 대상 X2 와 대상 X3 간의 거리계수) =0.625 이로부터, y= Ly 2 +dA2_dB2 o. 72 + 2~0L .y 6 6=72 —00 . 6. 2532 89 의 값을 대상 X3 의 y축의 좌표값으로 얻게 된다. 이렇게 계산되는 y좌표값을 표 9 . 4 에 나타내었다.
표 9.4 y축에서의 각 대상의 y좌표(초기점은 대상 Xs 이며 최종 점은 대상 X2, 이때의 y축의 길이는 L y =0 . 700 이다) 대상 dA2 dB2 y XI 0.360 0.141 0.506 X2 0.490 0.000 0.700 x3 0.445 0.391 0.389 x. 0.250 0.1 9 7 0.388 x5 0.000 0.490 0.0 0 0
마찬가지 방법으로, 필요하다면 z 축 내지는 그 밖의 축을 계속 만들어낼 수 있다. 이 장에서는 방법을 기술하는 것이 목적이므로 x, y로 이루어진 2 차원까지만 소개하고자 한다 . x, y 2 개의 축을 이용하여, 위의 예의 각 대상을 좌표상에 나타내면 그립 9.2 와 갇 다. Y 0.6 0 .4냐 I • •4 0.2 2,5 x 0. 2 0.4 0. 6 0.8 1.0 그림 9.2 표 9.1 의 거리지수행렬로부터 계산된 좌표값을 이용 한 각 대상의 배열 표 9.1 에서 기재되었던 대상 간의 거리지수는 그립 9.2 에서 볼 수 있듯이 좌표상의 점으로 표시되었다. 이 배열법의 과정을 통하 여 복잡하게 나열되었던 유사지수가 요약된 형태의 그립으로 나타 남을 알 수 있다. 9.3 . 2 배열 결과의 통계적 검정 Bra y와 Cu rti s(1957) 에 의해 제안된 배열법은 그동안 여러 학자 에 의해 수정되고 발전되어 왔다. 또한 이용자의 목적이나 자료가 다르기 때문에 각 경우에 적합한 방법들이 제안되기도 하였다. 그 러나 어떠한 방법이든 이론적으로는, 최종 배열된 결과가 최초 출 발접이었던 대상 간의 유사지수를 어느 정도 반영하는가가 문제가 된다. 물론 y축을 인위적으로 직각이 되도록 설정할 수 있는가에 도 문제가 제기되고 있기는 하다. 그러나, 이 역시 축에 의해 배열 된 대상 간의 거리가 대상들 간의 유사지수를 정확히 반영하기만
한다면, 배열법을 하나의 표현방법으로만 간주함으로써 각 축의 직 각에 대한 타당성이 인정될 수 있다고 하겠다. 따라서, 배열된 각 대상을 최초의 각 대상 간의 유사지수와 비교 검토하는 것은 배열 법에 있어서의 중요한 과정 중의 하나이다. 그러면 이제부터 이러 한 검정이 어떠한 방법에 의해 수행되는지 살펴보자. 그립 9.2 에 의한 대상의 배열은 각 대상 간의 유사 정도를 기하 학적으로 나타낸 결과라 하겠다. 이때, 대상 간의 유사 정도는 배 열법의 과정에서 알 수 있듯이 각 대상 간의 거리로서 표현되었다. 따라서, 최초의 유사지수와 배열법에 의한 대상간의 거리를 비교함 으로써 최종 결과에 대한 검정은 이루어질 수 있다. 각 대상 간의 유사지수는 거리지수로써 표 9.1 에 주어져 있다. 배열에 따른 각 대상 간의 실제 거리는 배열의 결과인 x, y축의 좌표로부터 구해 전다. 예를 들면, 대상 X1 과 대상 X2 의 배열 거리 (ordin a ti on int e r val ; O .I.)는 아래 식 (2) 로부터 구하면 된다. O.L=/(x1 집)도 (Y1 玉 )2 (2) [(x1, yI) : 대상 X1 의 좌표 (X2, Y2) : 대상 X2 의 좌표 =~=0.533 이러한 방법에 의해 각 대상 간의 거리지수와 좌표상의 대상 간의 거리를 계산하면 표 9.5 와 같다(단순한 계산 예이므로 몇몇 비교 대상 짝을 제의시킴).
표 9.5 각 대상 간의 거리지수 및 배열에 의한 좌표상에서의 거리 비교대상 (X i) 짝 거리지수 (x) 좌표상에서의 거리 (y) 1:2 0.375 0.533 1 : 3 0.667 0.6 6 6 1 : 4 0.125 0.126 2 : 3 0.625 0.624 2 : 4 0.4 4 4 0.443 3 : 4 0.7 0 0 0.700 3:5 0.667 0.624
이제, 최초의 거리지수와 배열의 결과인 좌표상에서의 실제 거리 가 어느 정도 일치하는가 를 검정하기만 하면 된다. 이는 일반 동계 학에서 다루는 바와 같이 상관계수를 계산함으로써 이루어질 수 있 다. 표 9 . 5 에서와 갇이 거리지수를 X, 좌표상에서의 거리를 y라고 하면, r= 고2 ( x(-xX_)x 2) . 고• ( y(y__yy) )2 =0.956 이 된다. r=0.9 5 6 으로부터 우리는 거리지수와 배열 거리가 거의 일치함을 알 수 있다. 만일 우리가 이를 다시 t-검정을 이용하여 검정한다면, t= rrn =z= o . 956 万걱 =7.30 八 ✓ E0.9562 t-t able 을 보면 a=0.5% 의 값이 6.869 이므로 0.5% 수준에서도 위 의 가설을 기각함은 부당하다. 죽 0.5% 수준(p =0.005) 에서도 위 의 배열결과는 유효하다고 할 수 있다. 반대로 말하면, 거리지수를 기본으로 출발한 배열법에 의한 각 대상의 좌표상에서의 거리는 원 래의 거리지수에 대하여 99.5% 의 신빙성을 가지고 서로 일치한다 고하겠다. 이제까지 우리는 대상간의 복잡한 상호관계를 나타내는 유사지수 롤 요약된 형태로 좌표상에 나타내는 배열법을 살펴보았다. x, y 축의 인위적인 설정이 기술 통계학적 방법이므로 배열법의 수학적 타당성에 대해서는 논란의 여지가 있을 수 있다. 그러나, 결과에 나타나는 좌표상의 거리가 유사지수와 가지는 유의성이 매우 크기 때문에, 배열과정의 수학적 공리나 증명이 완벽하지 못함에도 불구 하고 배열법의 유효성을 인정하지 않을 수 없다. 이러한 배열법을 이용한 식생의 분류는 우리나라에서도 많이 수행되었다. 오 (1987) 에 의해 발표된 논문이나 김 (1983) 의 학위논문은 배열법이 실제로 어떻게 이용되었는가에 대한 좋은 예를 제시한다.
제 10 장 요인분석법에 의한 분류군의 배열 요인분석 (要因分析, fac to r anal y s i s) 은 분류학에서 배열법 중의 한 방법으로 흔히 받아들여진다. 그러나 요인분석은 배열법의 일종 이 아니다. 요인분석의 결과가 배열법과 같이 분류를 시행하는 데 이용되는 경우가 있을 뿐이다. 분류학에서는 요인분석을, 대상을 분류하는데 주로 이용하고 있으므로 분류학자는 요인분석이 마치 분류를 수행하기 위해 수리적으로 정리된 방법으로 종종 생각하고 있다. 그러나 이는 요인분석이 잘못 이해된 것이라고 할 수 있다. Snea t h 와 Sokal(1973) 역시 요인분석의 전반적인 것을 독자에게 이해시키지 않은 채 요인분석 결과의 분류적 이용만을 소개하고 있 어 분류학자의 입장에서 요인분석을 어떻게 받아들일 것인가는 문 제가 된다. 그러나 필자는, 독자가 우선 요인분석의 최초 목적했던 바가 무엇인가를 이해하는 것이 중요하다고 생각하며, 만일 이 방 법이 분류에 이용될 수 있다면 그 원리상 어떤 가능성이 있는가를 요인분석을 이해한 상태에서 타전해야 한다고 생각한다. 물론 필자 역시 동계학을 전공하지 않았으므로 방법론적 과정을 상세히 소개 할 수는 없다. 다만 그 원리를 생물동계학의 입장에서 어떻게 이용 할 수 있는 가를 생각하고자 할 뿐이다. 이 책에서는 요인분석을 하나의 독립된 장으로 취급하였다. 요인
분석이 수리분류학에서 많이 이용되고 동시에 그 원리가 집괴분석 과는 전혀 다르기 때문이다. 또 배열법과도 뚜렷이 구분되고 배열 법에서 수행하는 범위 이상을 요인 분석은 수행하고 있다. 우선 요 인분석의 목적부터 살펴보자 . 10.1 요인분석의 목적 요인분석의 방법은 앞 장에서 소개되었던 집괴분석이나 배열법과 는 방법론의 객관성과, 방법론이 가진 본래의 목적이라는 두 가지 관점에서 근본적으로 그 출발점을 달리하고 있다. 첫째, 방법론의 객관성이라는 입장에서 보면 집 .리 분석이나 배열법은 대상의 속성을 정량화하여 유사성을 구한 후 이 유사성으로부터 대상간의 상호관 계를 규정짓는 과정이 기술 통계학의 범주에 속한다. 따라서 이들 방법에 의존하면 한 가지 사실이 여러 형태로 요약되는 단접을 가 지게 된다. 뿐만 아니라 여러 결과 중 다시 타당한 결과를 거의 경 험적으로 판단해야 하는 결점도 가지게 된다. 이에 비하여 요인분 석의 방법은 수학적으로 정리된 공리나 증명을 통하여 확립된 객관 적 방법 중의 하나이다. 죽 과정 자체에 주관적 판단이 개입되는 위험성이 배제되어 있어 방법론 자체로서는 가장 객관적인 성격을 지니고 있다 하겠다. 물론 요인분석의 방법을 분류학에서 얼마나 실용성 있게 이용할 수 있는가에는 문제를 제기할 수 있다고 본다. 그러나 방법론의 입장에서 본 객관의 문제에 있어서는 집괴분석이 나 배열법과 그 차원을 달리하고 있다. 둘째, 방법론의 목적에서 보면 집괴분석이나 배열법의 목적이 사물을 분류하는 데에 국한되 어 있는 반면 요인분석에서는 사물의 분류가 하나의 부수적인 결과 에 지나지 않는다. 요인분석의 주 목적은 사물 또는 속성 간에 내 재된 관계를 요약하여 표기하는데 있다. 요인분석은 통계학의 한 분야이나 심리학자들에 의해 집중적으로 이용되어 심리학 이론을 정립하는 방법론의 일종으로 발전되어 왔 다. 수많은 관찰을 통해 얻어지는 인간의 능력이나 행동들에 대한
자료는 어떤 방향성을 가지고 정리되어야만 이를 이론화할 수 있는 근거를 얻게 된다. 심리학에서, 복잡한 자료들로부터 수학적 방법 에 의해 방향성을 포착하는 시도는 S p earman 이 1904 년에 서술한 General int e l li ge nce, obje c ti ve ly dete r mi ne d and measured 라는 논문에서 시작하였다. 그러나 현대적 개념의 행렬 이용에 의한 본 격적인 요인분석의 방법론은 Thurs t on(1947) 이 대수학으로부터 계 수(階數, rank) 의 개념을 도입함으로써 이루어졌다고 할 수 있다. 오늘날은 요인분석의 방법이 심리학의 범주를 벗어나 사회학, 지리 학 등에서뿐만 아니라 자연과학의 기재를 중심으로 하는 경험적 학 문의 분야에서 자주 사용되고 있는 실정이다. 생물학에 있어서는 요인분석의 방법이 생물학적 사건의 일반적인 분류를 위해 시도되 었던 방법은 아니다. 그러나 최근 이를 생물학의 일개 분과인 생태 학에서 군집의 분류에 적국 이용하고 있으며 이후 분류학에서 역시 직접 이용하고 있음을 볼 수 있다. 따라서 이 장에서는 요인분석이 란 무엇인가를 우선 소개하고 분류학에서 어떤 형태로 이용될 수 있는가, 또 이용하고 있는가에 대하여 알아보고자 한다. 요인분석에서의 요인(要因, fa c t or) 이란 말은 생물학의 생태학 분야에서 주로 사용되는 술어이다. 예를 들어 환경요인이라 하면 어떤 생물 개체나 생물 군집에 영향을 미칠 수 있는 환경적 부분을 일컫는다. 그러나 산술의 개념에서 본 요인이란 곱해지는 두 개의 문자나 숫자를 뜻하기도 한다. 요인분석의 요인이란 이 두 가지 의 미를 모두 함축한다고 할 수 있다. 그러면 요인분석이란 무엇이며 요인분석의 결과가 지니는 의미는 무엇인가를 살펴보자. 자연과학의 많은 분야에서와 마찬가지로 생물학에서도 우리는 어 떤 생물을 대상으로 이 대상물의 여러 속성을 관찰하게 된다. 분류 학에서의 예라면, 생물개체를 대상으로 각 개체의 분류적 형질을 조사하는 작업이라 하겠다. 그러나, 아때 문제가 되는 것은 대단히 많은 사물이나 속성에 관한 정보로부터 사물과 사물 또는 사물의 속성과 속성간에 내재되어 있는 관계를 유추하는 일이 용이하지 않 다는 사실이다. 수리적 방법들은 이러한 문제들을 해결하는 데 많 은 도움을 준다. 일반적으로 자연과학자들은 사전이나 사물의 속성 에 대한 법칙을 파악하고자 노력한다. 이러한 법칙들은 보통 수학
적으로 표시될 수 있으며 만일 수학적 방법에 의해 성공적으로 표 시될 경우, 어떤 알려진 사물 또는 특성의 양상을 수학적 방법에 의해 일률적으로 다른 사물에 적용함으로써 예견을 가능하게 한다. 물론 이때 수학적 모델과 실제 관찰 자료의 불일치는 언제나 일어 날 수 있다. 그러나, 만일 어떤 수학적 모델이 관찰 결과와 찰 일 치 한다면 모델에 관한 이론들은 다른 관찰 사항울 설명하는 데 자 주 사용될 것이다. 요인분석은 바로 사물 또는 속성 간에 내재된 관계를 수학적 모델로써 요약하여 표기하는 데 성공적으로 사용될 수 있는 통계학의 한 분야이다. 요인분석 자체가 가지는 가장 주된 목적은 〈대상 사물〉에 대한 대단히 많은, 관찰된 〈속성〉들을 〈요인〉이라고 불리는 몇몇 범주의 속성으로 요약하는 데 있다. 죽 복잡한 자료로부터 이 자료에 내재 된 몇몇 가지 방향성을 추출하는 방법 중의 하나이다. 따라서 이를 과학적 절약 (s ci en tifi c pa rsim ony ) 또는 경제적 기재범이라 하기도 한다. 이러한 과정의 일부 결과가 사물의 분류에 이용된다. 이제 요인분석의 과정이 실제로 어떻게 이루어지고 있는가를 수식을 제 시함으로써 그 원리를 설명하고자 한다. 요인분석 결과의 해석에 대하여는 제 10.3.3 장에서 예를 통하여 보여질 것이다. 10.2 요인분석 과정 우리가 일반적으로 자연 현상에서 획득하게 되는 자료는 행렬로 나타내어 질 수 있다. 예를 들어 대상을 행 (N 행)으로써 표시하고 속성을 열 (n 열)로써 표시한다면 이는 다음과 같은 XNn 이라는 자료 행렬이 된다(집괴분석이나 배열법에서는 대상을 열에 기재하였다. 요인분석에서는 계산상의 문제 때문에 대상을 행으로 나타내었다). 수리분류학에서의 예라면 대상은 운영분류단위, 속성은 분류적 형 질이 될 것이다. 자료행렬은 그 열이나 행의 수가 많고 모든 자료가 정량적으로 표시되어 있어 알고자 하는· 현상의 경향을 빠르게 파악하는 데는 부
라는 술어보다는 변수라는 술어가 타당하므로 이제부터는 속성(분 류학에서의 분류적 형질) 대신에 변수로 표기한다)로 변화되었다는 것이다. 이때 물론, m 은 n 보다 훨씬 적은 수이다. 식 (2) 는 적은 수의 새로운 변수를 가지는 F 와 A의 두 개 행렬이 출현하였음을 뜻한다. 행렬식의 관점에서 보면 이는 아주 간단한 일이다. 그러나 이러한 과정은 어떤 근거를 지녀야만 한다. 요인분석의 중요한 장 점은 정확한 수학적 과정에 의해 변수의 수를 줄인 데 있다. 죽 n 차원의 복잡한 관찰 자료행렬을 새로운 m 차원 공간으로 축소한 일 이라고 할 수 있다. 그러면 이러한 차원의 축소가 어떠한 과정을 통하여 이루어지는가 살펴보기로 하자.
z
차원의 축소는 회귀분석의 원리를 이용하여 이루어전다. 예를 둘 어, 우리가 3 차원의 행렬에서 그립 10 . 1 과 같은 변수의 조합을 갖 는다고 하자. X, Y, Z 축에 의해 나타내어진 각 변수의 값은 만약 이 값들이 어떤 방향성을 가지고 서로가 밀접하게 변화한다면, 위 의 그립 10.1 에서 볼 수 있듯이 럭비공 모양의 공간을 X, Y, Z 축 상에서 형성하게 될 것이다. 이 경우 X, Y, Z 축에 대한 변수의 값 들을 럭비공의 장축 및 단축을 이용하여 나타내어도 무방할 것이 다. 물론 이 축들을 대상으로 하였을 때, 각 변수가 갖는 값이 X, Y, Z 축을 대상으로 하였을 때의 값들과 편차가 너무 크면 쓸모없
는 일이지만, 만일 각 변수 값 들 의 관계가 서로 비례적으로 변하여 그림 10 . 1 과 같 이 이상적인 상황 을 나타내다면, X, Y, Z 축을 이용 하기보다는 럭비공 내의 다 른 2 개 축을 이용하여 나타낸다면 훨씬 더 간략한 표현이 될 것이다. 물론 이 때 새로운 축에 근접하지 않 는 값들은 나머지로서 식 (2) 의 경우라면 U 행렬에 포함될 것이다. 선형대수학에서는 축의 수 를 줄이는 원리 를 1 차독립 ( 一 次獨立, line ar ind ep en dent) 또는 종속과, 계수(階數, rank) 라는 개념으로 설명하고 있다. 이 개념들을 생물학자를 위하여 쉽게 설명한다면 l 차종속이란, 변수값의 변화하는 경향이 서로 같은 경우에 해당된 다. 예를 들면, 키, 몸무게, 가슴둘레에 있어서 키가 크면 몸무게 가 무겁고 가슴둘레도 크게 각 변수가 갇은 경향을 가지고 변화할 경우, 각 조사 대상을 3 차원의 공간에 나타낸다면 어느 직선을 따 라 배열하게 될 것이다. 이 경우 이들 3 개 변수는 서로 1 차종속의 관계에 있다고 말한다. 만일 우리가 N 개 대상을 중심으로 n 가지 속성을 조사하였다면 이 n 가지 속성 중 서로가 1 차종속적인 짝둘 이 존재할 것이고 또한 서로 1 차독립적인 짝들도 존재할 것이다. 요인분석은 n 개의 속성 중 이들 속성의 각 대상에 따른 값이 서로 1 차종속적인 것을 모아서 하나로 묶어 새로운 가설적 속성으로 취 급하는 방법이다. 반대로 말하면, n 개의 · 속성 중 서로 1 차독립의 성격을 가지는 특성의 〈묶음〉이 몇 개인가를 찾는 일이라고 하겠 다. 이때, 서로 1 차독립의 성격을 가지는 묶음이 몇 개인가 (1 차독 립이 몇 개인가)는 바로 계수의 개념에 해당된다. 요인분석의 출발점인 XNn=FNm • Amn+UNn (식 2) 는 X 를 F 와 A 의 1 차결합(一次結合, line ar comb i na ti on) 으로 나타냈다고 말하 며 이때 m 은 바로 행렬 X 의 변수의 계수의 수롤 뜻한다고 볼 수 있다. 즉 최초의 자료행렬로부터 1 차독립적인 F 와 A의 ·1 차결합을 구하는 것이 요인 분석의 원리이다. 요인분석의 방법은 바로 아러 한 원리를 이용하여 복잡한 자료를 단순화하고 단순화된 값으로부 터 각 대상에 내재된 속성의 중요한 성격을 추론하는 데 사용된다 고하겠다. 식 (2) 는 자료행렬 XNn 을 어떤 두 미지행렬 F 와 A의 곱으로 나 타내고, 그 나머지를 UNn 으로 놓은 것이다. 그러나 이때 곱해지는
두 미지행렬 F 나 A 는 임의 로 선택 될 수 있는 것이 아니라 몇 가지 제한조건이 주어지게 된다. 이때 제한조건이 목적하는 바에 맞도록 설정되는 것이 요인분석의 원리이다. 따라서 목적하는 바에 따라 그 방법이 조금씩 다르기도 하다. 그러면 식 (2) 를 풀기 위하여 어 떠한 제한조건이 주어지는가를 살펴보자. 제한조건이 무엇인가를 살펴보기 위하여 우리가 참시 하여야 할 일은 자료행렬의 표준화 작업이다. 왜냐하면 보통 우리가 얻는 대 상의 속성에 대한 자료들은 속성의 종류에 따라 측정되는 단위가 다르기도 하고 그 분산의 범위가 다르기도 하기 때문이다. 표준화 작업은 식 (3) 과 갇이 평균을 0, 표준 편차를 1 을 가지도록 행해진 다(통계학 교과서 참조). zkJ = XkJs - jX J (3) 우리는 자료행렬 XNn 대 신에 이 제 부터 표준화된 행 렬 ZNn 으로부터 출발할 수 있다. 이제 식 (2) 는 식 (4) 와 같이 표현된다. Z=F•A'+U (4) 이 행렬을 ZIzl N.k헛… 풀•. . · 어 · 露간:·…쓰···면z· ,· .n : z다··kn.음=z: N n과』 갇·다· ·.占L和….. .. ·. ·…』』…』 뻬 • · a…a…m u I ~.…“멘.또邸~~.aa …… ..|니:…딴g니 +… · ·.u· ..I:%`•knu ..:n Nu [n ·· 다`會 fu…fkl…` 』au a ‘ 식 (4) 에서 F 와 A 를 구하는 방법에는 저자에 따라 주성분분석 (主性分分析, pr in c i ple comp o nent analys i s ) , 중심분석 (中心分析, centr o id meth o d) 등 F 와 A 를 구하기 위 하여 어 떠 한 제 한조건을 주느냐에 따라 몇몇 가지 방법이 있다. 본 란에서는 주성분분석법 울 소개하고자 한다. 아래의 계산과정은 Klovan(1975) 을 대폭 참 조하였다.
식 (4) 몰 풀기 위하여 우리는 어떤 제한조건을 주어야 하는데 이 를 위하여 위의 각 행렬이 가지는 상호 간의 관계를 좀더 살펴보 자. 우선 유사계수행렬 R 과 표준자료행렬 Z 사이에는 다음의 식 (5) 의 관계가 성립된다(유사계수행렬 표준자료행렬의 관계는 통계학 교과서에 잘 소개되어 있으므로 참고하기 바란다). R=..N .L Z 'Z (5) 또한 행렬식 (4) 로부터 표준편차가 A 및 F 와 갖는 관계는 식 (7) 과 갇다. 죽 표준화된 자료의 표준편차는 1 이며 동시에 Z 와의 관계는 다음 식 (6) 과 갇으므로 S/=1= —1 고N z& (6) Nk=1 식 (4) 의 Z 롤 식 (6) 에 대입하여 행렬식으로 풀면 다음 식 (7) 을 얻 는다. S f =a i -~+a 웅j· 햏도 ·•+a 益 z:; 타루 +2· ( 로당“ + aI J a3 J홈f kI f + ……) + aIJ2 Nf kIU k J +' …+' amJ 2 Nf km ukJ =1 (7) 이때, ~fR./ N, ~fR2 /N, …, ~fb/ N 등은 F 행렬 자체가 표준화 된 Z 로부터 출발하였기 때문에 모두 l 이다. 또한 ~f K1 f K g /N 의 항 은 모두 0 이어야 한다. 왜냐하면 f는 새로 형성되는 축을 뜻하기 때문이다. 새로 형성되는 축은 기하학적으로 서로 직각이어야 하며 직각의 경우 f x f =O 의 값을 갖는다. 축이 서로 직각이어야 한다는 가정은 요인분석의 과정 중 Z=FA' 의 식을 풀기 위한 매우 중요한 가정이다. 따라서 , 식 (7) 은 식 (8) 과 같이 간략히 정 리 된다. Sf = afi + a~i + •• • a ~ + uf = l (8) 이때, 착오범위 u f를 제의한 부분을 공동성 (共同性, communa lity)이
라 하며 이를 식 (9) 와 같이 h2 으로 나타내기도 한다. hf = a~1 + a~1 + •• • + a 盆 (9) h J란 각 변수가 갖는 대상들에 의한 편차를 뜻하며, m 개의 축소된 가설적 변수 m 개에 대하여 각 대상이 갖는 값의 편차를 구하면 (이때, 이를 V 라 하자) 식 (IO) 과 갇다. 주성분분석의 원리는 바로 이 V 값을 최대로 갖는 가설적 속성을 값이 큰것부터 차례로 추출 하는 데서 출발하며 이문제는 제 154 쪽에서 상세히 설명되는 고유 치 (固有値, e ig envalue) 의 문제와 연결된다. V1=ar1+ar2+… + arj =J2=n l a fj O0) 식 (9) 와 식 (10) 의 상황을, 참고로 A 와 함께 행 렬로 풀어 쓰면 다음 과같다. hhEE”』::r f딩g ==== ana헛n…a.ml aaaa· r::j 孟1f amj2 언또…年 : ++++ 2 · ·aaaa E~: :눕웅 ·5 .n%il 玉玉… ++++· . ·………• ·• .• 5%….…』 ++++ `a aaa.r_::5f1r 2n +++ + …••…VVV••1 •• : ‘112m ++ ++ = == =aaaa ~;: aaa益a~ 21~~: :孟? 1 1 1 ++++ aaaa? : 뇨f눕2 2 + +++ … …•. .• •, + ++ + aaaa:5: 孟젊t ++++ … ……••· ++++ aaaa 뇨f~딩 nn 위에 열거한 조건하에서 Z=FA'+U 의 방정식을 푸는 과정은 다음 과갇다. R=Z'Z Z=FA' R= (FA')' FA'=AF'FA' 이때, F'F=I 이다. 왜냐하면, 새로 형성되는 두 축은 직각이어야 하기 때문이다(제 148 쪽 참조). 따라서,
R=AA' 가 된다. R 은 우리가 자료행렬로부터 구할 수 있는 상관계수 행렬 이지만 A 는 미지행렬이다. 식 (10) 에서 V1, V2, …, Vm 이 분산값이 큰 순서라는 의미는 고유 치의 문제와 연결되어 (제 152 쪽에서 상세히 설명될 것임) 다음의 식 (11) 이 성립된다. A'A = A (A = dia g o nal matr i x of eig e nvalue of R) (11) 이를 R 에 대한 고유벡터 (eig envec t or) 로 나타내면, U'R U=A (U=eig e nvecto r matr i x ) 이때, U 와 U 는 서로 직각이다. 왜냐하면, 고유벡터는 서로 1 차 독립적이라야 하기 때문이다. U'U=UU' = I 이제 A 나 F 등에 대한 제한조건은 모두 제시되었다고 볼 수 있다. 따라서, 위에 열거한 식을 A 와 F 에 대하여 정리하기만 하면 된다. 그 과정은 다음과 같다. UU 'R U=UA RU=UA RUU'=UAU R=UAU ' 상관계수 행렬 R 은 이제 R 행렬의 고유치와 고유벡터로서 표시되었 다. 죽 U 와 A 은 R 로부터 직접 구할 수 있는 행렬이다. 따라서 행 렬 A 는 다음과 갇이 구해진다. R = UAU ' = UA 당샤 u’ (R 이 squ are sym metr i c ma t r i x 이 므로) R=AA'=UA 살 A½U A=UA 승 (12) F 에 대한 해는 이제 A 를 알고 있으므로 다음과 같다.
Z=FA' ZA=FA'A ZA=F/ l F=ZA/ l-1 (13) 참시 위에서 제시된 F 나 A 행렬을 구하는 방법의 원리에 대하여 다시 생각해 보기로 하자. 아래의 설명은 어디까지나 복잡한 수학 울 싫어하는 생물학자를 대상으로 하여 정리나 증명을 피하고(실제 로 이는 선형대수학에 잘 설명되어지고 있음) 그 원리를 풀어서 기 술한 것이다. 고유치를 기하학적으로 풀이하자면 각 속성이 가지는 다면체 상 에서의 1 차종속적인 속성의 모임에 대한 축의 길이라고 할 수 있 다. 따라서 우리가 만일 R 행렬의 고유치를 구한다면 상관관계를 기초로 하여 각 속성이 가지는 공간상의 분포축의 길이를 알 수가 있다 . R 행렬은 상관계수의 행렬이다(상관계수의 의미, 다음 제 159 쪽 참조) . 상관계수란 분산(分散, varia n ce) 과 공분산(共分散, covar i ance) 의 비율이므로 R 행렬의 각 값은 분산과 함수관계 (R=f (var . ) )에 있다고 할 수 있다. 따라서 우리가 R 의 고유치를 구하 여 이룰 크기 순서로 나열한다면, 이때의 각 고유치는 분산값과 관 계되어 나열된 것이라고 볼 수 있다. 고유치가 R 행렬자료의 구조 를 나타낸다면 (R= f(tl)) 고유치가 큰 축이 R 의 많은 정보를 함유 한다고 볼 수 있으며 이때 정보의 많음 정도는 R 행렬이 분산과 함수관계에 있으므로 결과적으로 분산의 의미로서 나타내졌다고 할 수 있다. 죽 식 (l0) 의 V 는 V ex: tl of R 의 관계 에 있다고 하겠다. 고유치가 정보의 양 정도를 나타낸다는 의미를 참시 수치롤 사용 하여 살펴보기로 하자. 임의의 행렬 R 이 다음과 갇이 구성되었다 고 하자(실제 상관계수 행 렬 R 은 r= vacro Xv1 xvI aXr2 X 2 결 계산하여 대 입 하면 대 각 (對角, dia g o nal) 값이 분산값을 가지 며 그 밖의 값이 공분산값을 가지는 행렬이다 아래의 행렬 R 은 그러나 한 개의 r 값 만이 표시된 행렬에 불과하다). R= [var xI COV XIX2 cov xIX2 var x2 ]
예로써, R=[~;:! ~\\]이라면 이때, A 값을 실제 계산하면 32. 8 또는 11.6 을 갖는다. 또한 A 값의 합 (32.8+11 . 6) =44 . 4 는 대칭행 렬 R 의 var X1+var X2 인 대각값의 합 (20.3+24 . l) =44.4 와 일치 함을 참고로 알 수 있다. 위의 예 R 행렬이 A1=32.8, A2=l l. 6 의 값을 가질 때 이 값을 각 축이 가지는 정보의 양으로 환산하면 제 1 묘 곱 ¼=74%, 제 2 축은 札멋 =26% 가 된다• R 은 분산의 함 수값이고 R 이 포함하는 분산의 총양은 var X1+var X2 이므로 44.4 의 상대적인 값으로 나타내어졌다. A 의 총합 역시 44.4 이므로 '1 1 는 위에서와 갇이 44 .4를 설명하는 정보의 양을 퍼센트로 나타내는데 사용될 수 있다. 물론 이때 A 는 분산의 양으로써 표시된 것이다 (V ex: A of R 임으로). 결과적으로 보면, R 행렬은 분산의 성격을 가 지는 A 로서 나타낼 수 있다고 하겠다. 이로써 우리는 XNn=FNm Arnn 으로부터 출발하여, X 로 부터 유도된 R 이 A 의 성격으로 나타 내어침을 알았다. 또한 A 가 m 개란 바로 1 차독립의 변수의 수가 m 개이며(이는 곧 새로운 가설적 속성 . f의 갯수), 이때 축의 길이는 AI, A2, …, Am 에 해당되고 이 A 값을 이용하여 각 f가 가지는 정보 의 양을 퍼센트로 나타낼 수 있음도 알았다. 식 (I I)의 A'A=A of R(A=dia g o nal matr i x of A1, A2, …, Am) 은 A의 값을 알기 위해 주어지는 하나의 가정이다. 제 151 쪽에서도 설명한 바와 같이 R=f (A) 이고 R=AA' 였으므로 AA'=R= f (A) 로 놓을 수 있고, 따라서 A'A=A of R 로 가정할 수 있겠다. 실제로 A 란 어떤 임의의 행렬 R 에 다른 임의의 행렬 U 를 곱했을 때 RU =AU 가 되는 계수이다(선형대수학 참조). 따라서 A 를 고유치 값을 가지는 대칭행렬로 놓는다면 U' RU=A 도 성립된다. 이러한 가정 하에서 제 150 쪽의 해가 가능하고 결과적으로 F 및 A 행렬이 구해 진다고 하겠다.
10.3 요인분석 결과의 해석 10.3.1 A 및 F 행렬의 해석 원칙 앞에서 우리는 자료행렬 XNn 으로부터 대상의 속성수가 축소되어 새로운 속성으로 나타난 FNm 행렬과 Arnn 행렬을 얻었다. 이제 F 와 A 가 의미하는 바를 생물학의 입장에서 좀 더 살펴보고자 한다. F Nm 행렬은 원래의 자료행렬에 나열되었던 N 개의 대상이 n 개의 속성 에 의하여 표현된 것이 아니고 몇몇 새로운 〈가설적 속성〉 m 개에 의하여 표현되었다. 죽 F 행렬의 행렬값 f는 각 대상이 갖는 가설 적 속성에 대한 값이다. 예를 들면, 어느 중학생의 키 148cm, 몸 무게 45kg , 가슴둘레 80cm 였다면 키, 몸무게, 가슴둘레 등의 각각 의 속성이 어느 가설적 속성 (나이)의 새로운 값 (15 세)으로 표현될 수 있으며 바로 이 값이 f이다. 죽 N 개의 대상은 각각이 새로이 설정된 가설적 속성에 대한 f값을 갖게 된다. 그러면 이때 〈가설적 속성〉이란 무엇인가? 이 문제에 대한 해답 은 A 행렬에서 찾을 수 있다. A 행렬은 n 개의 속성이 새로이 가설 적 속성 F 에 대하여 갖는 일종의 상관계수 행렬이다. 위의 예에서 본다면 키, 몸무게, 가슴둘레 등의 속성이 새로이 형성되는 가설적 속성에 대하여 갖는 상관계수이다. 이 때 우리는 가설적 속성이 무 엇인가를 알지 못하지만, 이 새로운 속성은 키, 몸무게, 가슴둘레 의 각각의 속성과 a 값 정도의 관계를 가진다고 할 수 있다. 만일, a 값이 키, 몸무게, 가슴둘레의 세 가지 속성에 대하여 모두 큰 값 울 갖는다면, 가설적 속성은 키, 몸무게, 가슴둘레와 공통되게 상 관성이 높은 것으로, 이로부터 우리는 이 새로운 속성이 무엇인가 를 유추할 수 있다. 예를 들면, 이 경우에 있어서는 〈나이〉라고 볼 수도 있다. A 행렬은 다시 말하면 〈가설적 속성〉이 실제로 무엇인가 를 유추할 수 있는 근거를 제공하는 상관계수행렬이라 할 수 있다. A 행렬이 가지는 그 밖의 성격을 좀더 살펴보자. 제 158 쪽의 표
10.3 을 예로 들어 설명하겠다. 표 10.3 은 표 10.1 로부터 계산된 A 행렬이다. A 행렬에서 어떤 임의의 속성 j에 대해서 요인1, 요인 2, 요인 3 의 각 a 값은 hf = af1 +a f2 +a f3 의 관계를 가지며 (밀수가 u 대신에 JI 로 바뀌었다. 표 10.3 의 A 행렬의 Anm 으로 정리되었기 때문이다) 이때 h2 은 속성 j 가 새로이 형성된 요인 1, 2, 3 의 관계에서 가지는 분산값의 합이 다(식 8). 또한 요인 1 의 열의 각 값의 자승의 합은 이 요인 1 의 분산이 된다(식 10). 물론 이때의 각 요인의 분산은 식 (11) 로부터 알 수 있는 바와 같이 A 행렬의 고유치들이다. 이제 각각의 가설적 속성(요인)이 고유치로 나타내어졌는데, 이 고유치란 간단히 말하면, n 개의 속성이 모여지는 점들의 축의 길 이에 해당된다고 할 수 있다. 따라서, 가장 긴 축으로부터 우리는 임의로 몇 개의 축을 선택할 것인가를 결정할 수 있다. 이를 편차 로 나타냈을 경우 각 가정된 속성 f의 누적 분산값으로 계산될 수 있고 바로 이 누적 분산값은 본래의 자료 행렬 X 로부터 새로운 축 으로 전환했을 때 취하게 되는 정보의 퍼센트라고 할 수 있다. 따 라서, 정보를 많이 잃어버리지 않는 한도 내에서 가능하면 적은 수 의 f를 택하므로서 복잡한 자료로부터 가장 중요한 정보만을 추출 할 수 있게 된다고 하겠다. 요인분석의 방법은 원래 행렬 A 를 이용하기 위해서 고안된 방법 이다. 죽 대상이 갖는 복잡한 속성을 단 몇 개의 중요한 속성군으 로 정리하여 이를 새로운 〈가설적 속성〉으로 놓고 가설적 속성과 밀접한 관계를 가지는 속성군으로부터 새로이 설정된 가설적 속성 이 무엇인가를 유추하는데 이론적 근거를 제시하는 방법이라고 하 겠다. 그러나, 우리가 어떤 생물의 종을 분류한다고 가정하면 각 생물 개체가 가지는 형질의 특성을 규정하여야만 할 뿐 아니라 실 제 분류하려 하는 운영분류단위(예를 들면 대상 개체)를 이러한 형 질에 맞추어 분류를 시행하여야만 한다. 이때 사용될 수 있는 것이 F 행렬이다. 이러한 의미에서 F 행렬을 분류에 사용한다는 생각아래 다시 살펴보자. F 는 FNm 으로 표시되어 있다. 이는 m 개의 새로운 가설적 요인들 에 대하여 가지는 각 대상 생물 개체의 값이다. 반대로 말하면, 최
초에 측정된 각 운영 분류 단위가 가지는 n 개의 형질(속성) 값을 새 로운 가설적 형질 m( 이때 물론 m < n) 개에 대한 값으로 나타낸 것 이라 할 수 있다. 죽 f란, i번째의 운영분류단위가 j번째의 가설적 형질에서 갖는 값이 된다. 따라서, 우리는 XNn 의 값을 FNm 으로 대 치할 수 있으며 m < n 이므로 훨씬 간략하게 본래의 값 x 를 나타낼 수 있다. 이제 만일 N 개의 각 대상 생물이 새로이 설정된 m 개의 가설적 형질에 대하여 어떤 경향을 보이는가를 이용하여 분류의 기 초 자료를 얻으려고 한다면, 이는 주로 N 개의 대상 생물을 m 개의 축을 이용하여 나타냄으로써 구해진다. 이를 나타내는 방법은 주로 배 열법 (ordin a ti on meth o d) 이 사용되고 있다. 죽 fi, f2, …, f m 에 서 이를 2 차원으로 평면상에 나타내어 각 대상이 놓인 위치에 따라 비슷한 값을 갖는 것끼리 분류할 수 있다고 하겠다. 이의 예를 아 래에 기술한다. 10.3.2 요인분석 계산 예와 결과의 해석 생태학이나 분류학에서 이용되어 전문 잡지에 발표된 요인분석의 결과들은 대부분이 결과만을 단순하게 해석하고 있기 때문에, 이러 한 결과를 통하여 최초의 자료행렬로부터 어떠한 과정을 거쳐 A 및 F 행렬이 얻어지며 이때 A 및 F 행렬이 가지는 의미가 무엇인가 를 이해하기는 매우 어렵다. 따라서 본 난에서는 요인분석의 방법 론을 소개한 책에서 그 예를 인용함으로써 요인분석의 결과로 도출 되는 A 및 F 행렬의 해석에 도움을 주고자 한다. 요인분석의 결과 롤 해석하는 데 가장 적절한 예는 Klovan(1975) 에 의한 통계학의 지질학적 이용에 관한 논문에서 발견할 수가 있어 이룰 요인·분석의 예로서 이 장에서 제시한다. 최근 P i elou(1984) 는 집괴분석이나 배 열법을 이용하여 생태적 자료를 어떻게 해석할 것인가를 수리적으 로 설명하는 과정에서 주성분분석법을 예를 통하여 자세히 설명한 바 있다. P i elou 의 예 역시 많은 도움을 줄 것이다. 그러나 이러한 계산 예는 전산프로그램을 완성했을 경우 이를 검정하는 데 필요할 뿐 아니라 해석하는 방법을 이해하는 데도 도움을 주어야 한다. 따 라서 여기서는 가장 해석이 명료하도록 약간 인위적으로 조작된 자
료인 Klovan 의 예를 선택하였다. Klovan 에 의해 제시된 표 10.1 은 20 개 (N=20) 의 장소에서 10 개 (n=lO) 의 암석의 구조 및 성분을 조사한 결과이다. 이 자료로 부 터 요인분석을 통하여 우리가 얻고자 하는 결과는 첫째, 각 장소에 대한 10 개의 지질학적 속성 사이에 내재된 상호관계로 부터 가설적 속성을 도출해내는 일이며, 둘째, 이때 도출된 가설적 속성에 의해 20 개의 각 장소는 어떠한 분포를 하게 되는가 하는 문제이다. 분류 에 직접 이용되어 분류학 전문 잡지에 발표되는 결과들은 대체로 둘째번 목적에 의한 결과를 이용하고 있으나 실제로는 첫번째 목적 역시 분류를 위해서는 매우 중요한 결과를 제공한다고 생각된다. 우선 첫번째 목적부터 살펴보자. 가설적 속성의 도출은 10 개의 지질학적 속성들 간의 유사성으로 부터 출발한다. 표 10.2 는 10 개 지질학적 속성 사이의 유사성을 계 산한 유사계수행렬 (R) 이다. 식 (11) 을 풀기 위하여 표 10.2 의 행 렬로부터 고유치를 구하면, .-11 =5.46, .-12 =3.19, ,1 3= 1. 35 이다. 이 때 고유치는 제 151 쪽에서 강조되었듯이 자료행렬이 가지는 분산의 의미이며, 따라서 이 분산값이 정보의 양을 대표한다고 할 수 있 다. 죽 표 10.3 에서 구체적으로 살펴보면, 고유치가 가장 큰 요인 I (f 1) 은 54.6% 의 정보를 가지고 있고, 요인 II (f 2) 는 31 .9 %, 요 인 III( f 3) 은 13.5% 의 정보를 가진다고 하겠다. 가설적 속성인 요 인 I , II, III 이 가진 정보의 양은 모두 합치면 100% 로서 표 10.1 에서 보여준 원래 자료에서 정보를 잃어버리지 않은 채 가설적 속 성이 설정될 수 있음을 알 수 있다(이러한 이유로 인하여 이 자료 는 예를 제시키 위한 인위적 자료라고 위에서 언급한 바 있다). 표 10.2 의 R 행렬로부터 구해전 A 행렬은 표 10.3 과 같다. 이때 A 행렬 을 일반적으로 요인부하행렬(要因負河行'Jj 1 J, fac to rloadin g matr i x ) 이 라고 한다. 10 개의 지질학적 속성은 요인 fI, f2, f 3 에 대하여 표 10.3 에서 보여주는 A 값을 갖는다. 이 값들은 앞에서도 지적한 바와 같이 원 래의 자료행렬 X 를 F 로 나타내었을 때 F 값의 항을 X 와 동일하게 되도록 하는 (X=A·F) 상관계수이다. 죽 요인분석을 통하여 복잡 한 자료의 묶음인 X 행 렬로부터 차원을 줄인 F 행 렬을 구하고자 하
표 10. 1 20 개 장소에서 조 사된 10 개 지 질 학 적 속성에 대한 : A3 내』의 감감함량 갑겁자연석 철료항량 행 !렬의 i(량X ) 황 \: ]삽 젊스섭의 도겁7J - 수디 ’ 속 습 소 m' m' 1 1175 999 975 625 158 262 437 324 431 433 2 936 820 813 575 267 379 478 413 411 428 3 765 711 716 599 457 548 579 558 491 513 4 624 598 600 542 471 515 531 520 490 500 5 417 422 422 432 444 441 437 439 437 437 6 401 403 375 401 405 270 317 290 515 465 7 520 504 488 469 427 370 410 386 507 482 8 661 626 618 553 462 466 506 480 529 523 9 877 787 773 594 354 401 493 434 500 498 10 1060 932 898 656 315 312 468 370 580 552 11 1090 960 935 681 334 375 518 427 567 555 12 896 811 790 629 403 . 411 511 448 570 555 13 748 688 672 560 401 399 472 426 525 512 14 617 573 553 477 360 315 385 342 487 462 15 436 424 389 393 361 207 277 236 514 455 16 664 587 560 419 212 182 287 221 397 369 17 750 665 651 484 259 299 387 331 399 396 18 903 797 791 573 291 396 486 427 421 437 19 998 888 887 657 366 499 583 527 480 506 20 1162 999 994 671 252 404 539 450 449 471
는 바, 이때 나타나게 되는 오차를 적절한 A 값을 곱해 중으로써 줄일 수 있는 것이다. 이때 상관계수 A 의 의미는 통계학에서 일반 적으로 사용되는 의미를 그대로 적용하여 생각해 볼 수도 있다. 상 관계수의 개념을 통계학 전공이 아닌 생물학 전공자를 대상으로 그 의미를 쉽게 설명한다면 다음의 예를 들 수 있다.
표 10.2 10 개의 지 질학적 속성 간의 상관계수행 렬 ( R) 속성 1 2 3 4 5 6 7 8 9 10 1 1.000 2 0.998 1.00 0 3 0.9 9 4 0.998 1.00 0 4 0. 90 8 0.933 0.942 1.00 0 5 -0. 57 6-0.523-0. 49 7- 0 .180 1.00 0 6 0.130 0.1 8 3 0.235 0.4 7 7 0. 61 6 1.00 0 7 0.5 8 1 0.625 0.664 0.834 0.258 0.8 8 0 1.00 0 8 0.282 0.334 0.383 0.610 0.5 1 9 0.987 0.944 1.00 0 9 0.012 0.057 0.035 0. 28 6 0.539 0.181 0.216 0.208 1.00 0 10 0.258 0.313 0.312 0.590 0.550 0.524 0.604 0.573 0.909 1.00 0
표 10.3 속성간의 유사행렬 (R) 로부터 주성분 분석법에 의해 구해진 A 행렬 요 인 속 성 공동성 (h2) fl f2 f3 312 111...000 000 000000 000...888 350 872959 -——000.5..55 831 962472 000...00 0849 804670 4 1.0000 0.9 7 60 _。 . 1961 0.0943 5 1.0 0 00 0.0176 -0.9998 -0.0098 6 1.0000 0.6 5 38 0.5 9 99 -0.4 6 11 7 1.0000 0.9297 0.2393 -0.2799 8 1.0000 0. 76 47 0.5018 -0.4 0 42 9 1.0000 0.3268 0.5407 0.7 7 51 10 1.0 0 00 0.6641 -0.5437 0.5 1 32 분 산 54. 61 4 31 .92 8 13.459 누 적 분 산 54.614 86.542 100.000
Y1=0 . 9X1+0.2Xz 라는 식이 있다면, Y1 값은 X1 에 의해 0.9 라는 비율로 크게 좌우되나 x2 값에 의하여는 0.2 정도의 비율에 의해 X1
보다는 적게 영향을 받는다고 할 수 있다. 또한 Y1=Y1'+ y;’로 분 리하고 y~ =0. 9X 1, y ;'=0.2X2 로 각 항을 독립적으로 놓고 보면, 이 때의 각 상관계수를 회귀 분석의 상관계수로 생각하여 0. 9 또는 0.2 등을 분산의 개념으로 해석할 수 있다. 따라서 0.9 또는 0.2 는 Y1 의 값을 형성하기 위하여 X1 또는 X2 의 각 값이 어느 정도 기여 하는가에 대한 척도로써 사용되어진다. 한편, 상관계수와 변수 사 이의 관계에서 보면 상관계수가 클수록 그 변수는 상관계수에 종속 된다고도 볼 수 있다. 상관계수가 가지는 이러한 의미가 요인 분석의 결과인 F 행렬에 대한 상관계수행렬 A 에도 그대로 적용된다. 따라서 표 10.3 의 상 관계수행렬 A 에서 a 값이 큰 항은 원래의 자료 행렬 X에 대한 영 향이 큰 항이라 볼 수 있으며 (죽, 각 요인 f1, f2, f 3 이 원래의 자 료행렬 X 에 대하여 가지는 중요성의 정도를 의미), 동시에 a 값의 크고 적음에 따라 각 요인 f1, f2, f 3 이 어떠한 a 값에 의해 지배되 는지를 나타낸다고 하겠다. 이러한 원리에 의해 표 10.3 의 A 행렬 울 해석해 보자. f 1 은 대체로 지질학적 속성 1, 2, 3, 4, 7 과 0.8 이 상의 상관관계 를 보이 며 , f 2 는 속성 5 와 f 3 는 속성 9, 10 과 높은 상관관계 를 보인 다. Klovan 은 이 때 각 f1, f2, f 3 의 해 석 을 A 행 렬 로 부터 직접 유도하지 않고 다시 축을 회전시킨 결과에 의해 해석 하고 있다. 이때 축을 회전시키는 이유는 A 값이 좀더 명확하게 fi, f2, f 3 와의 관계를 나타내도록 하기 위한 것으로서 주로 최대분산법 (varim ax me t hod) 에 의해 이루어지나 그 원리가 위에서 열거한 방법과 유사하여 이 책에서는 취급치 않는다. 회전시키는 과정은 축이 서로 직각이 아니어도 좋다는 가정에서 시작된다. Klovan 은 축을 회전시킨 후의 최종 결과에 의해, f 1 과 관계 있 는 속성 으로는 속성 1, 2, 3, 죽 석 회 석 (calcit e) 내 의 마그네 슘 함량, 섬아연석 (sph aleri te) 내의 철분 함량 및 백운모 (muscov it e) 내의 나트륨 함량이고(표 10.1 참조) 이들은 고기온(古氣溫, p aleo t em p era t ure) 과 밀접한 관계가 있으므로 f 1 을 고기온으로 해 석해야 한다고 주장하였다. 죽 마그네슘이나 철, 나트륨 등의 함량 은 풍화 정도에 따라 달라지는데, 풍화가 잘되는 지역은 밤 낮의 온도 차이가 심한 지역이나 비가 많이 오는 지역 등이며, 또 마그
네슘의 경우 기화 때문에 그 양이 중가하므로 이들 속성들은 모두 온도와 밀접한 관계가 있다고 본 것이다. f 2 의 경우는 속성 5, 6, 7 로서 이 는 벽 개 (cleavag e ) 의 간격 , 섬 아연 석 (sph alerit e) 의 길 이 , 습곡의 강도 등을 나타내므로 변형 (de fo rma ti on) 으로 해석했으며, f 3 은 암석 내의 맥 (ve i n) 의 수나 균열(fr ac t ure) 의 수를 나타내므로 침투성 (p ermeab ility)으로 해석하였다. 그립 10.2 는 A 행렬을 요인 I , II, III 의 축에 의해 도시한 결과 이다. 이때 요인 I , II, III 은 요인분석의 한 전제 조건에서 보여 주었듯이 반드시 직각의 축이어야 한다. 각 요인이 직각의 축이라 는 사실도 요인분석의 중요한 장점이다. 예를 들어, 배열법 (제 9 장)에서 설정된 축은 이러한 직각의 개념이 논리적으로 설정되어 있지 못하다. 많은 논문에서 요인분석의 결과가 이러한 투영에 의 하여 나타내어지나 이는 철대적으로 필요한 단계는 아니다. 위에서 살펴본 바와 갇이 A 행렬의 값을 비교함으로써 이미 각 요인을 해 석할 수 있기 때문이다. 추가로 A 행렬의 몇 가지 대수학적 성격을 제 149 쪽에 열거된 사 항과 관련시켜 살펴보면 다음과 같다. 첫째로, 각 속성 1, 2, 3, …, j, …, n 이 가지는 편차는 h f으로 표시되었는 바, 이는 각 요 인이 가지는 a 값의 자승의 합이었다. 따라서 A 행렬의 값들은 이러 한 조건을 만족시 키 도록 구해 졌다. 이 때 , h f를 공동성 (com- muna lity)이라 지칭하였는데, 표 10.3 의 예에서는 h f의 값이 모두 1 의 값을 가짐을 알 수 있다. 이는 자료 행렬 X( 표 10.1) 의 값이 하나의 이상적인 예를 만들기 위한 인위적으로 조작된 값이라는 사 실에 기인한다. 둘째로, 표 10.3 의 행렬에서 각 요인 f1, f2, f 3 의 편차가 R 행렬(표 10.2) 의 고유치에 해당된다는 사실이 중요하다. 죽 가설적 속성 f에 대한 원래의 속성 1, 2, 3, …, i, j, …, n 이 갖는 a 값의 편차가 최대인 것부터 나열되도록 f가 구해졌다고 볼 수 있다. 이는 앞에서도 지적한 바와 같이 주성분분석의 중요한 원 리이며 이로부터 각 요인이 갖는 정보의 양을 정량적으로 나타낼 수 있게 해준다. 표 10.3 의 예라면, 요인 1 은 10 개의 특성이 갖는 값의 정보를 54.6% 설명하고, 요인 II 는 31 .9% , 요인 m 은 13.5% 설명한다고 하겠다. 이러한 이유는 제 152 쪽에서 이미 상세
,;. .3 4 • 1•
히 설명한 바 있다. 표 10.3 의 요인 I , II, III 이 100% 의 정보를 제공하고 있어 이 역시 이상적인 예에 해당되나 실제 우리가 자연 에서 얻는 자료를 이용하여 요인분석을 실시할 경우 이보다 훨씬 낮은 값을 얻게 된다. 위에서 살펴본 바와 같이 요인분석은 A 행렬에 의해 F 행렬을 해 석하는 데 그 중요한 목적이 있다. 그럼에도 불구하고 요인 분석의 결과를 이러한 범주를 벗어나 전혀 다른 각도에서 해석하는 경우를 종종 볼 수 있는 바, 이는 요인 분석의 원리를 정확히 이해하지 않 은 채 전자계산기에 의해 활자화되는 결과로부터 단순한 상상을 거 쳐 결과를 기술하는 오류를 범했기 때문이라고 생각된다. 위에서 기술한 해석 이상은 절대 할 수 없음을 재삼 강조하고자 하며 동시 에 이러한 해석은 각자가 지니고 있는 전문 지식의 범주에 속함을 주지해야 한다. 요인분석의 목적은 어디까지나 가설적 속성을 이끌 어내는 데 있고, 요인분석의 사용자는 자신의 지식을 동원하여 이 가설적 속성이 과연 무엇인가를 유추할 수 있을 뿐이다. 10.3.3 F 행렬의 수리분류학적 이용 요인분석을 분류에 이용하려 한다면 우선 앞 장에서 소개한 A 행 렬도 반드시 이용해야 한다. 죽 우리가 만일 N 개의 개체를 대상으 로 n 개의 분류적 형질을 조사하였다면 이돌 분류적 형질 사이에 내재된 가설적 형질이 무엇인가불 이끌어내고 이로부터 n 개의 분 류적 형질을 m 개의 가설적 형질로 묶어 이를 해석해야만 하는 것 이다. 이는 m 개의 분류기준을 설정하는 일이라고도 할 수 있다. N 개의 개체를 분류할 수 있게 하기 위하여 위의 과정을 통하여 m 개의 분류 기준을 수립할 수 있다면 첫째 목적은 달성하게 된다. 그러나 분류는 분류의 기준만을 설정하는 것이 목적이 아니라 N 개 의 대상을 실제로 분류해야만 한다. 이때 사용되어지는 행렬이 F 이다. 앞에서도 밝힌 바와 같이 F 의 실제값들은 N 개의 운영분류단위 가 가설적 형질 f1, f2, …, f m 의 새로운 변수에 대하여 갖게 되는 값들이다. 따라서 각 운영분류단위는 이제 새로이 설정된 분류적
표 10.4 표 10.1 의 자료 행렬로부터 구해진 F 행렬 요 인 조사장소 f1 f2 f3 1 0.3887 -2.2383 0.1 3 59 2 0.1989 -0.9 7 98 -1.13 63 3 0.9083 1.21 82 -1. 0941 4 0.2926 1.3964 -0.9847 5 -0.9595 1.0959 一 1.4845 6 -1.61 85 0.6760 0.9116 7 -0.7464 0.9 1 50 0.1871 8 0.2992 1.2964 0.0 0 20 9 0.4987 0.0 3 77 0.1130 10 0.9111 -0.4 0 40 2.1310 11 1.2932 -0.1 9 46 1.5206 12 0.8987 0.6101 1.1 9 14 13 0.1 9 35 0.5 9 46 0.4475 1145 —-01.8.8 155392 00..11732236 01..33 04 7744 1167 -一1 0..8756 1543 -—11..05 75 4215 _-0。. 9.2234180 18 0.2300 -0.6998 -1.11 55 19 1.3189 0.1 5 78 -0.7 8 23 20 1.17 85 -1.15 92 -0.5417
기준 f1, f2, …, f m 에 대하여 어떠한 양상을 보이는가를 검토하고 실제로 이러한 분류적 기준에 의하여 분류가 되어야만 한다. 표 10.1 의 자료 행렬로부터 구해전 F 행렬의 예를 표 10.4 에 나타내었 다. 이제 각 조사 장소 (N=20) 는 f1, f2, f 3 에 대하여 갖는 값에 의하여 분류되어야만 한다. 이 F 행렬은 요인 I , II, III 의 축을 이용하여(이때 각 축은 물론 직각이어야만 한다) 그립으로 나타내 는 것이 보통이다. 왜냐하면 N 개의 대상이 각 요인에 대하여 어떠 한 분포를 보이는가를 논하려 하기 때문이다. 표 10.4 의 행렬을 도 시한 그림 10.2 로부터 우리는 20 개의 조사 장소가 분포된 양상에
•
의해 장소를 분류하게 된다. 위에서 소개된 F 행렬을 통하여 시도한 분류의 예는 지질학적 현 상을 대상으로 하였으므로 분류학자에게는 적당치 못하다. 또한 각 대상이 어떤 무리를 이루어 분류되고 있지도 못하다(이는 자료가 A 행렬을 뚜렷이 나타내기 위하여 인위적으로 설정되었기 때문으로 여겨진다). 지금까지 인용한 예는 주로 A 행렬 및 F 행렬을 요인 분 석의 논리에 입각하여 어떻게 해석하는 가에 대한 정보를 제공하고 자 기술된 것이다. 앞에서도 밝힌 바와 갈이 분류학의 논문에서 요 인분석의 방법을 실제 숫자예를 사용하여 찰 설명한 예는 찾을 수 가 없어서 부득이 지질학에서 이용된 내용을 가지고 요인분석의 과 정 및 결과의 해석을 소개하였다. 이제 아주 간단한 예를 통하여 분류학에서 요인 분석의 방법이 어떻게 사용되었는가 살펴보고자 한다. Taxon 이 나 Sys t e m ati c bota .n y, Sys te m ati c zoology 등의 분류학 전문 잡지에서 취급된 주성분분석에 의한 생물의 분류 논문들은 주 성분분석이 가지는 모든 장점을 적절히 이용하고 있지 못하다. 앞 에서도 지적한 바와 갇이 주성분분석이 가지는 가장 중요한 특징이 라면 형질의 특칭을 몇 개의 특칭의 묶음으로 나타내고 이때 형성 된 특징의 묶음울 해석토록 하는 것이라 하겠다. 그러나 실제로 분 류를 이러한 입장에서 시도한 논문은 거의 없다. 축의 해석은 전혀 고려하지 않고 설정된 축을 기정 사실화하여 이 축에 의해 투영되 는 대상 생물이 어떤 분포를 가지는가를 검토한 후 이에 의한 분류 의 결과만을 제시하고 있다. 이는 분류학자들이 주성분분석이 가지 는 효과를 충분히 이용하지 못하는 것이다. 주성분분석 자체가 이 렇게 제한적으로만 이용될 경우 앞 장에서 소개한 배열법과 유사한 결과밖에 못 얻게 되는 불이익을 가져오게 된다. 이러한 현상은 주 성분분석의 과정이 생물학자들이 가지는 통계학 및 대수학에 대한 지식의 한계를 넘어서 전개되고 있기 때문이라고도 할 수 있다. 아 래에서 보여주는 예 역시 단순한 분류의 결과만을 도시한 데 그치 고 있으나 요인분석의 결과를 집괴 분석의 결과와 비교하여 나열하 고 있어 본 란에서 하나의 예로 취급하였다. Tacobson (1 979) 은 두 종의 양파 Alliu m cernuum 및 Alliu m
0 . 107 「 |I I o
s t el l,at um 의 표본을 대상으로 주성분분석을 이용하여 분류를 실시 하고 그림 10.4 와 갇은 결과를 얻었다. 이 두 종의 예는 집괴분석 에서도 이미 제시한 바 있다. 그립 10.4 의 결과는 집괴분석의 경우 보다 훨씬더 명확하게 두 종의 표본이 분리되고 있음을 보여준다. 본 결과에서는 요인 1 과 요인 2 가 어떠한 가설적 형질임을 나타내 고 있지는 못하다. 각 요인에 대한 형질의 요인부하(fa c t or loadin g ) 값 (A 행렬)이 표로서 주어지든가 각 요인에 대하여 이들 값이 두영되어 있다면(행렬을 이용하여) 임의의 해석이 가능하겠 다. 그러나 그림 10 .4는 요인기록(fa c t or score) 값 (F 행렬)으로서, 각 표본이 갖는 가설적 형질에 대한 수치를 이용하여 각 표본이 요 인 l 과 요인 2 에 대하여 투영되어 있으므로 축의 해석에는 전혀 도 움을 주고 있지 못하다. 요인분석을 단순히 표본을 분류하는 데에 만 국한시켜 이용한 예라 하겠다. 위에서 제시한 예 이의에 국내 학자에 의한 예를 추가로 제시하고자 한다. 위의 예가 식물을 대상 으로 한 논문이었으므로 고 (1986) 의 예를 통하여 동물분류학에서 요인분석법이 어떻게 이용되어지는가를 살펴보자.
(a)
고 (1986) 는 문경에서 채집된 들쥐를 대상으로 주성분분석법을 사 용하여 들쥐의 분류 를 시도하였다. 그는 문경산 흰넓적다리 붉은쥐 (Ap od emus pen in s ulae pen i.n sulae) 와 등 줄 쥐 (Ap od emus ag a r ius coreae) 의 염색체 수를 조사하여 분류한 결과와 이들 두 종의 외부 형태나 턱주가리의 분류적 형질을 조사하여 수리적 분석을 실시한 결과를 비교 검토하고 있다. 의형적 형질로 31 개의 분류적 형질을 조사하였으며 이들 중 통계적 검정을 통하여 변화 양상이 뚜렷한 14 개 형질을 선택하여 주성분분석을 실시하였다. 고(1 986) 는 들쥐 가 성(性)에 따라서는 형질의 큰 차이룰 보이지 않으나 연령에 따 라서는 큰 차이를 보인다고 보아 대상을 5 개 연령군으로 나누고 각 연령군 별로 대상을 분류하였다. 그림 10.5a 는 청년기 연령군 (yo ung -a g e d adults ) 을 분류한 결과이 다.
고 (1986) 는 위의 두 종이 저자에 따라 그 종의 한계가 불분명하 게 기술되었다고 논의하고 주성분분석을 통하여 두 종의 한계를 분 명히 하고자 주성분분석을 실시하였다. 그립 10 . 5a 는 주 성분 분석을 통한 F 행렬을 두영한 결과로서, 요인 I 은 63%, 요인 II 는 14%, 요인 III 은 8% 의 정보를 포함하여 흰넓적다리 붉은쥐 9 개의 대상은 등줄쥐 2 개의 대상과 요인 I , II 또는 III 의 가설적 형질에 대하여 갖는 f값이 뚜렷이 다름을 알 수 있다. 그림 10.5b 는 중년기 연령 군 (m i ddle-a g ed adu lt s) 의 흰넓적다리 붉은쥐 12 개 대상과 등줄쥐 3 개 대상이 요인 I , II, III 에 의하여 분리되고 있음울 보여준다. 위에서 살펴본 바와 같이 요인분석의 F 행렬은 대상을 분류하는 데 종종 이용된다. A 행렬에 의해 해석될 수 있는 각 요인을 좀더 분 류적 관점에 접근시켜 해석한다면 요인분석을 통한 분류가 수리적 방법에서 보아 가장 잘 정돈된 방법 중의 하나이므로 요인분석법은 분류의 객관화 작업에 크게 공헌할 수 있으리라 믿는다.
제 11 장 분지론 분지론(分枝論, clad i s tic s) 의 방법론들은 Henn ig (1950) 의 이론 에 기초를 두고 있다. 이 분지론은 표현론과는 그 출발점이 다르다 고 봐야 한다. 표현론은 분류군의 최소단위 (種)를 먼저 도출해내고 이를 기본으로 분류군들간의 관계인 계통의 논리를 전개해 나가는 이론임에 비해, 분지론은 그 대상이 상위 분류군이며 상위 분류군 들간의 관계를 설정하는데 대한 방법론이다. 죽 종 수준 이상의 분 류군에서 각 분류군 사이의 관계가 어떠한가를 판단하는 데 주로 쓰이는 방법이다. 표현론과 비교하여 생각한다면, 운영분류단위를 체계적으로 배열하는 과정에 해당된다고 하겠다. 어떻든 이 분지론 적 방법론이 최근 분류에 많이 사용되고 있고 그 수리적 방법이 표 현론에서 쓰이는 원리와 비슷하므로 분지론의 이론적 근거와 방법 론을 소개하고, 또한 분지론의 장단점을 표현론 및 전통 분류학의 방법론들과 비교하여 논의코자 한다.
11.1 분지론의 원리 분지론적 관계란 〈공동조상의 최근성을 나타내는 관계〉를 말하며 (제 4 장 참조), 분지론적 방법론은 조상의 최근성 정도를 나타내는 유사도를 어떻게 효율적으로 산출하며 이 유사도를 바탕으로 어떻 게 조상의 최근성을 해석하는가 하는 문제를 취급한다• 그럼 이제부터 생물의 계통을 인지하는 방법 중의 하나로 제안된 분지론에 근거를 둔 방법이란 어떤 것이며 이러한 방법을 통하여 어떻게 계통에 대한 기준을 세울 수 있는가 구체적으로 살펴보자. 분류군의 분지론적 관계에 대하여는 이미 제 4 장에서 참시 언급한 바 있다. Henn ig는 그의 저서 『 계통 체계의 이론 』 에서 분류란 〈혈 통관계에 기초롤 두어야만 한다〉라는 분지론적 개념을 뚜렷히 설정 하였다. 죽 혈통이 갈라전 길을 따라 분류가 시행되어져야 한다고 한 것이다. 생물의 계통 체계는 여러 분지가 연속적으로 연결되어 구성 되 어 있는데 , 이 때 분지 되 는 지 점 은 부모종 (pa renta l spe ci es ) 과 딸종 (daug h te r spe ci es ) 으로 갈라지 는 지 점 이 다. 부모종은 바로 딸종이 형성되는 시기까지, 죽 분지시기까지만 존재한다고 할 수 있으며, 이때 부모종과 딸종은 하나의 계통을 이루게 된다. 또 이 때의 계통체계를 단계통군( 單 系統群, monop h y le ti c gr ou p)이라고 한다. 이 단계통군의 문제는 분지론에서 가장 중요한 개념이므로 우선 이를 좀더 상세히 살펴보자. W il e y (1981) 는 아직까지 논의되어 오던 단계통군의 문제를 간략 히 정리하여 〈단계통군이란 하나의 선조종 (이미 알려진 또는 가설 적 인 ) 과 이 종의 모든 후손종의 모임 이 다 (a monop h y le ti c grou p is a grou p of spe ci es tha t inc ludes an ancestr a l spe ci es (known or hyp o th e siz e d) and all of its descendan t s) 〉라고 정의한 바 있다. 이 러한 단계통군의 설정은 단계통군이 상위 분류군의 자연성을 나타 내는 원칙이 되어야 한다는 사실 때문에 대단한 중요성을 갖는다. 이때 상위 분류군이란 종수준 이상의 분류군을 의미하는 바, 이의
설정 역시 자연성의 원칙에 따라야 함은 물론이다. 그러나 이때의 자연성이 종 수준에서의 자연성의 의미와 완전히 일치할 수는 없 다. 종의 자연성을 생식과 진화의 단위라는 의미에서 찾았지만, 상 위 분류군의 경우도 같은 원리에서 찾을 수는 없는 것이다. 그러나 생물종이 연속적으로 존재하는 것과 마찬가지로, 생물종이 존재하 는 한, 종의 묶음인 상위 분류군도 어떤 원칙 (예를 들면, 단계통군 의 원칙)에 의해 시대적 변천에서 하나의 단위로 묶여져서 역사적 으로 존재할 수 있음이 가능하다. 이러한 의미에서 W i le y는 상위 분류군을 하나의 역사적 군 (h i s t or ic al gr ou p)이라고 하였으며 이러 한 역사적 군의 설정 원칙을 그는 선조 종이라는 의미의 부계 (父 系)의 원칙에서 찾고자 하였다. 몇 개의 종이 합쳐서 형성된 하나의 역사적 단위인 상위 분류군 에 대한 자연성을 단계통군의 원칙에서 찾으려 한다면 이러한 단계 통군의 개념을 좀더 명확히 하기 위하여 단계통군과 대치되는 다계 통군(多系統群, po lyp h y le ti c g rou p ), 측계통군(側系統群, pa ra- ph y le ti c grou p ) 등에 대하여도 알아볼 필요가 있다. Hennig (1966) 는 상위 분류군의 자연성을 단계통군에서 찾아야 한다고 강 력히 주장하면서 단계통군을 〈하나의 종으로부터 유래된 종의 무리 로, 어느 한 종으로부터 유래된 모든 종을 포함하며, 이 무리에 속 하는 종들은 서로가 각각 다른 무리에 속하는 종들보다 훨씬더 밀 접한 관계에 놓여 있다〉라고 하였다. 또 측계통군이란 〈어떤 공동 조상이라고 생각되는 종이 단순히 종의 어떤 무리와만 관계 있는 것이 아니라 다른 종의 무리의 조상에도 관여하는, 따라서 정확한 기원 시기를 유추할 수 없는 경우〉라고 하였다. 측계통군을 Farris (1974) 는 좀더 간략하게 표현하였는 바, 〈축계통군이 란 후손종의 모두를 포함하지 않고 이들 중의 몇몇과 공동조상종으로 구성되는 종의 무리〉라고 하였다. 이에 비해 〈다계통군이란 가장 최근의 공 동조상이 다른 무리의 공동조상으로 배분된 경우〉라고 함으로써 공 동조상을 포함하지 않는 나머지 종의 무리를 다계통군으로 보았다. 물론 이러한 단, 다, 측계통군의 개념이 위의 정의만으로 충분히 독자에게 이해되리라고는 생각지 않는다. 실제로 이러한 구분들이 란 단순한 〈보편성 의 수준〉 (lev el of univ e rsali ty ; 어 느 수준에 서 종
을 무리지울 것인가 하는 문제를 이렇게 표현함) 문제라고도 주장 되기 때문이다. 앞으로 설명될 형질의 공동조상성이나 평행성, 수 령성 등 ' 많은 문제들이 공통으로 관여되어 어떤 종의 무리가 단계 통성이냐 아니냐를 판단하게 될 것이다. 어떻든 이 정도의 단계에 서 다음 문제로 넘어가 보자. 위에서 살펴본 대로 단계통군을 측계통군, 다계통군 등과 함께 대비시켜 살펴봄으로써 단계통군이 나타내고자 하는 뜻이 좀더 명 확해졌으리라 생각한다. 이제 계통의 설정이 단계통군에 그 기반을 둔다는 원리를 우리가 받아들인다면, 분류를 수행하고 이의 체계를 구성하는 데 있어 과연 어떤 방법으로 여러 종들에 내재되어 있는 단계통성을 알아낼 수 있는가를 생각해야만 한다. 분지론자들은 단계통성을 각 분류군이 소유하는 형질을 조사하여 비교함으로써 알아내고자 하였다. 그러나 이때 분류군간의 비교 관 점이 표현론과는 다르다. 표현론에서는 분류군의 5 전 형질을 대상으 로, 분류군아 가진 모든 형질이 얼마나 유사한가를 비교하여 분류 군을 설정하였다. 그러나 분지론에서는 각 분류군에서 선조관계를 나타내는 형질만을 중점적으로 비교하여 조상종과 이 조상으로 부 터 파생된 종을 구별하려 하였다. 또 이렇게 분리되는 조상종과 파 생종을 하나의 묶음으로 보고 이를 단계통군이라고 하였다. 따라서 분지론에서 방법론적으로 중요한 일은 어떤 형질이 조상형질이냐, 혹은 어떤 형질이 후손형질이냐를 판단하고 조상종과 이로부터 유 도된 파생종을 식별해내는 일이다. 조상형질 내지 후손형질이라는 술어는 제 5.3 장에서 소개한 원시 형 질 (原始形 質 , prim i tive characte r ) , 파생 형 질 (派生形 質 , der- ive d characte r ) 을 뜻한다. 이 를 Henn ig는 근거 리 형 질 (近距離形 質, ple sio m orph ic characte r ; 이 때 p les i o 란 가깝다는 뜻) , 원 거 리 형질(遠距離形質 ap o morph ic characte r ; a p o 란 멀다는 뜻)이라는 술어롤 사용하여 표현하였다. 죽 조상형질, 원시형질, 근거리형질 등은 모두 비슷한 뜻으로, 근거리형질이란 말은 원래 조상과 유사 한(근접하는) 형질이라는 뜻으로 사용한 말이다. 또 후손형질, 파 생형질 또는 원거리형질 등도 같은 뜻이며 원거리라는 말은 조상과 서로 유사성이 멀다는 의미를 나타내기 위하여 사용한 용어이다.
이러한 술어들을 우리 말에서는 주로 원시형질, 파생형질을 선택하 여 사용하고 있으므로 이 책에서도 아에 준하여 이 용어들을 사용 하려 한다. 이제 조상종, 후손종을 구별하기 위해서는 우리가 대상으로 하는 생물종의 형질을 관찰하고 이 결과로부터 원시형질과 파생형질을 구별해내야만 한다. 분지론은 바로 이 원시형질과 파생형질을 구별 해내는 과정 때문에 분지론을 받아들이지 않는 많은 학자들로부터 비판을 받고 있다. 어떻든 이 문제는 이 장의 마지막 부분에서 다 시 논의하기로 하고 분지론의 방법론적 이론들을 좀더 살펴보자. 원시형질과 파생형질을 구별하는 데는 우선적으로 현재까지 계통학 내지 전화학에서 알려진, 우리가 알고 있는 진화나 계통에 대한 원 리들을 사용하고 있다. 이 중 가장 중요한 원리가 제 5.3 장에서 간 략히 소개한 형질의 상동성이다. 분류적 형질의 상동성 여부를 판 단함으로써 바로 계통의 방향을 유추할 수 있기 때문이다. 상동성 울 중요하게 취급하는 점이 표현론과 분지론이 가지는 가장 중요한 차이점이다. 표현론에서는 모든 형질을 동일하게 취급함에 비해 분지론에서는 계통에 중요하다고 생각되는 형질만을 집중적으로 조사하여 이러한 형질로부터 진화적 방향을 유추하여 계통을 수립하려한다. W iley 는 형질의 조상성 자체를 직접 상동성 개념에 놓아 원시형질을 〈상 동성을 나타내는 형질 중 일찌기 형성되어 후에 파생형질을 유도하 는 형질〉이라 했고 파생형질은 〈이미 전부터 존재하던 상동적 형질 에서 유도된 형질서라고 하였다. 죽, 원시형질과 파생형질의 설정 울 위해 상동성의 개념을 철저히 이용한 것이다. 그러나 이때도, 상동성은 뚜렷한 기준을 가지고 있지만 원시형질 내지 파생형질의 기준은 〈보편성의 수준〉 (W il e y 1981, 제 126 쪽)에 따라 달라지므 로, 단계통군의 범위 역시 상대적으로 설정되는 수준의 위치에 의 해 달라진다 하겠다.
11.2 원시형질과 파생형질의 판단 분지론적 방법은 상위 분류군의 계통을 수립하는 데 사용되므로 대상이 대부분 종 수준 이상임을 위에서 언급한 바 있다. 분지론에 의한 분지분석을 위해 최초로 해야 할 일은 대상분류군이 가지는 여러 형질을 조사하고 이 형질의 상태가 원시형질인지 파생형질인 지를 판단해야 하는 일이다. 이때 이를 판단하는 수리적 방법은 없 다. 이는 어디까지나 경험적인 지식에 의해 판단해야 한다. 바로 이 점이 표현론에 의한 방법을 사용할 경우와 크게 다론 점이다. 표현론에 의한 방법에서는 대상 생물에 대한 지식을 전혀 갖지 않 는 분류학자라 할지라도 분류군의 형질 상태를 조사하여 수리적으 로 기재할 수 있도록 되어 있으나 분지론의 방법에서는 일단 최초 의 자료를 거의 주관적으로 원시형질과 파생형질로 형질의 상태를 판단하여 기록해야만 한다. 이러한 문제의 이론적 비판에 대하여는 후에 다시 논하기로 하고 우선 어떠한 원칙에 의거하여 대상 분류 군의 원시형질 및 파생형질의 상태를 판단하는가를 살펴보자. 원시형질이나 파생형질은 제 5 . 3 장에서 소개한 바와 같이 부계적 형질로서 조상과 관계 있는 형질이므로 우선 어떤 형질이 부계적 형질이냐를 판단해야 한다. 일반적으로 사용되는 부계적 형질에 대 한 기준은 앞에서도 밝힌 바와 같이 상동성이다. 어떤 기관의 상동 성 여 부를 판정 하는 데 는 각 기 관의 위 치 의 유사성 (sim i lar it y of p os iti on) 이나 중간형에 의한 연계 가능 여부 등이다. 이러한 원칙 에 의해 어떤 형질이 조상으로부터 유래한 부계적 형질이라고 판단 이 되면 이제 이 부계적 형질로부터 원시형질과 파생형질을 구분해 야만 한다. 실제적인 어려움이 이 과정에도 많이 내재한다. W il e y (1981) 는 이러한 어려움을 해결하기 위하여는 연역적 논리 에 의한 방법이나 전통적인 방법을 모두 이용하여야 한다고 주장하 고 있는 바, 이를 간략히 요약하여 소개해 보고자 한다(참조 : W iley , 1981, 제 130-159 쪽) .
그는 우선 어떤 형질이 원시형질인가 파생형질인가의 문제는 바 로 그 형질의 계통적 위치와 관계있는 것으로 보았다. 이때 형질의 계통적 위치는 구체적으로 의부군(外部群, out- gro up : 이때 외부 군이란 단계통군에 속하지 않는 외부 분류군을 뜻함)과의 비교에 의해 설정될 수 있다고 보았으며 이에 관한 규칙을 다음과 갇이 정 의하였다 (W il e y, 1981, 제 139 쪽). 의부군 규칙 : 서로 상동성이고 하나의 단계통군 내에서 발견되는 두 개의 형질이 주어졌다 하자. 이때 두 형질 중 자매군 내에서도 발견되는 형질은 원시형질이며 단순히 단계통군 내에서만 발견되는 형질은 파생형질이다. 의부군 규칙은 원시형질과 파생형질을 연역적 논리를 이용하여 판정하는 규칙이다. 이 규칙에 의하면 원시형질 또는 파생형질을 판정 하기 위 해 서 는 우선 자매 군 (姉妹群, sis t e r grou p : 어 떤 단계 통군에 가장 혈통적으로 가까운 분류군을 말함. 따라서 이 자매군 까지를 포함하는 공동조상을 다시 추론할 수 있음)을 설정해야 하 는데 이때 이 자매군은 하나의 대비 (對比)로써 사용된다. 그리고 조사하려는 대상 형질이 자매군에서도 역시 발견되면 이 형질을 좀 더 보편적인 형질로서 간주하여 원시형질로 판정하게 되는 것이다. 죽 어떤 형질의 보편성은 자매군까지를 포함한 분류군의 공동조상 에서 기인한다고 추론하여 보편성을 가지는 형질을 원시형질로 간 주하며, 상동성을 가지는 다론 형질은 파생형질로 보아 단계통군의 한계를 결정짓게 된다. 물론 이때 어떻게 자매군을 설정하는가가 문제가 되지만, 어떤 가설을 검정한다는 의미에서 연역적으로 설정 할 수 있다고 하였다. 의부군을 이 용한 이 러 한 방법을 W il e y는 상동성 (그는 상동성 의 의미를 서로 다른 생물들간의 구조적, 기능적 측면에서 직접 또는 유도된 유사성의 문제라고 해석함)의 판정 기준으로 이용하고자 하 였으며, 이러한 의미에서 의부군을 이용하는 방법에 큰 의미를 부 여하여 〈계통적 위치의 기준〉을 정하는 방법이라고 서술하였다. 어 떻든 원시형질을 연역적으로 판정하기 위하여 의부군을 이용하는 문제는 W iley ( 1981, 제 140-141 쪽)에 의해 실제 예를 동하여 자세 히 설명되어지고 있으므로 방법론에 홍미를 가진 독자는 참고하기
UR 란다. 지금까지 소개한 연역적 논리에 의한 방법보다 더욱 중요한 것은 전통적인 방법이다. 전통적인 방법에서는 계통에 관한 선조종, 후 손종의 문제를 다루면서 전통적으로 정립된 개념들을 이용한다• Henn ig (1966) 는 전통적인 방법에 의해 형질을 선조, 후손으로 구 별하고 나아가 분지론을 이론화한 대표적 인물이다. 그러나 W iley 는 이러한 전통적 방법들을 단순히 그가 주장한 〈계통적 위치의 기 준〉(외부군을 이용한 상동성의 판정)을 설정하는 보조적 수단으로 사용하였을 뿐이다. 우선 전통적인 방법이 무엇인지 살펴보자. 전 통적 입장에서 원시형질, 파생형질을 판정하는 기준을 Henn ig는 다음 네 가지로 구분하고 있다. 첫째, 지질학적 증거에 의한 기준이다. 이 기준에 의한 원시형질 및 파생형질의 의미는, 예를 들어 어느 형질이 지질학적으로 오래 된 연대에서 발견되고 이와 상동성을 보이는 다른 형질이 지질학적 으로 나중에 발견되면, 오래된 연대에서 나타나는 형질이 원시형질 이고 나중에 나타나는 형질이 파생형질이라는 의미이다. 둘째는, 시간적인 전전에 따른 기준이다. 이때 시간이란, 일종의 종 분화의 시간이라는 뜻에서 사용된 것으로, 어떤 종이 점점 세력 을 확장하면서 지리적 분포를 멀리 해 나갈 때 시간과 형질 변화는 서로 연계성이 있다고 보는 것이다. 그러나 이는 실제로 시간에 따 라 형질의 변화를 나열한다기보다는 생물 지리적 의미에서 본 관점 이라 하겠다. 어떤 분류군의 기원이 되는 지역을 기원중심(起原 重 心, cente r of or igi n) 지역이라 한다면, 원시종일수록 또는 덜 변형 된 종일수록 이 중심지역에서 발견되고 변형된 종일수록 이 중심지 역과는 멀리 떨어진 곳에서 발견된다. 중심지역 밖으로 종이 확장 해 나가면서 이들은 의부 환경과 부딪쳐 여기에 적응하는 형태로 변화하게 되므로, 이때 일련의 종의 분화들이 좀더 많은, 변형된 형질을 소유하는 후손을 가지는 방향으로 진행된다. 따라서 중심지 역에서 멀리 떨어질수록 좀더 많은 파생형질을 소유하게 된다고 할 수있다. 세째로는, 형질의 변형계열( 變 形系列, tra nsfo r mati on ser i es) 과 의 상관관계에 의한 판단이다. 만일 어떤 두 형질이 그 변화하는
양상이 비슷하고 이 중 어떤 한 형질에서 원시형질, 파생형질의 여 부가 밝혀질 경우, 다른 또 하나의 형질은 자동적으로 그 경향을 같이 한다고 보아 원시형질과 파생형질을 판단할 수 있다는 것이 다. 죽 원시조상에서 후손으로 갈 때 몇몇 형질이 어떤 방향성을 가지고 변해 간다면, 이 중 한 형질에 대해서만이라도 원시형질과 파생형질의 여부가 밝혀지면 나머지 형질들은 이와 방향을 같이 하 므로 (변형계열과의 상관관계가 크다는 가정) 자동적으로 판단할 수 있다고 보는 것이다. 네번째는, 여러 분류군이 공동으로 소유하는 형질이 원시형질이 라는 것이다. 이는 앞에서 제시한 의부군의 설정을 통한 원시형질 의 판단 기준을 뒷받침해 주는 기준이라 하겠다. 이러한 판단 기준 이의에도 개체 발생에서 먼저 나타나는 형질이 원시형질이라는 의 견이 첨가되기도 한다. 원시형질과 파생형질을 구분하는 것은 분지론의 여러 과정 중 가 장 중요한 과정이다 .. 위에서 살펴본 대로 이 과정은 조상과 후손 과의 관계를 일차적으로 판단하는 과정이라고 할 수 있다. 물론 이 판단 과정이 분류군을 직접 대상으로 하는 것이 아니라 그 소유 형 질만을 대상으로 하고 있기는 하다. 그러나 소유 형질의 합이 그 대상 분류군이 가지는 특칭이므로 결국 개개의 형질이 원시인가 파 생인가를 판단한 결과는 이들 각 형질의 원시성의 합이 크면 클수 록 곧 이 분류군은 조상형에 가깝다고 판단할 수 있는 근거를 마련 해 주게 된다. 이러한 원리 때문에 어떤 대상 생물을 조사하는 분 류과정에서 이미 대상이 되는 분류군이 조상형인지 아닌지의 여부 가 이미 분류자의 생각 속에 대체로 정리되기도 한다. 원시형질과, 파생형질의 개념을 이용하여 분류군을 조상과 후손 의 관계로 나열하는 분류학의 이론 분야가 분지론 또는 부계론으로 지금은 독립되어 있다. 그러나 실제로는 이 분지론의 분석 과정이 분류학이 현재까지 이룩한 전통적인 개념에 의해 정립된 것이고, 따라서 그 원리가 전통적인 방법에서 쓰이는 분류의 원리들과 유사 하므로 이를 반드시 분지론이라는 분야로 독립시켜야 하는가에도 의문이 제기될 수 있다고 본다. 분지론으로 독립된 주된 이유는 오 히려 전통적 이론들이 수리적 과정에 의해 분석이 가능하도록 정리
되어 많은 분류학자들에 의해 이용되었기 때문이라고도 할 수 있 다. 어떻든 분지론의 제반 문제에 대하여는 제 12 장에서 다시 논의 하기로 하고 여기서는 분지론의 방법론, 죽 분지분석 (分枝分析, cladis t i c analys i s ) 법 을 좀더 구체 적으로 알아보고자 한다. 이제부터 원시형질 및 파생형질의 판단 결과를 근거로 좀더 추적 하여야 하는 문제는 조사하려는 대상 분류군이 여러 분류군간의 계 통적 관계에서 어떠한 위치를 차지 하느냐롤 유추하는 일이다. 죽 분류군의 형질 상태를 근거로 이제 이러한 형질을 소유하는 분류군 의 혈연관계를 추적해야 하는 것이다. 이러한 문제에 접근하는 기 본적인 원리는 원시형질을 많이 소유한 분류군일수록 조상형에 가 깝고, 파생형질을 많이 소유한 분류군일수록 후손형에 가깝다는 원 리이다. 이 원리에 따라 수리적 방법이 개발되기도 하였다. 예를 들어 어느 분류군이 소유한 원시형질의 수를 모두 더하고 이를 다 론 분류군이 소유한 원시형질 수와 대비해 보아, 원시형질 소유수 에 의해 분류군의 서열을 정하기도 하였다. 이러한 원칙을 기본 골격으로 하여 이미 Wa gn er 는 1948 년에 방 법론을 제안한 바 있고, 이를 기초로 Klug e 와 Far ri s(1969) 나 Farr i s(1970) 가 전자계산기를 이용할 수 있도록 수리적으로 정리하 였고, 이후 이 방법은 여러 분류학자에 의해 이용되기 시작하였다. 이때 계산 결과에 의해 그려지는 계통수를 특별히 (W agn e r 수 (樹)〉라고 한다. Wagn e r 원칙에 의한 계산 과정을 이제부터 소개 하겠다. 물론 이러한 분지 분석법은 Henn ig의 이론에 의해 기재적 으로도 이루어질 수 있으나, 이 책에서는 수리적 방법만을 소개하 는 바이다. 수리적 방법에도 저자에 따른 변형이 많이 있으나 분지 분석법의 원칙을 설명하는 것이 목적이므로 Wa gn er 에 의한 방법 만을 이 책에서 취급하고자 한다. 11.3 분지분석의 수리적 방법 Wa gn er 의 원칙은 진화가 가장 빠른 길로 진행되었다는 가정으
로부터 출발한다. 따라서 Wa g ner 의 원 칙 에 의 한 수리 적 방법 역 시 계통수가 가장 짧은 길을 통하여 분지가 이루어지도록 고안되어 있다. 이러한 원칙에 의한 분지분석의 방법은 대상 분류군의 여러 형질 중 원시형질과 파생형질을 판단하여 수리적으로 기록하는 일 로부터 출발한다. 이때 원시형질을 보통 0, 파생형질을 1 로서 표시 하여 대상 분류군에 대한 각 형질의 상태를 기록한 표를 작성하는 것이 좋다. 그러나 파생형질의 상태가 l 이 아닐 수가 있다. 죽 최 후의 파생형질이라고 생각되는 상태까지 오는데 예를 들면, 4 단계 의 변이형이 있을 수 있다. 이때 최종 파생형질의 상태를 l 로 하고 그 중간 단계를 각각 0.25, 0 . 5 로 나누어 기록하기도 하고 아니면 0,1,2,3 의 네 단계로 쓰기도 한다. 이는 어디까지나 원시형에서 진 화형으로 가는 단계를 상대적으로 나타내려 한 것에 불과하므로 계 산 후의 양적인 차이가 의미를 지니지는 않는다• 어떻든 이런 형태 의 표가 작성되면 이로부터 각 분류군 사이의 원시형 내지 파생형 의 기준에 의한 유사성이 계산되어야 한다. 아래 표는 A,B,C,D 4 개의 분류군을 대상으로 형질 1,2,3,… ,11,12 의 상태를 조사하여 나타낸 결과이다.
표 11.1 Wag ne r 계산을 위한 형질의 기본 자료표 분류군형 질 1 2 3 4 5 6 7 8 9 10 11 12 A 。 1 1 。 1 3 1 1 1 。 1 。 B 1 。 1 。 1 2 1 。 1 1 1 1 C 1 1 。 。 。。。 2 。 1 。 。 D I 1 1 1 1 1 2 2 。 。。 1
표 1 1.1 의 자료로부터 우리가 분지분석을 통하여 이루고자 하는 일은 A,B,C,D 4 개의 분류군을 원시조상에 가까운, 죽 원시조상으 로부터 시작하여 이에서 유래한 분류군의 순으로 나열하는 일이라 하겠다. 그러나 애석하게도 우리는 A,B,C,D 분류군 중 원시조상이 되는 분류군을 가지고 있지도 못하고 그 형질상태를 알지도 못한
다. 죽 최초 조상과의 절대적 평가 대비가 반드시 필요함에도 불구 하고 이의 시행이 불가능한 상태이다. 따라서 하나의 원시조상을 가정하게 되는데 (이를 ANC 로 표기하 자) 이 원시조상은 표 1 1. 2 에서 보여주는 형질상태 롱 소유한다고 생각할 수 있다. 여러 분류군에 의해 가장 많이 소유 되는 형질상 태가 원시적 형질상태라는 가정 (제 1 1. 2 장 참조)에 따라 원시조상 의 형질상태을 기술한다면 표 11.2 와 같다.
표 11. 2 원시조상의 형질 상태를 유추하여 기록한 표 분류군형 질 1 2 3 4 5 6 7 8 9 10 11 12 A 。 1 1 。 1 3 1 1 1 。 1 。 B 1 。 1 。 1 2 1 。 1 1 1 1 C 1 1 。 。。 。 。 2 。 1 。。 D 1 1 1 1 1 1 2 2 。。。 1 ANC 1 1 1 。。 1 。 2 。。 1 。
위의 표에서 예를 둘어 ANC 형질 중 형질 1 의 상태가 1 인 것은 A,B,C,D 분류군 중 B,C,D 의 3 개 분류군의 형질상태가 l 이므로 1 의 상태가 가장 공통성이 크다고 보아 이를 공동조상이 소유하는 원시 형질로 간주하였기 때문이다. 실제 원시조상이란 , 모든 형질이 0 의 상태인, 죽 원시형질만을 소유해야 하는 분류군이라고 생각해야만 한다. 그러나 우리가 실제로 이렇게 모든 형질상태가 0 인 분류군과 비교하는 것이 불가능한 경우가 많다• 형질의 어떤 상태가 원시형 인지를 판단하기 어려우므로 파생형이라고 생각되어 1 로 기록하였 더라도 나중에 이것이 원시형으로 간주될 수가 있는 것이다. 여기 서 제시되고 있는 예는 어떤 중간 단계로부터의 계산상의 방법을 소개하려 하는 것이 그 목적이므로, 의도적으로 원시조상의 형질 상태가 1 이 되기도 하는 경우를 택하였다. 원시조상의 형질이 모두 0 인 경우를 대상으로 계산한 예는 W iley (l 981, 제 180-192 쪽)에 찰 나타나 있으므로 홍미 있는 독자는 참고하기 바란다.
5,7,9,10,11,12 번 등의 형질은 공동조상 형질의 규칙을 따르지 않은 것으로 오인될 수도 있다. 특히 9,10,11,12 의 경우 1,0 의 · 형 질 상태를 갖는 비율이 같음에도 불구하고 9 , 10,12 번의 형질은 형 질상태가 0 으로, 11 번 형질은 l 로서 간주하였다. 이는 원시조상군 의 형질이 반드시 공통 형질에만 의존하여 결정되지는 않는다는 사 실을 보여주기 위한 것이다. 원시조상군의 형질은 어디까지나 가정 된 형질이므로 위에서와 같이 각 형질이 가지는 특성에 따라 분류 자의 경험적 지식을 기준으로 원시형질의 상태를 판단할 수도 있다. 지금까지 기술한 방법에 의해 설정된 원시조상군 (ANC) 은 A,B, C,D 중 가장 조상형이라 할 수 있다. 따라서 다음 단계로 A,B,C,D 분류군 중 ANC 와 가장 가까운 관계에 있는 분류군을 찾아야만 한 다. 이를 찾는 방법은 수리분류학에서 유사성을 계산하는 방법과 그 원칙이 매우 유사하다. 죽 유사성을 거리지수로 보아 거리지수 가 가장 작은 분류군을 찾으면 된다. 이때 거리지수의 계산은 다음 식에 의한다. d(A,B) = Ln! lx (A, i)- x(B,i)I (1) l=l 윗식에서 d(A,B) 는 분류군 A,B 사이의 거리지수를, x(A, i)는 분류군 A 의 i번째 형질의 형질상태 x 를 뜻한다. 식 (1) 의 뜻하는 바는 어떤 임의의 분류군 A, B 사이의 거리지수는 A, B 분류군의 각 형질 (i)에 대한 상태의 차이값을 절대값으로 환산하여 이 절대 값을 형질 1 로부터 n 까지 모두 더하라는 의미이다. 예를 들어 표 1 1.1 로부터 분류군 A,B 사이의 거리지수를 구하면 d(A,B).= l o- 1 1+11-01+11-11+10-01+ • • -10-11=6 이 된다. 이러한 방법으로 분류군 A,B,C,D 및 ANC 사이의 각 거 리지수를 구하여 도표화하면 표 1 1. 3 과 같다. 이제 표 11.3 으로부터 우리는 ANC 와 가장 가까운 분류군을 찾 울 수 있다. 죽 이는 거리지수가 가장 작은(유사성이 가장 큰) 분 류군 C 가 된다 (ANC 와 C 사이의 거리지수는 4 로서 위의 도표에서
표 II .3 거리지수 행렬자료표 A B C D ANC A 。 6 11 9 7 B 。 11 9 9 C 。 8 4 D 。 6 ANC 。
가장 작은 값이다). 따라서 우리는 일단 어떤 원시조상 (ANC) 에서 C 가 분지되어 나왔다고 유추할 수 있다. 이룰 간단히 그림으로 나 타내면 아래와 같다. C f ANC 다음 단계로는 분류군 C 및 분류군 ANC 를 하나의 독립된 분류 군으로 보고 이와 가장 가까운 분류군을 A, B, D 중 찾아야 한다. 이때의 거리지수는 다음 식으로 나타내어진다. d(X, Int( A NC,C)) =d(X,ANC ) +d(X,C) - d(ANC,C) (2) 이때 X 란, 분류군 ANC 및 C 를 제의한 A,B,D 중 어떤 임의의 분 류군을 뜻하며 Int (ANC,C) 는 ANC 및 C 분류군으로부터 의 중간거 리 (int e r val of tax on) 라는 의 미 로 사용한 약자이 다. 위 의 식 을, 기재하는 형식을 빌어 옮겨 쓰자면, 어떤 임의의 분류군 X 와 ANC 및 C 분류군 간의 거리지수는, 분류군 X 와 ANC 간의 거리 와, 분류군 X 와 C 간의 거리 합에서 분류군 ANC 와 C 거리를 뺀 값이라는 뜻이다 (실제는 이를 다시 반으로 나누어야 중간거리라는 의미에서 정확하나 여기서는 상대적 거리로 간주하여 나누지 않았 다). X 는, 분류군 A,B,D 중의 하나이므로 이룰 차례로 대입하여 계산하면 다음과 갇다. d(A, Int( A NC,C )) =7+11-4=14 d(B, Int( A NC,C))=9+11-4=16
, d(D, Int( A NC,C ) ) =6+8- 4 = 10 위의 계산으로부터 ANC 및 C 와 동시에 가장 가까운 관계에 있 는 분류군은 D 임을 알 수 있다 (거리지수가 가장 작음). 이때 거 리지수 10 은 실제 ANC-C 와 D 가 10 만큼 떨어져 있기보다는 단순 한 비교치를 나타낸다. 왜냐하면 이때의 거리지수를 구한 식 (2) 는 식 (1) 과 그 원리가 다르기 때문이다. 이때의 10 은 단순히 상칭적 의미로 ANC-C 와 D 와의 관계를 설정하는 데 사용되었다고 할 수 있다(유사성이라는 의미). 이제 우리가 알지 못하는 또 하나의 사실은 이 D 가 ANC-C 사 이의 어느 위치에서 분지되어나갔는가 하는 것이다. 이 문제를 해 결하기 위하여 ANC-C 사이에 어떤 가설적 분류군(이를 HT 1 이 라 하자. H.T : hy po th e ti ca l fa xon) 을 설정해 보자. 이 분류군의 위치는 정확히 모르지만 이 분류군의 형질상태는 유추할 수 있다. 즉 ANC 와 C 분류군의 중간형질상태를 갖는다고 하겠다. 따라서 우리가 이 형질의 상태를 위의 분류군 내에서 비교하여 중간 형질 을 취하면 표 1 1. 4 에서 보여주는 값들이 가정된다. 이 제 부터 문제는 D 가 ANC- ➔ HT l- ➔ D 의 방향으로 분지 되 었는 가, ANC - ➔ D 의 방향으로 분지 되 었는가, ANC - ➔ C - ➔ D 의 방 향으로 분지되었는가 등등의 가능성을 살펴보아야 한다. 이를 결정 하는 중요한 원칙은 역시 가장 관계가 깊은(거리지수가 작은) 분류 군을 검토하는 것이다.
표 II .4 가상적 분류군 (HT 1) 의 형 질상태를 포함하는 분류군의 형질상태 분류군형 질 1 2 3 4 5 6 7 8 9 10 11 12 A 。 1 1 。 1 3 1 1 1 。 1 。 B 1 。 1 。 1 2 1 。 1 1 1 1 C 1 1 。。。。。 2 。 1 。 。 D 1 1 1 1 1 1 2 2 。 。 。 1 ANC 1 1 1 。 。 1 。 2 。 。 1 。 HT 1 1 1 1 。 。 1 。 2 。 。。 。
다시 말하면, 가상의 HT 1 을 추가하여 대상이 되는 분류군 (ANC, C, D, HT 1) 사이의 거리지수를 다시 한 번 계산하는 수밖에 없 다. 이는 표 1 1. 4 로부터 식 (I) 에 의해 계산되어지며 이의 결과를 정리하면 표 1 1. 5 와 같다.
표 | 1.5 가상적 분류군 (HT 1) 과의 거리지수 A B C D ANC HT 1 A 。 6 11 9 7 8 B 。 11 9 9 10 C 。 8 4 3 D 。 6 5 ANC 。 1 HT 1 。
이 계산의 결과에서 알 수 있는 사실은 HT 1 은 ANC 와 가장 밀접 한 관계를 갖고 (거리지수 =1) 차례로 C( 거리지수 =3) 및 D( 거리 지수 =5) 와 관계를 가진다는 사실이다. 이를 그립으로 표시하면 우선 ANC, C 의 거리가 4 인데, ANC, HT 1 의 거리가 1, HT 1 과 C 의 거리가 3, HT 1 과 D 의 거리가 5 이 므로 HT 1 은 ANC, C 사이에 그 거리비가 1 : 3 의 곳에 존재하게 되고, 여기서 5 의 거리를 가진 D 가 분지하게 되므로 아래와 같이 나타낼 수 있다. C .HT I D ANC 위에서 살펴본 문제는 ANC 가 분류군 C, D 또는 HT 1 등과 어 떤 선조 후손 관계를 갖고 있는가 하는 것이었다. 따라서 이제부터
해결해야 할 문제는 이들 분류군을 제의한 분류군 A, B 가 위의 분 류군과 어떤 선조 후손 관계를 갖는가하는 것이다. 이 역시 위에서 소개한 방법을 그대로 적용하여 계속 계산해 나갈 수 있다. 즉 A 와 B 분류군이 C, D, ANC, HT 1 중의 어떤 분류군에서 유래되는 가를 살펴보는 문제이므로 이들 사이의 거리지수를 구해야 한다. 표 11.4 로부터 식 (2) 를 응용하여 이들 사이의 거리지수를 구하면 다음과 같다. dd((AA,, IInntt(( CA ,NHCT, H1)T) =1 )1 )1 =+ 78 +— 83 —= 1 1 =6 14 d(A, Int( D ,HT 1))=9+8-5=12 이는 A 가 C-HT 1 이라는 분류군과는 16, ANC-HT 1 이라는 분 류군과는 14, 또 D-HT 1 이 라는 분류군과는 12 의 거 리 를 가짐 을 뜻한다. 마찬가지 방법으로 B 에 대하여 구하면 다음과 같다. dd((BB,, IInntt(( CA ,NHCT, H1T)) =1)1) 1=+91+01-03—= 118= 18 d(B, Int( D ,HT 1)) =9+10-5= 14 c HT I D ANC A
따라서 이 거리를 단순히 상징적 의미로 사용하여 비교치로서 가장 가까운 분류군을 구하면 A 와 D-HT 1 사이의 거리가 가장 짧다. 이는 A 가 이 D-HT 1 의 어느 위치에서인가 분지되었음을 시사한 다. 이를 그림으로 표시하면 제 185 쪽과 같다. 죽 분류군 A 는 HT 1 과는 8,D 와는 9 의 거리에 있으며 (표 11. 5 참 조) 동시에 HT 1 과 D 사이의 어디에서인가 분지되었음을 뜻한다. 그러나 우리는 A 가 HT 1 과 D 의 어느 지점에서 분지되는지를 알 지 못한다. 따라서 우리는 다시 가설적 분류군을 설정하여 분지점 을 찾게 된다. 이때 가설된 분류군을 HT 2 라 하자. 그러면 이 HT 2 의 형질상태를 가정하여 이를 근거로 거리지수를 계산해야 한다. HT 2 의 형질상태는 분류군 내 비교에 의해 이것이 D 와 HT 1 사이에 놓여 있다고 가정하면 표 11.6 과 같이 정리될 수 있 다.
: 표 | | . 6 HT 2 를 포함하는 분류군들의 형 질상태 1 2 3 4 5 6 7 8 9 10 11 12 A 。 1 1 。 1 3 1 1 1 。 1 。 B 1 。 1 。 1 2 1 。 1 1 1 1 C 1 1 。。 。 。 。 2 。 1 。。 D 1 1 1 1 1 1 2 2 。 。 。 1 ANC 1 1 1 。 。 1 。 2 。 。 1 。 HT 1 1 1 1 。 。 1 。 2 。 。 。。 HT 2 1 1 1 。 1 1 1 2 。 。 。 。
이를 기초로 다시 HT 2 를 포함하는 모든 분류군에 대한 상호간 의 거리지수를 식 (1)에 의해 구한 값은 표 11 . 7 과 같다. 표 11.7 로부터 우리는 HT 2 와 HT 1 사이의 거리는 2, D 와는 3, A 와는 6 임을 알 수 있다.
표 11.7 HT 2 분류군을 포함하는 모든 분류군들 사이의 거리지수 A B C D ANC HT 1 HT 2 A 。 6 11 9 7 8 6 B 。 11 9 9 10 8 C 。 8 4 3 5 D 。 6 5 3 ANC 。 1 3 HT 1 。 2 HT 2 。
따라서 이룰 그림으로 표시하면 아래와 같다. c HT 2 D HT I ANC A 그런데 전화는 가장 짧은 길을 통하여 일어났다고 가정하여야 하 므로 (log ica l pa rsim ony ) 이 원 칙 에 의 하여 다시 도시 하면 A 가 HT 2 에서 분지한 것으로 가정되므로 아래와 같다고 하겠다. c A HT I ANC
이제 진화의 경로가 밝혀지지 않은 최종적인 분류군은 B 이다. 이 B 는 이론적으로 윗그림의 어느 부분에서라도 분지할 수 있으므 로 다시 단계적으로 식 (2) 에 의해 거리지수를 계산해야 한다. d(B, Int (D ,HT 2)) =9+8-3= 14 d(B, Int (A ,HT 2)) =6+8-6=8 d(B, Int( A NC,HT 1) ) = 9 + 10 一 1 = 18 d(B, Int( C ,HT 1))=11+10-3=18 위에서 계산된 결과를 보면 B 와 A-HT 2 사이의 거리가 가장 가 까우므로 일단 B 는 A-HT 2 사이의 어디에선가 분지되었음을 알 수 있다. 그러나 이 사이의 어디에서 정확히 분지되었는지가 불분 명하므로 다시 HT 3 을 가정하여야 한다. HT 3 의 형질 상태가 단 계통군 내의 분류군과 비교하여 중간값을 취해야 함은 물론이다 이 룰 근거로 추정한 형질 상태는 표 1 1. 8 과 같다.
표 | 1.8 가상 분류군 HT 3 의 형질 상태가 추가된 자료표 > 1 2 3 4 5 6 7 8 9 10 11 12 A 。 1 1 。 1 3 1 1 1 。 1 。 B 1 。 1 。 1 2 1 。 1 1 1 1 C 1 1 。 。 。。 。 2 。 1 。 。 D 1 1 1 1 1 1 2 2 。 。 。 1 ANC 1 1 1 。 。 1 。 2 。 。 1 。 HT 1 1 1 1 。。 1 。 2 。 。 。 。 HT 2 1 1 1 。 1 1 1 2 。。 。 。 HT 3 1 1 1 。 1 1 1 2 。。 。 。
표 11.9 는 이를 기초로 계산한 각 분류군 간의 거리지수 자료이다. 위의 예에서는 HT 2 와 HT 3 가 완전동일하므로 B 가 A 와 HT 2 사이에서 분지되었다고 가정할 때 B 가 A 로부터 직접 분지되었음 을 알 수 있다. 죽 HT 3 과 HT 2 사이의 거리는 0 이고 따라서 HT 3 의 설정이 필요없다. B 는 A 에서 직접 분지되었다고 밖에 볼
표 11.9 가상 분류군 HT 3 을 포함하는 분류군들의 거리지수 A B C D ANC HTl HT2 HT3 A 。 6 11 9 7 8 6 6 B 。 11 9 9 10 8 8 C 。 8 4 3 5 5 D 。 6 5 3 3 ANC 。 1 3 3 HTl 。 2 2 HT2 。。 HT3 。
수 없는 것이다. 현재까지의 이러한 결과를 모두 종합하여 최종적 인 계통수를 작성하면 아래 그림과 같다. 분지분석의 결과 최종적 으로 작성되는 계통수를 분지도(分枝岡, clado g ram) 라고 한다. B T c A HTI ANC 분지학의 관점에서 설정되는 계통수의 양상을 실제 예를 통하여 살펴보았다. 위의 예에서는 독자의 이해를 돕기 위해 간단한 예를 중심으로 수리적 계산울 제시하였으나 실제로는 이러한 과정이 자 료의 방대함 때문에 전자계산기를 이용하여 처리된다. 또한 저자에 따라 수리적 계산법에 대한 원리가 다양하게 제안되고 있다. 위에 서는 가장 간단한 예만 제시하였을 뿐이다. 이러한 방향에 홍미를 느끼는 독자는 W il e y (1981) 를 참조하여 발전시키기 바란다. Wa gn er 계통수 이의의 계산원리나 방대한 자료를 처리할 수 있도
록 설계된 계산 프로그램은 Farris ( l970) 등에 상세히 기재되어 있다. 11 .4 분지분석의 이용 예 분지 론적 방법 을 이 용한 논문들은 최 근 Sys t e m ati c Zoolog y와 같 은 분류학 전문 잡지에 많이 발표되고 있다. 한국에서도 1980 년대 이후 이 분야가 성균관 대학교의 이상태 교수(참조 이, 1980) 나 또 는 전북 대학교의 이병훈 교수(참조 이 , 1985) 를 통하여 소개되고 있으며 생물학회의 분류학 심포지움이나 그 밖의 분류학 모임에서 논의되고 있다 . 분지분석의 실제 예를 이 (1985) 의 논문을 통하여 잠시 소개하고자 한다. 아래의 예는 그러나 앞장에서 간단히 소개 된 방법과는 수리적 과정이 약간 다르다. 李 (1 985) 는 절지동물의 일종인 혹무늬 톡토기과의 6 개 아과를 대 상으로 분지분석의 방법에 의해 분지도를 작성하였다. 6 개 아과는 Odonte l l ina e, Brachy s to mellin a e, Frie s ein a e, Pseudochoruti na e, Nauri na e, Ca pu t anur i nae 로서 이 들 아과를 대 상으로 20 개 분류적 형 질을 조사하였으며 H yp o g as t rur i dae 과를 외 부군으로 선정 하여 비교하였다. 분지 분석의 중요한 과정은 앞에서도 설명한 바와 같 이 대상군의 분류적 형질을 조사하여 단계통군을 파악하고 평행 전 화를 알아내는 일이다. 따라서 어떤 형질이 조상형질(p r i m iti ve; ancestr a l ; ple sio m orph y) 이 고 어 떤 형 질 이 파 생 형 질 (deriv e d ; advanced ; a p omor p h y)인가를 결정하는 일이 중요하다. 이 ( 李 )는 톡토기과를 대상으로 파생형질여부의 판단 기준을 Klu g e 와 Farris ( 1969) , Schaefe r 등 ( 1972) , Klug e ( 1976) , Hecht ( 1976) 등에 근 거를 두어 변이과정, 방향, 극성 등으로 표현되는 각 형질 상태에 대한 전화의 방향을 설정하였다고 기술하고 있다 (위의 인용 문헌 들은 李로부터 직접 재인용된 것이므로 李를 참조하기 바람). 이러 한 자료를 중심으로 李는 Wagn e r 계산법에 의한 형질 비평가방법 (characte r unweig h te d ap pr oach) 의 결 과를 형 질 평 가방법 (char-acte r weig h te d a pp roach) 의 결과와 비교하여 논하였다. 이때 형
질평가방법은 Hech t (l976) 의 논문을 주로 참조하고 있는 바, 이 책에서는 이 방법에 대하여 취급하지 않았다. 어떻든 이 형질평가 방법은 각 형질이 갖는 진화의 방향에 의한 정보의 양을 단계적으 로 나누고 이 단계에 의해 전 형질을 평가하여 계통수를 작성하는 방법이다(상세한 것은 李 의 논문을 직접 참조하기 바람). Wa gn er 계산을 위한 기초 자료를 李 (1985) 는 표 1 1. 10 과 같이 제시하고 있다.
표 11.10 Wa gn er 방법에 의한 혹무늬 톡토기과의 6 개 아과를 대상으로 한 분지분석을 위한 20 개 형질에 대한 자료(이. 1985) 의부군 으로는 H yp o g as t rur i dae 가 설정 되 었으며 Ances t ors 로 표기 된 분류군은 계산과정의 중간단계에서 나타나는 가설적 분류군이다. 二 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2C Hy po . 0 0 0 0 0 0 0 0 0 0 1 0-°0 0 0 0 0 0 0 0 Odon. 。 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 Brach. 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 1 0 0 1 0 Frie s . 0 0 1 1 0 1 1 0 1 0 1 0 0 1 0 1 0 0 0 0 Pseud. 1 0 1 0 0 1 1 0 1 0 1 0 0 1 1 1 0 0 1 0 Nean. 1 0 0 1 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 0 Cap u . 1 0 0 0 1 1 1 0 1 1 1 0 0 1 1 1 1 0 1 1 Ancesto r s X 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 1 0 0 00 Yz 00 00 10 00 00 01 11 00 11 00 11 00 00 11 00 11 00 00 00 00 Q 1 0 1 0 0 1 1 0 1 0 1 0 0 1 1 1 0 0 1 0 R 1 0 0 0 1 1 1 0 1 0 1 0 0 1 1 1 1 0 1 0
표 11.10 으로부터 분지분석의 방법에 의해 구해진 혹무늬 톡토기 과의 계통 분화에 대한 결과는 그립 1 1. 1 과 같다. 이 (李)는 형질평가방법과 형질비평가방법에 의한 결과의 차이를 논의하고 있으나, 이 장의 목적이 분지 분석을 소개하고 또한 이 방법의 실제 예를 제시하는데 있으므로 그림 11. 10 의 결과 해석은
H H H
생략한다. 이 장에서 살펴본 바와 같이 분지분석은 분류군을 단순 히 형질의 차이에 의해 분류하려는 시도를 지나서 분류군들 사이의 관계를 계동적 관접에서 해석하려 하려는 것임을 알 수 있다. 죽 분지론자들은 전통분류학에 입각하여 분류의 목적이 계통분화를 논 하는 데 있다고 보아 이를 위한 적절한 방법을 수리적으로 활용할 수 있는 수준까지 발전시켰다고 하겠다.
제 12 장 수리분류학에 대한 비판 생물 분류학에서의 분류적 과정을 수리분류학의 관접에서 분석한 이 책의 내용을 종합하는 의미에서 수리분류학 이론의 출발점이나 방법상의 문제점을 다시 한 번 생각하고 분류학자의 입장에서 수리 분류학을 재 평가해 보고자 한다. Sokal 과 Snea t h 에 의해 정 리 된 수리분류학은 그 이론의 출발점에서 보면 표현론이라 할 수 있고 분류 과정의 방법에서 보면 수리적 분류라 할 수 있다. 수리분류학 에 대한 비판은 따라서 이 두 가지 관접에서 행해져야 한다. 죽 표 현론에 의한 분류 결과가 분류학에서 기준이 되는 생물간의 계통을 얼마나 반영할 수 있는가의 문제와, 또한 수리적 과정을 완벽하게 논리적으로 전개하고 있는가의 문제를 살펴보는 일이라 하겠다. 첫 번째 문제는 표현론에서 기초로 하는 전유사성 (overall sim i lar ity ) 울 계통적 관점에서 살펴봉으로써 더욱 명확해질 수 있다. 두번째 문제인, 방법의 수리적 과정에 관하여는 12 장에서 어느 정도 언급 되겠지만 13 장에서 더욱 자세히 취급될 것이다.
12.1 전유사성 표현론적 방법에 의한 분류의 결과는 수지도로 표시되기도 하고 2 차원 또는 3 차원의 공간상의 점으로 표시되기도 한다. 또한 이러 한 결과들은 최종적으로 제 8.3 장에서 소개된 바와 같이 유사도에 의한 순위에 따라 〈표현군〉으로 묶여지기도 한다. 그러나 수리분류 학적 방법론이 전통적 분류학의 입장에서 그 타당성을 갖기 위하여 는 수리분류의 결과로부터 계통적 관계를 유추할 수 있어야만 한 다. 표현론적 결과가 계통적 유의성을 갖기 위하여는 표현론이 전 유사성으로부터 출발하므로 형질의 전유사성이 무엇인가가 논의되 어야 할 것이다. 죽 표현론에 의한 분류의 결과가 계통적 관계를 반영할 것인가의 문제는 표현론에 입각한 전유사성이 계통적 관계 롤 반영할 것인가의 문제와 동일하다. 표현론에 입각한 형질의 유사성이 무엇인가는 제 5 장에서 상세히 소개한 바 있다. 생물이 현재 소유하는 형질의 차이룰 표현론에 입 각한 유사성이 반영하는 것만은 틀림없다. 그러나, 표현론에서 말 하는 현재의 분류군이 가지는 유사성이란 제 5 장에서도 지적한 바 와 같이 조상으로부터 유래하는 유사성 이의에 평행 진화나 수령 전화에 의한 유사성을 동시에 내포하고 있다. 따라서, 표현론적 유 사성 이 조상으로부터 유래 하는 유사성만을 나타내지 않으므로 조상 과의 관계인 계통을 완벽하게 반영한다고는 볼 수 없다. 계통과의 이러한 불일치를 수리분류학자는 그들이 주장한 전유사성이 가지는 장점에 의해 해결하고자 하였다. 분류형질의 전유사성이 고려되었 울 경우, 평행전화나 수령진화에 의한 유사성은 비중이 아주 작아 지며, 따라서 전유사성이 조상으로부터 유래하는 부계적 유사성을 대부분 반영한다고 본 것이다. 하지만 평행진화나 수령전화는 생물 이 동일한 생태적 지위에서 오랜동안 적응하여 나타난 진화적 결과 이므로 어느 방향성을 가지고 여러 형질이 전반적으로 변화된다 (J ones 와 Luchsin g e r, 1986) 고 보아야 한다. 따라서 전 형 질울 고
려한다 하여도, 평행 또는 수령진화에 의한 형질의 유사성이 차지 하는 비율이 크기 때문에 이 를 무시하기 어려운 경우가 허다하다. 수리분류학자들은 그러나 유사성이 어떠한 종류이든 간에 총괄적 인 입장에서 고려되어야 한다고 주장할 뿐이다. 실제로 수리 분류 학자들은 S i m p son 이 나 Hennig 등에 의 해 정 의 된 상동성 의 개 념 (이 책의 67 쪽 참조)까지도 선조 후손의 관계라는 특수한 관점에서 벗어나, 일반적 목적에서 재정의되어야 한다고 주장함으로써 상동 성이 가지는 계통적 의미까지도 부정하였다. 상동성의 개념이 〈공 동 조상으로부터의 상속에 기인하는 유사성〉 또는 〈같은 기원을 가 지는 형질의 전이단계로 간주되는 유사성〉의 의미를 내포하고 있음 이 이론상으로는 뚜렷함에도 불구하고, 이러한 기준에 의해 실제로 상동성을 인지하는 일은 매우 어렵다고 보았기 때문이다. 오히려 정량적인 방법에 의해 정확히 측정된 현재 분류군이 가지는 유사성 의 차이만이 상동성을 인지하는 데 도움을 줄 수 있다고 본 것이 다. 조상으로부터 유래한 형질을 중요한 형질로 취급하지 않고 전유 사성에 의존하여 분류를 시행한 후 이 분류의 결과가 계통을 반영 한다고 주장하는 것은 논리적 모순점을 가진다. 그럼에도 불구하고 수리분류학자들은 부계적 유사성을 중시하지 않은 채 전유사성으로 부터 도출된 표현군이 선조 후손간의 관계를 잘 반영할 수 있겠는 가에 대하여 확고한 해답을 주고 있지 못하다. 환경에 적응되는 방 향으로 몇몇 진화적 형질들이 발전되어 나감에도 불구하고 이러한 진화적 경향을 가전 형질들이 수리분류학에서처럼 전유사성의 일부 로만 취급되면, 진화의 방향이 뚜렷히 부각되지 못한 상태에서 계 통을 논하게 된다. 수리분류학의 전유사성이 가지는 이러한 모순에 대하여 많은 분 류학자들이 비판을 가하였다. 예를 들면, J ohnson(1970) 은 〈암술 관이 길게 발달된 꽃이 진화되기 이전까지는 매우 긴 혀를 가진 곤 충이 진화될 이유가 없었다. 따라서 진화적 관점에서 중요한 ', 〈긴 혀〉라는 형질을 중요하게 취급하지 않고 모든 형질을 동등하게 취 급하여 계산되는 표현론적 분류의 결과는 비록 이것이 객관성이나 반복성, 안정성, 정확성을 가지고 있다 하더라도 받아들일 수 없
다〉고 하였다. 이러한 진화적 경향의 예는 피식자, 섭식자 사이의 경쟁관계에서는 수없이 관찰된다. 진화적 관점을 배제시킨 채 계통 을 논하는 데 대한 반박은 이러한 예 이의에도 수없이 많다. 이러 한 예들 때문에 Cracra ft (1967) 는 〈 진화의 개념에 기초를 두지 않 는 분류는 진화적 정의에 의해 기술되는 역사적 생물학적 사건을 정확히 반영하지 못한다 〉 고 서술하였다. 그러나 이러한 지적에 대 하여 Snea t h 와 Sokal(1973) 은 다만 다음과 갇이 표현했을 뿐이다. 죽 〈표현론적 분류를 계통적 분류로 받아들일 수 있는가에 대하여 표현론적 분류를 있는 그대로 받아들일 수 없는가 반문할 따름이 며, 계통적 분류가 꼭 타당하다고 정확히 주장하지도 못하면서 표 현론적 분류가 타당치 못하다고 주장하는 것은 부당하다〉고 서술하 고 있다. 표현론의 전유사성과 계통적 관계가 전혀 상관이 없다고 양보하더라도 표현론적 분류 자체는 인정되어야 한다는 입장만을 고수하여 표현군에 의한 계통적 관계에 대한 해석을 회피하고 있음 울 알수 있다. 수리분류학자는 이렇게 분류학의 목적 자체가 무엇인가에 따라 분류적 방법론이 논의되어야 한다고까지 주장하였다. 죽 분류의 목 적이 여러 관점에 의해 설정될 수 있으므로 수리분류학적 결과를 꼭 계통적 관점에서 해석하려 할 필요가 있는가에 대해서도 의문을 제기한 것이다. 수리분류학자들은 그들이 가지는 마지막 도피처를 이렇게 만들고 있을 뿐이다. 제 13 장에서 전통분류학, 분지론 등과 수리분류학을 비교함으로써 수리분류학의 전유사성이 가지는 문제 에 좀더 접근하게 될것이다. 여기서는 우선 수리분류학이 가지는 두번째 문제로 넘어가 보자. 12.2 수리적 분류 과정 지금까지 수리분류학의 실제 출발점인 전유사성이 가지는 문제점 울 살펴보았다. 두번째는 이제 전유사성을 선택하는 것이 비록 타 당하다 하여도 전유사성을 도출하는 과정에는 모순점이 없는가를
살펴보아야 한다. 전유사성을 수리분류학에서는 수리적 과정에 의 하여 산출하고 있다. 이러한 수리적 과정 때문에 수리분류학은 객 관성과 반복성을 가지고 있다고 주장된다. 그러나 수리분류학이 자 연과학적 방법론에서 중요시되는 객관성과 반복성으로부터 그 의미 룰 찾고자 한다면, 수리분류학적 과정이 과연 객관성을 가지도록 타당하게 이론화되어 있는가를 살펴볼 필요가 있다. 수리분류학적 과정에 대한 방법론은 수리적이므로 수리학자, 통 계학자, 또는 수학자가 논의하여야 할 사항이다. 그러나 수리적 방 법의 대부분이 앞에서도 살펴 본 바와 같이 기술통계학의 범주에 속하므로 분류학자의 입장에서 수리적 과정에 대한 비판이 가해질 수 있다. 이러한 의미에서 분류의 수리적 과정에서 나타나는 문제 점들을 살펴보면 이미 분류적 형질을 수리적으로 기재하는 초기과 정부터 분류학자에 따른 견해의 차이가 야기됨을 알 수 있다. 만일 수리적 과정 자체에서 견해의 차이가 야기된다면, 결과적으로 이러 한 견해의 차이에 의한 과정의 차이가 서로 다른 결과를 가져움은 명백한 사실이다. 실제로도 수리적 과정의 차이에 의해 분류 결과 의 차이는 야기되고 있다. 분류 결과의 차이는 특히 네 가지 과정 에서 야기된다. 첫째는, 분류적 형질을 평가하는 과정이며, 둘째 는, 분류적 형질의 형질상태로서 기재된 정성, 정량적 자료를 기초 로 유사도를 계산하는 과정, 세째는, 이 유사도로부터 표현군을 도 출하는 집괴분석 내지 배열과정, 마지막으로는 표현군의 등급을 설 정하는 과정이다. 첫째의 분류적 형질을 평가하고 기재하는 과정에서는 관찰자에 따른 개인적 차이가 나타날 수 있다. 그러나 현재까지 이러한 개인 적인 차이가 분류의 최종 결과에 어느 정도 영향을 미칠 것인가는 자세히 조사되고 있지 못하다. 수리분류학에서의 형질의 정성 또는 정량적 기재는 제 6 장에서 언급한 바와 같이 그 범위가 명확하게 주어지고 있어 개인적인 차이가 크지 않을 수 있음을 상상할 수 있 다. 더욱 중요한 문제는 개인적인 형질의 평가기준보다는 분류적 형질의 종류에 따라 정성적 또는 정량적으로 혼합되어 기재될 수 밖에 없는 상황이 나타나기도 하고 같은 형질이라 하더라도 분류적 형질의 단위에 대한 기준이 개인적으로는 차이가 있어 실제로 기재
되는 값이 다를 수 있다는 사실이다. Sokal 과 Snea t h 는 이러한 문 제에 대하여 일반적으로 통계학에서 사용되고 있는 〈표준화〉 (sta n dardiz a ti on ) 작업 등을 통하여 서로 다른 형질을 비교할 수 있음을 주장하였으나, 정성 정량적 자료의 혼합이 가져오는 유사성 의 차이 등에 대한 확답은 주고 있지 못하다. 둘째번으로 지적된, 유사지수의 다양한 계산 방법에서 기인하는 유사도의 차이 또한 여러 유사지수가 어느 방향성을 제시할 수 있 을 것으로만 보았으며 세번째로 지적된 집괴분석방법의 다양성 때 문에 생기는 결과의 차이에 대해서도 그 해결 방법을 제시하지는 못하였다. 다만, 비가중 평균결합廳 (UPGMA) 법이 일반적으로 받아 들여지고 있는 방법임을 지적하였을 따름이다. 더구나 네번째 제기 된 표현군의 등급을 설정하는 문제는 심각한 모순을 불러일으킨다. Sokal 과 Snea th는 분류군 대신에 운영분류단위를 도입하였고(제 6.4 장 참조), 이 운영분류단위가 어느 수준에서 묶여지도록 분류적 등급을 설정하였다. 그들은 그러나, 이때 어느 일정한 수준에서 묶 여지는 운영분류단위의 무리를 분류학적 등급인 종, 속 등으로 표 기하지 않고 이를 단순히 표현군이라고 칭하였다(이 책의 제 119 쪽 참조). 이러한 표현군의 등급 수준 때문에 운영분류단위는 자연에 실재하는 것으로 믿어지는 종 이하의 단위가 될 수도 있고, 종 이 상 수준의 단위가 될 수 있다. 따라서 종이라는 단위에 초점을 맞 춘 전통분류학의 입장에서 보면 모순점이 드러난다고 하겠다. 위에서 살펴본 바와 같이 수리분류학은 전유사성의 규정뿐 아니 라 전유사성을 도출하는 수리적 과정에서도 모순점을 드러내고 있 다. 수리분류학자들은 수리적 과정의 다양함으로 인해 객관성이 결 여되어 있음을 충분히 인식하면서도, 방법론적 차이에서 오는 결과 의 해석에 뚜렷한 의견을 제시하지 못하고 있는 것이다. 수리분류 학자들은 이런 모든 문제에 있어 일반적 결론을 내리기에는 좀더 많은 경험을 필요로 한다고 하였으며 현재까지는 뚜렷한 결론을 유 보시키고 있을 뿐이다. 수리분류학의 이러한 문제들 때문에, 수리 적 방법에 의해 분류하는 공식적인 방법은 있을 수 없다고 주장되 는 경우까지 있다. 그러나 Sokal 과 Cam i n(1965) 은 〈전통적인 분류 역시 표현론적 요소를 함유하고 있으므로 여기에서도 이러한 문제
는 계속 남아 있다〉고 함으로써 어떤 한 가지 방법에 의한 분류가 실제로는 불가능 함을 지적하였다. 따라서 그들은 수리분류학도 비 록 그 과정에 모순이 있지만 분류의 한 방법으로 우리가 받아들여 야 한다고 주장한 것이다. 12.3 수리분류학자의 입장 수리분류학이 안고 있는 문제점에도 불구하고 수리적 방법론이 분류학에 공헌한 것은 틀림없는 사실이다. 그러나 앞에서 지적한 구체적인 방법론의 문제 이외에, 기재하는 방법에 의해 분류를 수 행하는 분류학의 전통에 정량적인 방법을 도입함으로써 야기되는 문제점들에 대하여도 수리분류학자는 그들의 입장을 정확히 표명해 야만 한다. Ma y r(l969) 는 전통적 분류학을 옹호하는 입장에서 〈생 물학자는 어느 개체나 표현군을 분류하는 것이 아니라 개체군을 분 류하는 것이며, 하위 분류군이란 인위적 집합체가 아닌 생식단위이 고 비록 상위 분류군이라도 조상과의 관계에서 도출된 분류군이다〉 라고 기술하고 있음에 대하여 수리분류학에서 유도되는 표현군이 인위적 집합체가 아님을 어떠한 종류의 명확한 논리적 근거를 제시 하여 대답하여야 할까롤 수리분류학자는 생각하여야만 한다. 〈분류 학자는 분류군을 만들어내는 것이 아니라 진화적 결과에 의한 분류 군을 발견하는 것이다〉라는 주장에는 어떻게 대처할 수 있겠는가? 종대신에 〈운영분류단위〉를 분류단위로 하면서 어떻게 종의 자연성 울 이끌어낼 수 있는가? 비록 전유사성을 인정한다 하여도 전유사 성의 산출을 위해 가능한 한 많은 형질을 비교해야 하는데 이는 실 제로 번거롭고 불편하지는 않는가? 등의 질문에 해답을 주어야만 한다. 이 책의 서론 부분에서 취급되고 있는 분류학의 이러한 기본 문 제들을 수리분류학자들이 거부하는 것은 결코 아니다. 단지 어떠한 방법에 의해 분류군을 발견할 것인가에 대한 해답을 표현론에 기초 한 수리적 방법에서 찾고자 했을 뿐이다. 전통분류학자들이 분류적
과정 자체가 진화적 가설을 세울 수 있는 방향으로 이루어져야 한 다고 주장했음에 비하여 수리분류학자들은 이러한 과정이 일단은 분리되어야 한다고 본 것이다. 그러나 수리적 방법에 의한 결과를 그러면, 구체적으로 어떻게 진화분류학의 개념과 연결시킬 것인가 에 대한 해답은 주고 있지 못함이 현재의 상황이다. 표현론적 분류가 계통을 반영하는데 있어서 가지는 문제점 때문 에 최근 대두되고 있는 분지론은 분류학자들로부터 많은 호응을 얻 고 있다. 예를 들면, Funk(l983) 는 분류적으로 논란이 되고 있는 난초과의 식물을 대상으로 표현론적 분류와 분지론적 분류를 비교 하여 분지론의 타당성을 강력하게 주장하였다. 난초과를 대상으로 한 표현론적 분류의 결과로부터 Funk 는 분류적 형질이 어떤 계보 를 형성하는 것이 아니라 단순히 대상을 구별하는 양상으로 나타남 을 보았다. 또 몇몇 형질은 실제 분류군을 이루고 있으나, 아과(亞 科)를 구성하는 구성원은 수리적 결과에 기초를 둘 필요가 없는 형 질을 소유하며, 또 몇몇 분류군은 형질을 소유하고 있지 않음에 의 해 분류됨도 보았다. 이에 비해 분지분석의 결과에 의하여 아과는 정확하게 단계통군에 의해 형성되고, 이때 나타나는 분지도가 현재 까지 시행되어 온 전통적 분류와 잘 일치되고 있어 Funk 는 분지 분석의 타당성을 강조한 것이다. 실제로 표현론적 분류보다 분지론 적 분류가 전통적 분류의 결과와 잘 일치되는 예는 얼마든지 있다. 이는 방법론적으로 분지론이 훨씬더 전통적 분류의 기준에 적합하 도록 원칙이 설정되어있기 때문이다 .• 이러한 이유 때문에 W iley (1981) 는 분지론을 소개하는 그의 저서 『계통학』 (系統學, Phyl o g en eti cs) 에 서 cladis t i cs ::::: ph y lo g e neti cs ::::: ph y lo g e neti c sys - ter nati cs:: ::: s y s t ema tic s 의 관계 로 분지 론이 체 계 학 (sys t e m ati cs) 의 거의 전부를 차지하는 것처럼 논리를 전개해 나가고 있다. Funk 와 Brooks(1981) 역시 표현론적 접근이 린네의 분류 계층을 구성하는 데 전혀 도움이 될 수 없음을 지적하고 분지론적 분류는 영원히 사 라지지 않으며, 이는 다론 어떤 방법보다 더 좋은 분류에의 접근법 이라고까지 주장한 바 있다. 분지론자의 이러한 입장에 대하여 수리분류학자들은 다시 자연과 학의 실증성에 대한 논리로 반박하고 있다. 자연과학을 〈인간의 외
계에 대한 이성적이고 객관적인 연구 (Crowson, 1970) 〉 라고 한다면, 분지분석의 결과 역시 객관적으로 검정할 수 있는 가설을 제시하여 야만 한다고 본 것이다. 이에 대하여 W i el y (1975) 는 상동성을, 검 정할 수 있는 가정으로 보아 〈분류는 파생형질에 의해 구성될 수 있다〉는 분지론적 입장을 고수하였다. 그러나 이때의 파생형질을 어떻게 객관적으로 규정하고 (물론 분지론자들은 이에 대한 객관적 규정을 제시하고 있긴 하나 과연 얼마나 타당할 것인가) 또 이를 어떻게 검정할 것인가에 대한 문제를 표현론자들은 제기하고 있는 것이다. 죽 형질의 전이과정이나 극성 (極性, po larity ) 등을 객관 적으로 증명하기가 어렵고 이에 기초롤 둔 분지론적 결과도 검증될 수 없음을 지적하였다 (예, Jen sen, 1983). 물론 Cracraft (1974) 는 많은 경우에 있어서, 계통학자들에 의해 형질상태에 대한 어떤 믿을 수 있는 전화적 연계성이 서로가 인정하는 . 방향으로 설정되고 있어 극성을 결정하는 데 객관성이 존재한다고 주장하고 있지만, 이에 대한 〈신빙성〉을 측정하는 방법을 구체적으로 제시하고 있지 는 못하다. 분지론적 분석에서의 중요한 개념인 상동성까지도 이미 설정된 계동에 기초를 두고 있으므로 형질의 극성을 결정하는 일반 적인 방법들이 속을 규정하기 이전에 과를 규정하는 것과 같은(선 조군을 찾음으로 해서) 모순을 안고 있다고 수리분류학자들은 지적 하였다. 표현론의 이론적 근거나 수리적 방법에 대한 바판에 가장 강력하 게 대응하는 수리분류학자들의 논리는 수리분류학이 실증적이라는 것이다. Snea t h(1983) 가 지적한 대로 표현론적 분류가 실증적임에 비해 계통적 분류 또는 계통적 분류의 한 방법인 분지론등이 실증 적이지 못하다는 것이다. 이는 제 4 장에서도 지적한 바와 같이 실 제의 계통이 고생물학적 증거에 의해 충분히 증명되고 있지 못하다 는 사실에 기인한다. 이러한 실증적이지 못한 논리를 자연과학에 도입하는 것은 불합리하며, 따라서 전통적 방법에만 의존하는 분류 는 완벽하지 못하다는 것이 수리분류학자의 입장이다.
제 13 장 전통분류학과 수리분류학의 만남 수리분류학은 전통적 또는 진화적, 계통적 분류학의 역사 속에서 1960 년대 이후 정립되었다. 1950 년대 중반, 수리분류학이 처음으로 주장되기 시작하였을 때만 해도 분류학에 대한 정돈되고 안정된 이 론이 생물분류학계를 지배하고 있었다. 이는 다윈 이후 진화의 개 념이 분류학에서 수용되어 분류학의 이론이 완성된 결과였고, 오늘 날까지도 May r, Sim p so n 등에 의해 이러한 이론은 계속 수호되고 있는 상황이다. 그럼에도 불구하고 수리적 또는 표현론적 분류로 대표되는 수리분류학은 전통 분류학자들에 의해 설정된 가정이나 방법에 대한 의문을 제기함으로써 그 위치를 확고히 하기 시작하였 다. 표현론적 방법에 의한 분류적 유사성의 측정이 좀더 긍정적으 로 객관적 사실에 접근할 수 있다는 평가를 차차 받기 시작하였으 며 이 결과, 전통적 또는 계통적 분류학의 방법에 내재된 문제점들 이 수리분류학적 방법론에 의해 보완적으로 해결될 수 있음을 부정 할 수 없게 되었다. 1963 년 Sokal 과 Snea t h 는 『 수리분류학의 원 리 』 라는 책을 출간하였고, 이후 May r(1 965) 등에 의해 여러 논평 울 받기도 하면서 그들은 다시 『 수리분류학 』 이라는 방대한 양의 책 울 1973 년에 출간함으로써, 오늘날에 와서는 수리분류학은 분류학 또는 계동학 내에서 확고한 위치를 차지하고 있다. 제 13 장에서는
지금까지 이 책에서 소개한 수리분류학의 방법론에 대한 논의를 기 초로, 수리분류학이 분류학에서 차지하는 위치는 무엇인가를 다시 한 번 살펴보고, 분류학자로서 수리분류학에 대한 입장을 어떻게 설정할 수 있겠는가를 정리해 보고자 한다. 13.1 전통분류학, 표현론 그리고 분지론 만일 우리가 현재까지의 분류 이론들을 전통 분류학, 표현론, 분 지론 등으로 구분한다면 우선 분류의 이론들을 이렇게 구분하는 것 이 타당할 것인가가 논의되어야할 것이다. 그러나, 일단 이러한 구 분을 인정하고 대신에 각 이론의 가장 중요한 주장만을 제한적으로 받아들인다는 조건하에서 이들 분류 이론의 상충됨을 토의해 보고 자 한다. 표현론이나 분지론이라는 술어롤 사용할 때에는 그 의미 하는 바에 대하여 특별한 규정이 필요없을 것이다. 그러나, 전통분 류학이라는 술어는 지금부터 과연 어떤 의미에서 제한적으로 사용 하고자 하는 것인지 보충설명을 필요로 한다. 이 책의 제 1 부에서 논의된 바와 같이, 분류는 진화적 사실을 반 영할 수 있도록 행해져야 하는 것이 다윈 이후 오늘날까지도 원칙 으로 받아들여지고 있는 전통이다. 따라서 분류학이라고 말해지지 만, 원리만을 강조한다면 이는 곧 진화분류학이라고 할 수 있다. 전화분류학을 추구하면서 그 과정상 어떤 방법론울 택할 것인가는 학자의 견해에 따라 다르게 나타나는 것에 불과하다고 보아도 무방 한 것이다. 그러므로 위에서 사용한 술어인 전통분류학이란 좁은 의미에서 진화분류학을 추구하는 과정상의 문제로 제한되게 사용할 수 있다고 생각한다. 이 장에서 사용하는 전통분류학의 의미도 경 험에 의하며, 동시에 필수 형질의 개념까지도 무의식적으로 사용하 는, 어떤 의미에서 보면 최근 대두된 표현론이나 분지론에 의하지 않고 전통적인 방법에 의해 분류를 행하는 분류학으로 제한시키고 자 한다. 전통분류학의 범주를 이렇게 규정하고 표현론과 전통 분 류학, 분지론과의 관계를 참시 살펴보자.
분류학은 지구상에 존재하는 생물들을 기재하고, 생물들간의 관 계를 반영할 수 있는 체계로 생물들을 배열하는 문제에 대하여 그 이론을 정립하여 왔다. 분류학자들이 분류에서 실제로 행하는 작업 은 생물을 기재하기도 하고 기재를 통하여 다시 생물을 분류하기도 하며 이러한 경험 속에서 생물과 생물간의 관계를 설정하여 계통 또는 체계를 수립하기도 하는 일이다. 이러한 일을 수행함에 있어 원칙을 기술하라 한다면 대부분의 분류학자는 〈 자연군을 설정한다〉 는 모호한 표현으로 분류의 이론을 나타낼 뿐이다. 이때 자연군을 설정한다는 과정을 구체적으로 보면, 기재와 분류를 시행하는 과정 과 분류의 결과를 해석하는 과정으로 나눌 수 있겠다. 그러나 이 두 과정은 서로 분리시킬 수 없는 연계성을 가지고 있다. 왜냐하면 해석과정에서의 중요한 점이 분류의 결과가 진화적 관점에서 해석 되어져야 한다는 사실이기 때문에 분류의 결과를 진화적 관점으로 해석할 수 있도록 하는 기재 또는 분류의 방법이 무엇이겠는가를 찾게 되기 때문이다. 전통분류학의 특징은 이러한 분류학적 과정이 경험적 지식에 의 해 이루어진다는 것이다. 죽 전통분류학자들은 분류적 형질을 조사 하고 이의 과정에서 경험적으로 축적되는 직감까지를 포함시켜 최 종적인 분류의 결과에 도달한다. 또 분류군을 분리해내도록 한 형 질 중, 선조 후손 관계에서 연유하는 분류적 형질들을 경험적으로 선택하여 이 형질의 성격에 의해 계통적 또는 전화적 관계를 유도 해내려고 노력한다. 표현론은 경험적 과정에 반론을 제기한 대표적인 분류 이론이다. 그러나, 표현론도 이 책에서 살펴본 바와 같이 전통분류학이 가지 는 모든 과정을 객관화하지는 못하고 있다. 분류학에서 수행되는 일을 위에서와 갇이 기재 및 분류의 구체적 과정과 계통의 수립이 라는 이론적 과정으로 나눈다면 표현론은 분류라는 구체적 과정에 대하여는 빈틈없는 논리를 전개하고 있으나, 제 12.1 장에서 지적한 바와 같이 계통의 수립이라는 과정에 대하여는 확고한 해답울 주고 있지 못하다. 따라서, 표현론이 분류학의 제 문제를 모두 해결하려 시도하였지만, 결과적으로는 분류학의 일부를 취급하는 데만 어느 정도 성공하였다고밖에 말할 수 없다.
그러나 우리가 표현론 을 아무리 배척한다 하여도 표현론이 최소 한 분류의 과정을 개선한 사실을 부정할 수는 절대 없을 것이다. 이는 표현론이 가지는 특성에서 유도되는 필연적인 결과이다. 표현 론은 분류의 과정에서 철저히 전통분류학의 관습을 이어받고 있기 때문이다. 전통분류학에서의 중요한 과제는 일차적으로 생물을 기 재하고 기재를 통하여 분류하는 작업인 바, 표현론에서 기초로 하 는 유사성을 조사하는 일은 전통적 분류에서 행하는 기재의 일과 실제로는 별로 다를 바가 없다. 단, 표현론에 의존하는 분류학자들 은 가능한 한 많은 형질을 조사하여 유사한 대상끼리 하나의 무리 를 이루도록 수리적 방법에 의해 분류에 접근하고 있을 뿐이다. 물 론 표현론에서 유사성을 이렇게, 많은 형질에 기초롤 두는 전유사 성으로 규정하고 있긴 하나, 이 역시 어디까지나 방법론적으로 유 사성을 어느 한계에서 취급하느냐의 문제에 불과하다. 따라서 유사 성이 실제로 반영하는 것은 표현군의 제반 형질이며 이는 곧 전통 적 분류 방법에서 주로 취급하는 〈기재 내용〉의 확대라고 볼 수 있 는 것이다. 분류학에서 중요한 과제로 취급되는 〈계통의 수립〉을 객관적으로 개선한 방법은 분지분석법이라고 분지론자에 의해 주장되고 있다. 분지론자들은 대상들이 가지는 분류적 형질을 원시형질이나 파생형 질의 성격으로 나누고 이로부터 직접 조상의 최근성을 판단하고, 다시 선조 후손간의 분지적 관계를 유추함으로써 전통적 분류학에 서 문제가 되는 계통적 관계를 증명하고자 하였다. 그러나, 이러한 분지론 역시 분류학을 대치할 수는 없다고 본다. 분지론에서는 계 통의 수립에만 적극적으로 참여할 뿐 실제로 분류를 실행하지는 않 기 때문이다. 죽 분류학의 첫째 과정을 실행하지 않고 있는 것이 다. 표현론과 분지론이 동시에 이용되어 분류학의 제문제를 해결할 수 있지 않을까에 대한 질문이 제기될 수도 있다. 그러나 이 두 이 론을 합쳐서 분류학의 임무를 수행하는 데에는 어려움이 있다. 첫 째, 표현론과 분지론은 그 출발접이 다르다. 죽 수행 임무가 다르 다고 할 수 있다. 두 이론이 서로 상충되는 것도 이 때문이다. 위 에서 언급한 바와 같이 분류의 실제를 취급하는가 계통의 수립을
취급하는가의 문제이기 때문이다. 둘째, 이들 이론이 대상으로 하 는 분류군의 수준이 다르다. 표현론은 하위 분류군을 대상으로 하 나 분지론은 주로 상위 분류군을 대상으로 한다. 대상이 이렇게 다 름으로 해서 이론이 각각 다르다고도 할 수 있다. 따라서 같은 대 상을 놓고 두 이론을 모두 적용하여, 분류의 구체적 행위는 표현론 에 의해 실시하고 계통의 수립은 분지론에 의해 실시할 수가 없다. 두 이론의 대상이 다르기 때문에 같은 대상을 중심으로 두 이론의 보완적 역할을 기대할 수는 없는 것이다. 분류학의 문제를 개선하고자 제기된 두 이론은 분류학에 대하여 어떤 공헌을 할 수 있을까? 이제부터 차츰 이 문제에 접근해 보고 자 한다. 우선, 만일 우리가 수리적 방법론을 받아들인다면, 위에 서 지적한 바와 갇이 분류학의 부분 부분에 비록 철단되긴 하지만, 두 이론이 독립적으로 공헌할 수 있을 것은 틀림없는 사실이다. 물 론 여기에도 문제가 남는다. 우리가 과연 수리적 방법을 받아들일 것인가를 결정해야만 하기 때문이다. 먼저 수리분류학의 범위를 정 확히 논의한 후에 수리분류학의 분류학에 대한 공헌 가능성을 살펴 보고자한다. 13.2 전통분류학과 광의의 수리분류학 전통분류학은 경험적 지식을 기반으로 한다. 이에 비해 표현론이 나 분지론은 모두 수리적 방법을 사용하고 있다. 분지론까지도 수 리적 방법을 사용하고 있다는 것은 한번쯤 깊게 생각해야 할 문제 이다. 죽 분지론적 분류가 표현론적 분류와 비록 그 출발 원칙이 다르지만, 제 11 장에서 소개한 바와 같이 수리적 방법을 사용하고 있음은 매우 홍미있는 일이다. 따라서, 수리분류학의 한계를 어디 에 설정할 것인가도 〈수리분류학〉이라는 제목으로 이 책을 정리하 는 마지막 단계에서 수리분류학에서 취급하는 여러 문제를 종합하 여 한번쯤 생각해 보아야 할 문제이다. 수리분류학이 단순히 수리적 방법을 나타낸다면, 이는 넓은 의미
에서 분지론까지 를 포함할 수 있게 된다. 아마 이러한 이유 때문에 Snea t h 와 Sokal(l973) 은 실제로 그들의 저서에서 분지론의 방법을 상세히 소개하고 있을지도 모른다. 애석하게도 그들은 그러나, 책 의 어느 부분에서도 수리분류학의 〈수리〉에 대한 의미와 분지론과 의 관계에 대한 의견을 기술하고 있지 않다. 그럼에도 불구하고 수 리분류학에서의 수리라는 술어는 단순히 수리적 방법만을 뜻하고 있지 않음을 이 책을 읽는 모든 독자가 현재의 시점에서 이해하리 라고 믿는다. Sokal 과 Snea t h 가 주장한 수리분류학에서는 수리적 방법을 제안한 것이 중요하간 하지만 수리적 분류의 배경이 되는 분류의 원리를 논리적으로 전개하였다는 것이 더욱 중요하다. 즉 그들에 의한 수리분류학 책에서 중요한 내용은 수리적 방법론 이의 에도 수리분류학의 출발을 위한 표현론이라는 분류 이론을 제안한 것이라고 할 수 있다. 그러므로 그들이 의미한 수리분류학은 표현 론이론 이라고도 말해진다. 수리 분류학의 분류적 원칙이 이렇게 표현론의 이론이 핵심이므로 수리분류학이 광의로 해석되어 분지론 울 포함한다고 주장되어서는 안 될 것이다. 수리분류학이 분지론과 대등한 입장이 아님은 명백하다. 수리분 류학을 Sokal 과 Snea t h 의 개 념 에 의 해 그 핵 심 만을 말한다면 표현 론이라고 할 수 있으므로 분지론은 오히려 이 표현론과 대치되는 개념으로 사용될 수 있겠다. 이러한 이유 때문에 이 장에서 역시 전통분류학, 표현론, 분지론을 대치시켜 논하고 있는 것이다. 분류 의 이론을 크게 이 세 가지로 나누는 것은 우리가 이제 쉽게 수긍할 수 있을 것이다. 그러나 문제는 앞에서 제기된 바와 같이 〈수리적〉 방법에 초점이 맞추어질 경우 표현론, 분지론, 수리분류학등의 구 분이 명확하지 않다는 것이다. 이 문제를 생각하기 위하여 다시 한 번 분류학의 방법론을 논하는 관점으로 돌아가 보자. Sokal 과 Snea t h 에 의해 정리된 수리분류학은 구체적으로 표현론 울 지칭하고 있지만, Henn ig에서 출발한 분지론 역시 Farris (1970), Wi ley (1 981) 등에 의해 구체적 방법이 수리적 방법으로 체계화되었음은 분류학의 방법론을 논하는 데 있어 간과할 수 없는 사실 이 다. Sokal 과 Snea t h 는 수리 적 방법 이 객 관적 이 라는 신념 아 래, 방법론을 정당화시키기 위하여 어쩌면 전통적 개념의 유사성을
좀더 폭넓은 전유사성으로 대치했을지도 모른다. 그런데 전유사성 울 도출하기 위하여 취급되는 형질은 표현형질이어야 하므로 표현 형질을 중요시 취급해야만 하는 논리를 적극적으로 전개하였고 따 라서 그 당시에 그들이 주장했던 수리분류학이 이제와서는 표현론 으로 축소되어 불리우게 되었다고 생각할 수도 있다. 그러므로 이 제 수리분류학을 의미의 규정없이 사용하는 것은 어려운 일이 되어 버렸다. 수리적 방법이 분지론에서도 사용되므로 현 시점에서 수리 분류학이라는 용어를 사용하면 이는 Sokal 과 Snea t h 가 최초에 주 장했던 표현론에 근거를 둔 수리분류학과는 다른 의미로 쓰일 수 있는 가능성이 있기 때문이다. 분지론은 원래 전통 생물학의 근간 국가인 독일로부터 출발하고 있어 처음부터 수리적 방법과 갇은 인위적인 방법들이 개입될 여지 가 없었다. 그러나 Klu g e 와 Farris ( 1969), Farris( 1970) 등에 의해 분지론에 입각한 수리적 방법들이 개발됨으로써 분지론 역시 결국 은 수리분류학의 범주에 속하게 할 수밖에는 없는 상황이 되어 버 렸다 (Sokal 과 Snea t h 가 의도했던 수리 분류학과는 그 출발점이 다 르기 때문에 그들이 의미했던 수리분류학으로 취급할 수는 없지 만). 그러므로 이제부터는 Sokal 과 Snea t h 가 의미한 수리분류학 울, 이 수리분류학의 구체적 이론인 표현론과, Henn ig를 출발점으 로 하는 분지론 모두를 포함하는 수리분류학과 구별되게 사용하여 야만 할 것이다. 수리분류학에 대한 이러한 복잡한 상황을 필자는 〈광의의 수리분 류학〉과 〈협의의 수리분류학〉이라는 용어를 사용하여 이 장에서 나 타내 보고자 한다. 그러면 협의의 수리분류학이란 Sokal 과 Sneath 가 의미한 수리분류학을 뜻하며 따라서 그들의 이론인 표현론을 포 함하게 된다. 협의의 수리분류학에 분지론을 포함시키려고는 하지 않는다. Sokal 과 Snea t h 는 비록 의도적으로 표현하고 있지는 않지 만. 1973 년의 그들의 저서에서 분지론을 취급함으로써 표현론 이의 의 이론을 수리분류학에 수용하려 하였다. 그러나 Sokal 과 Sneath 가 주장한 수리분류학은 어디까지나 표현론에 기초를 두고 있으므 로 Sokal 과 Snea t h 가 의 미 한 수리분류학에 분지론을 포함시 킬 수 는 없다고 필자는 생각한다.
협의의 수리분류학이 표현론과 서로 대등한 입장은 아니라고 생 각한다. 표현론은 어 디 까지 나 Sokal 과 Snea t h 가 의 미 한 수리 분류 학의 이론적 출발점에 불과한 것이기 때문이다. Farris (1980) 와 같이 표현론이 반드시 수리적 방법에 의하지 않고 정착될 수 있다 고 믿는 학자가 있기도 하다. 또 제 4 장에서 지적한 바와 같이 표 현론이 전통적 분류법에 깊게 뿌리를 두고 있음도 표현론이 반드시 수리적 방법에 의하지 않아도 된다는 강한 주장이 될 수 있다. 표 현론이 수리적 방법을 사용하지 않아도 된다는 사실이 표현론을 전 통분류학과 대치되는 개념으로까지 확대할 수 있게도 한다. 그러나 실제로 이를 대치시켜 생각하기는 어렵다. 표현론은 어디까지나 수 리분류학의 출발점으로만 이해하여야 하기 때문이다. 필자가 의미한 광의의 수리분류학이란 분지론까지를 포함한, 분 류의 이론적 출발점이 비록 다르더라도 수리적 방법을 사용하는 경 우를 말한다. 이러한 광의의 수리분류학은 J ard i n 과 Sib s on (1971), Dunn 과 Everit t (19 82), Felsenste i n (19 83) 등에 의해 방 법론적 관점 이 강조되 어 수학분류학(數學分類學, math e mati ca l tax onomy ) , 정 량분류학 (定批分類學, qu anti tat i ve tax onomy 또 는 tax ometr i c s, McNeil l, 1984) 등으로 표현되기도 하였다. 이 장 에서 수학분류학이나 정량분류학이라는 술어롤 도입하려고는 하지 않는다. 광의의 수리분류학이 이러한 의미를 내포한다고 강조할 뿐 이다. 그립 13.1 은 지금까지 위에서 기술한 내용을 중심으로 광의 의 수리분류학이 차지하는 범위를 전통 분류학과 대비시켜 본 것이 다. 앞에서 논의된 내용을 생각하며 그림 설명을 참조하기 바란다. 광의의 수리분류학은 분류학의 방법론에서 중요한 의미를 갖는 다. 그림 13.1 에 표시된 전통분류학, 표현론, 분지론의 대치관계는 분류학 이론에 주안점을 두어 분류 이론을 분류한 결과이다. 분류 방법에 관심을 가진다면 이제 〈전통분류학〉과 〈광의의 수리분류학〉 으로 나누어야만 한다. 이 둘은 방법론적으로 서로 대치되는 개념 이다. 전통 분류학은 경험적 지식에 의존한다. 따라서 주관적이라 는 비판을 받는다. 광의의 수리분류학은 정량적 방법에 의존한다. 객관적이라고 주장되어짐은 물론이다. 자연에는 질서가 있고 자연 과학자는 이 질서를 있는 그대로 찾으려 한다. 자연의 질서를 찾기
三경험久 방법
로 수리 적 방법 을 이용하 고 있음 은 매우 홍미있는 사 실 이다. 표현론 분 지론이 이론적 출발점 은 다 르 지만, 수리적 방법 을 사용한다는 의미에서 이 둘 을 합쳐 광의의 수리분류학으로 그립에서처럼 분류해 보았다. 광의 의 수리분류학은 Sokal 과 Cam i n(l965) 이 의미했던 운영분류학 (運 營 分 類學 , op e rati on al t axonom y)에 대응될 수 있겠다. 그러나 Sokal 과 Cam i n 은 광의의 수리분류학이 분지론과 가지는 관계 를 철저히 규명하지 않은 채 수리적 과정 을 거치는 모든 방법론을 운영 분류학으로 암시하였 다 (물론 그 당시만 해도 분지론이 완전히 정착된 시기는 아니지만). 전 통분류학과 광의의 수리분류학을 방법론적인 측면에서만 생각한다면 전 통분류학은 경험적이고 따라서 주관적이며, 수리분류학은 수리적이고 그 러므로 객관적이라고 주장된다. 그러나 수리분류학이 수리적 과정 때문 에 반복성을 가지며 이런 반복성 때문에 객관적이라고 주장되고 있음에 대하여는 본문에서 제시되는 몇몇 관접에 의해 논박이 행해질 것이다. 위하여는 객관적 방법론이 사용되어야 한다고 한다. 자연에 질서가 존재한다는 절대적 명제가 있으므로 인위적으로 자연의 질서가 창 조될 수 없기 때문이다. 분류학자의 입장에서 보면, 자연에 종이 실재하고 우리는 이 종을 발견하려 하는 것이다. 종을 발견하려는 문제 역시 자연과학 방법론의 원칙에 의해 해결하려면 객관적 방법 을 선택해야만 한다. 죽 분류의 방법이 객관적이어야 한다. 지금까 지 토의한 분류학의 방법론을 이러한 관점에서 보면 두 가지 문제 로 압축된다. 전통분류학에서 근간으로 하는 경험적 지식은 주관적 일 뿐이고 객관성을 가 질 수는 없는가? 수리적 방법에 의한 것은 그러면 객관적인가? 의 문제이다. 이 두 가지 문제 를 오직 자연과학의 방법론이라는 측면에서만 논 하는 것은 이 책의 범위에서 벗어난다. 단순히 분류학이라는 특별 한 경우에서 방법론이 어떻게 적용될 것인가를 생각해 보자. 우리 가 가진 분류학에 관한 지식에만 의존하여 분류의 방법 , 특히 수리 분류학의 방법에 비판을 가할 수 있는 가능성이 이렇게 주어전다면 가장 중요한 비판은 수리분류학에서 전개한 수리적 과정에 관한 이 론이 과연 타당하겠는가일 것이다. 죽 형질의 선택, 형질상태의 측 정, 유사도산출, 극성 결정등의 정량화 과정에 대한 이론이 타당하 게 구성되었는가이다. 이 문제가 가장 중요한 이유는 수리적 과정 에 대한 이론이 타당할 경우에는 계산 과정에서의 오차는 있을 수 없는 것이므로 이 방법을 받아들여야만 할 것이기 때문이다.
단순히 방법이 수리적이라고 반복성이 있고 반 복성 이 있으면 객 관적이라고는 말해질 수 없다. 따라서 분류과정에 대한 수리적 이 론이 겁토되어야 한다. 수리적 이론이 검토되기 위해서는 광의의 수리분류학이 포함하는 분류의 이론이 검토되어야 한다. 수리적 과 정이란 바로 분류이론의 전개과정이기 때문이다. 수리적 방법의 타 당성을 논하는 것은 이렇게 분류이론의 타당성을 논하는 문제로 다 시 돌아간다고 볼 수 있다. 지금까지 이 책에서 다루어 온 문제들 은 바로 독자로 하여금 각 분류이론들이 가지는 의미가 무엇인가를 이해시키고자 한 것이었으므로 이 책을 통하여 이제 여러 분류이론 의 타당성에 대한 견해를 각자가 정립할 수 있으리라 믿는다. 필자 의 견해를 마지막 장인 제 13.3 장에서 피력하였다. 우리는 분류학자로서 분류의 방법론 중 하나롤 선택하거나 전체 를 종합해야 하는 입장에 놓여 있다. 그러나 이는 매우 어려운 일 이다. 왜냐하면 우리는 어쩌면 너무나 알려지지 않은 진화라는 생 물의 역사적 사실에 감히 접근하려 하고 있기 때문이다. 어떤 분류 의 방향을 선택해야 하며, 또한 실제로 어떻게 분류를 수행할 것인 가에 대한 결정이 어려움은 바로 절대적 사실이 있음에도 불구하고 이를 증명하지 못하는 안타까움 때문일 것이다. 이제 이책을, 수리 분류학이 우리 분류학자들에게 어떤 미래를 주고 있는가에 대한 의 견만이라도 제시하고 끝마치려 한다. 13.3 수리분류학의 분류학에서의 역할 Snea t h 와 Sokal 은 그들의 저서 『수리분류학』의 결론에서 (제 10 장) 수리분류학의 분류학에 대한 공헌 가능성을 제시하고 있는 바, 이를 요약하면 다음과 같다. 〈수리분류학은, 새로운 분류적 가설을 설정하고 이를 검정하는데 큰 도움을 주며, 또한 분류의 전반에 관한 일반적 정보를 일목요연 하게 제공해 준다. 뿐만 아니라, 규모가 작은 분류군이라도 이를 검출할 수 있게 하며, 특히 논란이 되고 있는 분류군에 명확한 한
계를 설정해 준다. 이러한 효과는, 특히 박테리아 등의 미세생물 을 대상으로 했을 때 뚜렷이 나타난다. 표현군의 변이의 한계 를 정확 히 구분하므로 지리적 차이에 따른 변종이나 아종 등의 구분을 명 확히 해주며, 이러한 결과들은 유전적 지식에도 도움을 준다. 그러 나 무엇보다도 중요한 것은 과학적 방법론을 분류학적 측면에서 개 선한 것이다.〉 협의의 개념에서의 수리분류학적 접근은 1960 년 이후 많은 분류 군을 대 상으로 시 도되 어 왔으며 , Snea t h 와 Sokal (19 73) 은 이 러 한 결과를 일목요연하게 그들의 저서에서 부록 (Ap pe ndix I , 제 457-480 쪽)으로 소개하고 있다. 물론 이 책에서도 수리분류학의 방 법론을 소개하면서 간단한 예를 중심으로 수리적 분류들의 결과를 제 8,9,10, 11 장들의 마지막 부분에 삽입한 바 있다. 수리분류학적 방법의 지금까지의 광범위한 이용은 이제 수리 분류학의 분류학 내 에서의 위치를 확고히 해주었고, 수리분류학적 방법은 앞에서 논의 된 많은 문제점에도 불구하고 계속 사용될 것이다. 수리분류학적 방법의 빈번한 이용에도 불구하고 제 12 장에서 언 급한 바와 같이 수리분류학이 한계점을 가지고 있는 것만은 틀림없 는 사실이다. 수리분류학이 가지는 한계점을 이론적으로 개선하는 것은 거의 불가능하다. 수리분류학자들 역시, 최종적으로는 수리적 분류뿐만이 아니라 다른 방법 역시 한계점을 가지고 있다고 지적함 으로써 수리분류학이 가지는 한계를 탈피하고 있을 뿐이다. 예를 들어, Sokal 과 Cam i n(1965) 은 분류란 바로 어떤 일정한 목적 하 에서 수행되어야 하며, 목적에 따라 방법론이 다를 수 있음을 표명 하고 있다. S i m p son(1961) 이 비록 표현론적 분류를 〈얕고 불완전 하다 (shallow and i ncom p le t e) 〉고 표현하였지만, 분지론이나 심지 어 전통분류학이라도 이를 각각 분리하여 생각하면 마찬가지의 논 리가 성립될 수밖에 없다고 본 것이다. 분류학에서의 중요한 문제 는 수리분류학자들의 주장에 따르면 목적의 이중성에 있다고 할 수 있다. 계통의 체계를 알아내는 것이 어쩌면 실제로 분류를 행하는 일, 생물을 자연의 질서에 끼워맞추는 일보다 덜 중요할지도 모른 다고 수리분류학자는 주장한 것이다. 전통분류학자는 분류의 결과 가 진화 과정을 찰 반영하지 못하면 의미가 없다고 주장하나, 수리
분류학자는 분류학의 이중 목적이 분리될 수 있고 분리되어야만 한 다고 주장한다. 1985 년 10 월에 전남대학교에서 개최되었던 생물과학협회 심포지 움에서 서울대학교 동물학과의 김훈수 교수는 분류학의 중요성을 역설하면서 〈생물의 분류가 수행되지 않은 상태에서 어떻게 생리나 생태의 연구를 수행하겠는가 〉 고 반문하였다. 이를 바로 분류학자들 이 어떤 〈 안정된 〉 분류 체계를 원하는 것이라고 해석한다면, 지금 까지 소개한 수리분류학적 방법은 오히려 이 안정성을 추구하며 분 류의 실제를 수월하게 하는 장점을 지니고 있음을 인정치 않을 수 가 없다. May r 역시 일찌기 『 생물학적 사상의 전개 』 라는 저서를 비롯한 수많은 논문에서 수리분류학의 단점을 신랄하게 비판하였지 만, 근년에 발표한 「생물학적 분류」 (May r, 1981) 라는 논문에서 「서로 다른 방법론의 종합을 향하여」라는 부제까지를 달며 각 방법 이 가지는 장점을 분리하여 인정하자고 하였다. 분류학에의 접근은 여러 방향에서 시도된다. 1986 년 12 월에 전남 대학교 생물학 연구소에 의해 「한국산 동식물의 분류학적 연구와 그 전망」이라는 제목으로 전주에서 개최된 심포지움에서, 현재 한 국의 대표적 분류학자라 할 수 있는 이병훈 교수나 이인규 교수 등 은 단순히 그들이 연구하는 대상 생물의 차이에서 기인되었다고 설 명하기에는 부족할 정도로 상당한 분류학적 견해의 차이룰 나타내 었다 ((생물학연구년보 ) , 1986 참조). 이병훈 교수는, 분지론에 입 각한 논리의 전개에 근거를 두어, 새로운 형질의 도입이나 객관성 의 도입에 의한 분류군의 인지로부터 계통에 접근할 수 있다고 보 았다. 이에 비해 이인규 교수는 분류학의 방법론을 실험분류학에 기초를 두어 종의 개념을 정립함으로써 계통의 문제보다 더욱 시급 한 문제인 생물학의 방향정립 (그는 이를 생명철학이라고 표현함) 에 분류학이 공현해야 한다고 주장한 것이다. 분류학을 기초과학에 서 종합과학으로 이전시켜야 한다고 까지 한 그의 주장은 일면 분 류학의 확대해석이라는 위험을 안고 있긴 하나, 분류학의 새로운 접근 가능성을 보여주는 좋은 예임에는 틀림 없다. 이러한 예들은 바로 분류학이 그 목적하는 바에 따라 방법을 달리할 수 있음을 보여 주고 있으며 수리분류학 역시 이러한 관점에서 이해되어야만
한다고 생각한다. Ma y r(l981) 는 그의 은퇴 이후까지도 계속되는 오랜 경험을 통 하여 다음과 같이 그의 의견을 요약하고 있다. 〈최근 표현론적, 분 지론적, 진화론적 분류 중 어떤 방법론이 가장 생물 분류학에 적합 한가에 대한 논쟁이 고조되고 있다. 분류란 여러 단계의 과정에 의 해 이루어지므로 위의 세 방법의 가장 적절한 부분들이 각 단계에 서 사용되어야 한다. 이러한 종합적인 접근에 의해서만이 좀 더 일 반성에 부합되고 정보 저장이나 계통의 재정립 기준에 부합되는 분 류가 수립될 수 있다.〉 Ma y r 의 이러한 표현은 바로 수리분류학이 태동한 이후 이 방법론이 이제 수용되는 시점에 와 있음을 뜻한다 고도 할 수 있다. 그러나 수리분류학의 이론에 대한 의견은 계속 제시되고 있다. 필자 역시 수리분류학을 정리하는 의미에서 수리분 류학에 대한 입장을 다음과 같이 표시하고자 한다. 13.4 나는 수리분류학을 옹호하는가 생물학은 크게 두 가지 방향에서 생명현상을 밝히려는 목적에 접 근하고 있다. 하나는, 분자생물학이나 유전학까지롤 포함하는 넓은 의미에서의 생리학이나 발생학 등 기능적 관점에서 생명 현상에 접 근하는 방향으로 분석적인 방법을 사용하며 다른 하나는 분류학, 행동학, 생태학 등 종합적인 면에서 생명 현상에 접근하는 방향으 로 기재의 방법울 주로 사용한다. May r( 1982, 제 76 쪽)는 두 개 의 생물학을 ` 소개하고 있는 바, 그 하나를 기능 생물학 (fun cti on al b i olo gy)이라 칭하였고, 이의 특칭을 미시적 문제를 해 결하는 것이라 하였으며, 다론 하나는 진화생물학 (evoluti on ary b i olo gy)으로서 거시적 문제를 해결하는 것이라 하였다. 물론 Ma y r 에 의한 이러한 분류가 타당한가도 논의가 되어야 하겠지만, 생물학의 특징은 이 둘을 완전히 분리시켜 생각할 수 없는데 있다. 죽 기능적인 관점이라 하더라도 종합적인 해석을 요하는 것이 생물 학의 특칭이라 할 수 있다. 생명 현상은 물리 또는 화학 이론 같은
분석적인 방법에 의해서만은 밝히기 어려운 생명체로서의 종합 기 능을 가진다. 종합 기능을 나타내는 단위가 생명체이며, 생명체는 시간에 따라서 환경과의 반응에서 유전자 조합을 달리하므로 역사 성을 가지게 되고 각 생명체는 이러한 시간의 흐름과 함께 하여 다 양성을 나타내게 된다. 그러므로 생물학을 기능적인 관점과 종합적 인 관점에서 추구하고 있지만, 기능적인 관점이라 할지라도 종합적 인 관점이 필요하게 되고 이때의 종합적 관점은 〈 전화의 해석〉이라 고 표현할 수 있다. 만일 우리가 일단 생물학의 총체적인 관접을 이렇게 진화의 해석으로 표현한다면, 생물학의 각 분야는 진화의 해석이라는 관점에서 연구되고 결과가 해석되어야 할 것이다. 위의 의견에 우리가 만일 수긍한다면, 이 책에서 지금까지 우리 가 취급한 분류학 역시 전화의 해석이라는 관점을 벗어날 수가 없 다. 따라서 수리 분류학이라는 방법론에 대해서도 이 방법론이 분 류학의 목적에 부합되는가, 또 넓게는 이 방법론이 생물학이 가지 는 목적에 부합되도록 타당하게 수립되었는가가 논의의 대상이 되 어야 한다. 죽 좁은 의미에서는 우선 분류의 방법론과 이 방법론에 의한 결과가 분류학이 목적하는 바에 어느 정도 적합한가를 고찰해 야 하겠지만, 넓게는 분류학이 진화의 해석에 이바지하는 데 있어 분류학 방법론이 얼마나 공헌할 것인가를 고찰해야 할 것이다. 이 러한 관점에서 보면 수리분류학은 넓은 의미의 생물학의 목적에 부 합되는가의 문제에 대한 명확한 해답을 주고 있지 못함이 확실하 다. 그렇다면 수리분류학은 지금까지 우리가 가지고 있는 생물학적 관습에 의해서는 받아들이기 어려운 분야라고 생각한다. 아마도 전 화의 해석에 대한 수리분류학이 가지는 불명확성을 지적하는 것이 이 책의 중요 목적 중의 하나였는지도 모른다. 수리분류학은 그러나 수리분류학자가 주장하고 있듯이, 분류학의 목적 중 분류롤 수행한다는 관점에서는 완벽한 결과를 제시하고 있 다. 분류학자의 입장에서 보면 이 역시 매우 중요한 결과이다. 이 제 막 분류학을 시작하여 초기 단계에 있는 분류학자나 오랜 경험 울 가진 분류의 전문가나 모두가 매일 매일의 분류의 행위에서 부 딪히는 최초의 문제는 대상 생물을 종 수준에서 종류에 따라 분류 하는 작업의 어려움이다. 수리분류학은 위에서 제기된 문제점에도
불구하고 바로 이 분류의 작업을 좀더 수월하게, 또 좀더 객관적으 로 행하는 데 큰 도움을 주고 있는 것이다. 이제 〈나는 수리분류학을 옹호하는가〉에 대해 대답할 시접에 와 있다고 생각한다. 위에서 수리분류학의 한계나 가능성에 대한 필자 의 의견을 요약하였다. 위의 의견에 대하여도 독자에 의해 많은 비 판이 가해지겠으나, 일단 수리분류학의 능력에 대한 필자의 이러한 의견을 독자가 수긍할 수 있으리라고는 생각한다. 다시 말하면, 〈수리분류학은 분류를 수행하는 능력은 갖추고 있지만 분류의 결과 로부터 분류군간의 관계에 대한 해석을 진화적 관점에서 유도하지 는 못한다〉는 것을 인정할 수 있다고 본다. 그렇게 보면 이제 수리 분류학을 종을 인지해내는 방법으로 받아들이기는 어렵다. 수리분 류학이 비록 분류를 수행하는 빠르고 편리한 수리적 방법을 제공하 긴 하지만 수리적 분류에 의해 유도된 분류군이 〈자연종〉의 개념에 는 부합되지 않는다. 수리적 분류에 의해 유도된 분류군인 표현군 은 자연종과 그 범위가 일치하기 어렵기 때문이다. 분류의 결과가 이렇게 자연종과 일치되지 못하면 종을 인지해내려는 분류의 첫째 과정부터 실패하는 결과가 되었다고 할 수밖에 없다. 이러한 상태 에서 종과 종간의 관계를 진화적 관점에서 해석하려는 것은 더욱 불가능한 일이다. 따라서 수리분류학을 생물종을 인지하고 종간의 관계를 진화적 관점에서 해석하는데 이용하는것은 매우 어렵다고 보아야 한다. 지금까지 필자는 수리분류학을 이해하기 위해 많은 노력을 하였 지만 〈수리분류학을 옹호하는가〉의 질문에 〈수리분류학을 옹호하지 않는다〉라고 대답할 수밖에 없다. 오랜 역사를 가진 분류학의 전통 을 거역하기는 어렵기 때문인지도 모른다. 수리분류학은 수리분류 학자들이 스스로 언급한 바와 갇이 〈분류 목적의 이중성〉이 성립할 때에만 쓰여져야 한다고 생각한다. 만일 우리가 수리적 방법들을 분류를 수행하는 목적에만 국한시켜 사용한다면 이 방법을 거철할 이유를 찾기는 힘들 것이다. 수리 분류학이 가지는 장정 때문에 오 늘날 수리 분류학적 방법은 자연과학 및 사회과학의 분류를 필요로 하는 많은 부분에서 광범위하게 이용되고 있다. 생물 분류학에서 수리분류학을 사용할 경우에는 완전히 수리분류학적 방법에 의한
결과에 의존하여 결론을 내리기보다는 전통분류학의 결과를 검증하 고 확인하는 참고자료로 사용하는 것이 적절할 것이다. 수리적 분 류는 복잡한 자료로부터 빠르게 경향을 파악하게 해주므로, 박데리 아와 같이 전통적 방법에 의존하여서는 기재하기 어려운 형질들을 많이 소유하는 생물들에 있어서 그 분류의 윤곽을 빠르게 제시해 줄 수 있다고 본다. 결국 수리분류학은 이룰 사용하는 분류학자 스 스로가 수리분류학에 대한 정확한 지식을 가지고 각 경우에 따른 사용여부를 판단하여야만 올바르게 이용될 수 있을 것이다.
【참고문현】 고흥선 (1986) 「한국산 설치류의 계통 분류학적 연구 : II . 문경산 흰 넓 적 다리 붉은쥐 A p odem 露 pen in s ulae pen in s ulae Thomas 의 영 색 체 분석 및 문경 산 등줄쥐 Ap od emt tS aga ri ttS coreae 와의 형 태 적 비교 분석」(영문), (한국 동물 분류 학회지) 2(1) ; 1-10. 김영환 (1983) 「한국 조간대 해조류 군집의 생태학적 연구」, 서울대 이 학박사 학위 논문. 김훈수, 이창언, 노분조 (19 82) 『 동물 분류학 』 , 집현사, 502p p. 오계칠 (1987) 「서울근교 자연생 소나무립에 대한 ordin a ti on 방법의 적 용」, (한국 식물학회지) 10(2) ; 63-80. 유성오 (1980) 「한국산 부추속의 유연관계에 관한 연구」, 원광대 이학 박사 학위 논문. 이병훈 (1985) 「혹무늬 톡토기과의 형질 평가 및 형질 비평가방법에 의 한 ci ad i sm 분석」(영문), (한국 동물 분류 학회지) 1(1-2) ; 3-20. 이병훈 (1985) 「계통 분류학의 역할과 문제―특히 한국의 경우―」 (분 류학 회보) 2 ; 5-8. 이병훈 (1986) 「한국산 동물의 계통 분류학적 연구과제」, (생물학 연구 연보) (전북대학교) 7(2) ; 75-86. 이상태 (1980) 「 S t ebb i ns 자료에 의한 · 원시, 피자 식물과들의 수리적 분 계 관계」 (식물 분류 학회지), 10(1, 2) ; 1-5. 이상태 (1984) 「한국산 개나리속 식물의 계통분류학적 연구」 (식물 분 류 학회 지 ), 14 (2) ; 87-107. 이상태, 박은자 (1982) 「한국산 물푸레나무과의 분계적 분석」 (식물 분 류 학회 지 ), 25 (2) ; 57-64. 이인규 (1986) 「한국산 식물의 계통 분류학적 연구과제」 (생물학 연구 연보), (전북대학교) 7(2) ; 87-96. 정영호, 정영철 (1982) 「한국산 비비추속의 분류학적 연구」, 『 서울대 자연대 논문집 』 , 7(1) ; 87-122. 정영호, 최홍근, 서계홍, 신현철 (1987) 「한국산 마름속 식물 열매의 수리분류학적 연구」 (식물 분류 학회지), 17(1 ) ; 45-54
Beckner, M. (1959) The Bi ol og ica l Way of Thoug ht. C olumbia Univ e rsit y Press, New York. 200p p. Bray, J.R . and J:T . Curti s (19 57) An ordin a ti on of the up la nd for est communit ies of north e rn W isc onsin . Ecol. M onog r. 27 ; 325-349. Cain , A.J. and G.A . Harris o n (1960) Phy le ti c weig h ti ng . Proc. Zool. 16 ; 85-98. Cracraft , J. (19 67) Comments on homolog y and analog y. Sys t . Zool. 16 ; 355-359. Cracraft , J. (19 74) Phy lo g e neti c models and classif ica ti on . Sys t. Zool. 23 ; 71-90. Cronq u is t , A. (19 68) The Evoluti on and Classif ica ti on of Floweri ng Plants . Houg h to n-M ifflin Comp a ny, Bosto n , 396p p. Crowson, R.A . (1970) C/a .ssijica ti on and Bi ol og y. Hein e man Educati on al Books, London, 350p p. Dice , L.R . (1945) Measures of the amount of ecolog ic assoc iat i on betw een sp ec ie s . Ecolog y 26 ; 297-302. Dunn, G. and B.S. Everit t (1982) An Intr o duc tion to Math e mati ca l Taxonomy . Cambrid g e Univ e rsit y Press, Cambrid g e . Farris, J.S . (1970) Meth o ds for comp u ti ng Wagn e r tre es. Sys t . Zool. 1 9 ; 83-92. Farris, JS . (1980) The inf o r mati on conte n t of the ph y lo g e nic sys te m . Sys t . Zool. 28 ; 483-519. Felsenste i n , J. (1983) Numeri ca l Taxonomy . Sp ri n g e r Verl. Berlin , Heid e l-berg, New York, Toky o . 644p p. Funk, V.A. (1983) The value of natu ral classif ica ti on . In Numeri ca l Taxonomy , pp. 18-21, ed. by J. Felsenste i n , Sp r in g e r Verlag, Berlin , Heid e lberg, New York. 644p p. Funk, V.A. and D.R . Brooks (1981) Theory and ap plica ti on of cladis t i c and meth o dolog y. Sys t . Zool. 30 ; 491-498. Gil m our, J.S .L. (1951) The develop m ent of tax onomi c the ory sin c e 1851 . Natu r e 168 ; 400-402. Goodall, D.W . (1954) Obje c ti ve meth o ds for the classif ica ti on of veg e ta - tion . Ecology 48 ; 793-806. Goodall, D.W. (1966) A new sim i lar ity ind ex based on pr obabil ity. Bio m etr ics 22 ; 882-907. Grant, V. (1963) The Or igin of Adapt ation and Evoluti on . Columbia
Univ e rsit y Pres s, New Yo rk . Grant, V . (1981) Plant Sp ec ia t i on . Columbia Univ e rsit y Press, New York. 563p p. Hennig , W. (1950) Grundziig e ein e r Theor ie der Phyl o g e neti sch en Sys t e m ati k. Deuts c her Zentr a l Verlag, Berlin . 370p p. Hennig , W. (1966) Phy lo g e neti c Sys t e m ati cs. Univ e rsit y of Illin o is Press, Urbana, Chic a g o , London, 263p p. Huxley, J.S . (1940) The New Sys t e m ati cs. Clarendon Press, Oxfo rd . 583p p. Jac obson, T.D. (1979) Numeric a l analys is of varia t i on betw een Alliu m cernuum and Alliu m ste l latu m (L iliac eae). Taxon 28(5/6) ; 517 -523. Jar din , N. and R. Sib s on (1971) Math e mati ca l Taxonomy . Joh n W iley , London. Jen sen, R.J. ( 1983) A pr acti ca l vie w of numeric a l tax onomy or Should I be a ph eneti st or a cladis t . In Numeri ca l Taxonomy , pp. 53-71, ed. by J. Felsenste i n , Sp r in g e r Verlag, Berlin , Heid e lberg, New York. 644p p. Joh nes, S .B. and A.E. Luchsin g e r (1986) Plant Sys t e m ati cs. McGraw-Hi ll Book Comp a ny. 512p p. Joh nson, L.A .S . (1970) Rain b ow's end : The qu est for an op tim al tax -onomy . Sys t . Zool. 19 ; 203-239. Kershaw, K.A . (1964) Qu anti tative and Dy n ami c Plant Ecology . Edward Arnold, London. 168p p. Klovan, J.E . (1975) R-and Q- mode fac to r analys i s . In Concept s in Geosta t i cs, pp. 21-69, ed. by R.B . McCammon, Sp r in g e -veraly, Heid e lberg, New York. 168p p. Klug e , A. G. and J.S . Farris (1969) Qu anti tat i ve ph y le ti cs and the evolu- tion of anurns. Sys t . Zoo!. 18 ; 1-32. May r, E. (1965) Numeric a l ph eneti cs and tax onomi c the ory . Sys t . Zool. 14 ; 73-97. May r, E. (1969) Prin c ip le s of Sys t e m ati c Zoology . McGraw-Hi ll, New York. 428p p. May r, E. (1981) Bio l og ica l classif ica ti on : Toward a syn th e sis of op po s- ing meth o dolog ies . Scie n ce 214 ; 510-516. May r, E . (1982) The Gr ow t h of Bi ol og ica l Thoug ht. Harvard Univ e rsit y Press, Cambrid g e , Massachusett s. 974p p. Mayr , E., E .G . Lins ley and R.L . Usin g e r. (1953) Meth o ds and Pr inc i ple s of
Beckner, M. (1959) The Bio l og ica l Way of Though t. Columbia Univ e rsit y Press, New York. 200p p. Bray, J.R . and J.T . Curtis (1957) An ordin a ti on of the up la nd for est communit ies of north e rn Wi sc onsin . E col. Monog r. 27 ; 325-349. Cain , A.J. and G.A . Harris o n (1960) Phy le ti c weig h ti ng . Proc. Zool. 16 ; 85-98. Cracraft , J. (1967) Comments on homolog y and analog y. Sys t . Zool. 1 6 ; 355-359. Cracraft , ]. (1974) Phy lo g e neti c models and classif ica ti on . Sys t . Zool. 23 ; 71-90. Cronq u is t , A. (1968) The Evoluti on and Classif ica ti on of Floweri ng Plants . Houg h to n -Mi fflin Comp a ny, Bosto n , 396p p. Crowson, R.A . (1970) Classif icat i on and Bio l og y. Hein e man Educati on al Books, London, 350p p. Dic e, L.R. (1945) Measures of the amount of ecolog ic assoc iat i on betw een spe cie s . Ecology 26 ; 297-302. Dunn, G. and B.S. Everit t (1982) An Intr o ducti on to Math e mati ca l Taxonomy . Cambrid g e Univ e rsit y Press, Cambrid g e . Farris, ].S. (1970) Meth o ds for comp u ti ng Wag ne r tre es. S ys t . Zool. 1 9 ; 83-92. Farris, J.S . (1980) The inf o r mati on conte n t of the ph y lo g e nic sys te m . Sys t . Zoo!. 28 ; 483-519. Felsenste i n , J. (1983) Numeri ca l Taxonomy . Sp ring e r Ver!. Berlin , Heid e l-berg, New York, Toky o. 644p p. Funk, V.A. (1983) The value of natu r al classif ica ti on . In Numeri ca l Taxonomy , pp. 18- 21 , ed. by J. Felsenste i n , Sp r in g e r Verlag, Berlin , Heid e lberg, New York. 644p p. Funk, V.A. and D.R . Brooks (1981) Theory and ap plica ti on of cladis t i c and meth o dolog y. Sys t . Zoo!. 3 0 ; 491-498. Gil m our, J.S .L. (1951) The develop m ent of tax onomi c the ory sin c e 1851 . Natu r e 168 ; 400-402. Goodall, D.W. (1954) Obje c ti ve meth o ds for the classif ica ti on of veg e ta - tion . E cology 48 ; 793-806. Goodall, D.W. (1966) A new sim i lar ity ind ex based on pro babil ity. Grant, VB.i o m( 1e9t6r3 i)c s T2h2 e; 8O8r2 i-g9i0n7 .o f Adapt ation and Evoluti on . Columbia
Univ e rsit y Pres s, Ne w Yo rk . Grant, V . (1981) Plant Sp e ci at i on . Columbia Univ e rsit y Press, New York. 563p p. Hennig , W. (1950) Gnmdzii ge ein e r Theor ie der Phy lo g e neti scl zen Sys t e m ati k. Deuts c her Zentr a l Verlag, Berlin . 370p p. Hennig , W. (1966) Phy lo g e neti c Sys t e m ati cs. Univ e rsit y of Illin o is Press, Urbana, Chic a g o , London, 263p p. Huxley, J.S . (1940) The New Sys t e m ati cs. Clarendon Press, Oxfo r d. 583p p. Jac obson, T.D. (1979) Numeric a l analys is of varia t i on betw een Alliu m cernuum and Alliu m ste l latu m (L iliac eae). Taxon 28(5/6) ; 517 -523. Jar din , N. and R. Sib s on (1971) Math e mati ca l Taxonomy . Joh n W iley , London. Jen sen, R.J. (1983) A pr acti ca l vie w of numeric a l tax onomy or Should I be a ph eneti st or a cladis t . In Nume_ri c a l Taxonomy , pp. 53-71, ed. by J. Felsenste i n , Sp r in g e r Verlag , Berlin , Heid e lberg, New York. 644p p. Joh nes, S.B. and A.E. Luchsin g e r (1986) Plant Sys t e m ati cs. McGraw-Hi ll Book Comp a ny . 512p p. Joh nson, L.A .S. (1970) Rain b ow's end : The qu est for an op tima l tax -onomy . Sys t . Zoo/. 19 ; 203-239. Kershaw, K.A . (1964) Qu anti tative and Dy n ami c Plant Ecology . Edward Arnold, London. 168p p. Klovan, J.E . (1975) R-and Q- mode fac to r analys i s . In Concept s in Geosta t i cs, pp. 21-69, ed. by R.B . McCammon, Sp r in g e -veraly, Heid e lberg, New York. 168p p. Klug e , A.G. and J.S . Farris (1969) Qu anti tat i ve ph y le ti cs and the evolu- tion of anurns. Sys t . Zool. 1 8 ; 1-32. May r, E. (1965) Numeric a l ph eneti cs and tax onomi c the ory . Sys t . Z oo/. 14 ; 73-97. May r, E. (1969) Prin c iple s of Sys t e m ati c Zoology . McGraw-Hi ll, New York. 428p p. May r, E. (1981) Bi ol og ica l classif ica ti on : Toward a syn th e sis of op po s- ing meth o dolog ies . Sc ien ce 214 ; 510-516. Mayr , E. (1982) The Growt h of Bio l og ica l Thoug h t. Harvard Univ e rsit y Press, Cambrid g e , Massachusett s. 974p p. May r, E., E .G. Lins ley and R.L . Usin g e r. (1953) Meth o ds and Pr inc ip le s of
Sys t e m atic Zoology . McGraw-Hi ll Book Comp a ny , New York. 336p p. McNeil l, J. (1984) Taxim etr i c s tod ay . In Cu rrent Con cept s in Plant Ta. xo nomy , pp. 281-299, ed. by U. H. Hey w ood and D. M. Moore, Academi c Press. Mi ch ener, C.D. and R.R . Sokal (1957) A qu anti tat i ve app r oach to a pro blem in classif ica ti on . Evoluti on 11 ; 130-162. Mi. ill er-Dombois , C.D. and H. Ellenberg (1974) Ai ni s and Meth o ds of Vege ta tion Ecology . W iley Int. 547p p. Pie l ou, E.C . (1984) The in te r p re ta tion of Ecolog ica l data . Joh n W ile y & Sons. 263p p. Remane, A., V. Sto rch and U. Welsch (1978) Evoluti on , 4th Aufl . dtv Gmbh, Mi .inc hen. 255p p. Rog e rs, D.J. and T.T. Tanim oto (1960) A comp u te r pro g ram for clas• sif ying pla nts . Sdence 132 ; 1115-1118. Sim p so n, G.G. (1961) Pr inc ip le s of Anim al Ta. xo nomy . Columbia Univ e r-sit y Press, New York. 247p p. Sneath , P.H.A. (1957) The ap pli c a ti on of comp u te r s to tax onomy . ]. Gen. Mi cr obio l . 17 ; 201-226. Sneath , P.H .A . (1962) The constr u cti on of tax onomi c grou p s . In Mi cr obia l Classif ica ti on s, pp. 289-332, ed. by Ai ns wort h and Sneath , Cambrid g e Univ e rsit y Press. 483p p. Sneath , P.H.A. (1983) Phil o sop h y and meth o d in bio l og ica l classif ica - tion . In Numeri ca l Ta. xo nomy , pp. 22-37, ed. by J. Felsenste i n , Sp ring e r Verlag, Berlin , Heid e lberg, New York. 644p p. Sneath , P.H .A . and R.R. Sokal (1973) Nu meri ca l Ta .xo nomy . W.H. Free-man and Comp a ny, San Francis c o. 573p p. Sokal, R.R . and J.H . Cami n (1965) The tw o tax onomi es : areas and confl ict. Sys t . Zool. 14 ; 176- 19 5. Sokal, R.R. and P.H.A. Sneath (1963) Pr inc ip l e s of Nume ri ca l Ta .xo n omy . W. H. Freeman and Comp a ny , San Franc isc o. 359p p. Ste i n h ausen, D. and K. Lang e r (1977) Cluste r analyse . Ei n /ilh rung in Meth o den und Ver fahr en der Auto m atis c hen Klassif ika ti on . Walte r de Gruy ter , Berlin - New York. 206p p. Thursto n , L.L. (1947) Mult ip l e Facto r Analys is . Univ . Chic a g o Press, Chic a g o and London. 535p p. Whit tak er, R.H . (1982) Or di n a ti on of Plant Communit ies. Dr. W . Jun k
Publis h ers, The Hag u e, Bosto n , London. 388p p. W ile y , E.O. and K. R. Pop pe r (1975) Sy st e m ati cs and classif ica ti on : a rep ly to Walte r Bock and oth e r evoluti on ary tax onomi st . Sys t . Zoo!. 25 ; 233-243. W ile y, E.O. (1981) Phy lo g e neti cs. The Theory and Practi ce of Phy lo g e neti c Sys t e m ati cs. Joh n W iley & Sons. 439p p.
[찾아보기] 찾아보기는 가나다순 찾아보기와 중요술어를 중심으로 이들 술어와 관 계된 술어를 찾을 수 있는 찾아보기 및 영문술어에 대한 찾아보기의 세 가지로 구분하였다. (가나다순 찾아보기의 색인숫자 중 명조체는 해당 술어가 설명된 페이지를 나타낸 것임) ► 찾아보기 I : 가나다순 찾아보기
기 가계 (家系, lin e ag e ) 28 가설적 분류군(假說的 分類群, hyp o th e ti ca l tax on) 183 가설적 속성 (假說的 周性) 144, 145, 156, 160-162 가설적 형질(假說的 形質) 155, 162 가중치 (加 重 値, weig h t) 84, 85 가중평균결합(加爾平均結合, weig h te d averag e link ag e ) 112 간접등급분석 (間接等級分析, in- dir e ct grad ie n t analys is ) 129 개체군 분류학(個體群 分類學, po p u lati on sys te m ati cs) 21 거 리 지 수 (距離指數, dis t a n ce ind ex) 92, 131-139, 182-185 검 색 표 (檢索表, key ) 16, 43 계 수 (係數, coeff icien t) 92 계수(階數, rank) 142, 146 계층구조(階円構造, hie r archy ) 15, 27 계층법 (階用法, hie r archic meth o d) 106 계통(系統, ph y lo g e ny ) 13, 56,
I70 계통분류학(系統分類學, sys te m ati cs) 11, 12-14 계 통수 (系統樹, ph y lo g e neti c tre e) 49, 178, 191 계통적 관계 (系統的 關係, ph y lo g en eti c relati on ship ) 47, 48, 49, 53, 54, 57 계통적 자연성 (系統的 自然性, ph y lo g e neti c natu ralness) 39 계통 체계학(系統 體系學, ph y lo g e neti c sy s te m ati cs ) 13, 51, 53 계 통학 (系統學, ph y lo g en eti cs) 12, 13, 51, 200, 202 고유벡터 (eig e n vect or ) 150 고유치 (固有値, eig e nvalue) 149, I5 I, 154 공동성 (共同性, communalit y) 148, 160 공동조상(共同祖上, common an- ceste r ) 21, 22, 52, 69, 175, I8o, I8I 관계 (the sta t e of bein g relate d , kin s hip , consang uini t y, aff in-
ity) 46 광의 (廣義) 의 수리 분류학 206 -2II 구조적 형 질 (構造的 形質) 65 극성 (極性, po larity ) 201, 211 근연성(近緣性) 66 기능생 물학(機能生物學, fun c- tion al bio l og y) 215 기능적 형질(機能的 形質) 65 기술통계학(記述統計學, descrip - tive sta t i sti cs) 87, 131, 141, 기재 1rn9c7 if& , descrip tion ) 204, 217 C 다계동군(多系統群, po lyp h y le ti c grou p ) 171-172 다배열군(多配列群, po lyt he ti c grou p ) 43, 44, 45 다배열성 (多配列性, po lyt he ti c) 43, 44, 45 다형성 (多型成, po lyt ypic) 42 단계통군(單系統群, monop h y le ti c grou p ) 171-175, 188, 190, 200 단배열군(單配列群, monoth e ti c grou p ) 43, 44 단배 열성 (單配列性, monoth e ti c) 43, 44, 45 단위 형 질 (單位形質, unit charac- ter ) 65, 78, 79 단일결합(單一結合, sin g le !in- kag e ) 109, 110 단형성 (單型成, monoty pic) 42 딸종 (daug h te r spe c ies ) 170 동소(同所) 35 동시기 종분화(同時期 種分化, syn chronic sp e c iat i on ) 33, 34 동일지역 종분화(同一地域 種分
化, sy m p a tr i c sp e cia ti on ) 35 동정(同定, ide nti fica ti on ) 11, 14 등급분석 (等級分析, grad ie n t analys i s ) 127,128, 129 □ 명명 (命名, nomenclatu r e) 15 모개 체 군 (母個體群) 34 닌 배 열 (配列, ordin a ti on ) 125, 129, I30 배열법 (配列法, ordin a ti on meth o d) 87, 105, 125-129, 130, 140, 155 변형 계 열 (嬰形系列, tra nsfo r ma- tion serie s ) 176 보편성의 수준(普迫性의 水準, level of univ e rsality ) 171, I73 부모종(父毋種 pa renta l spe c ies ) 170 부계 적 유사성 (父系的 類似性, pa tr i s t i c sim i lar ity ) 66, 68 부계적 형질 (父系的 形質) 67, I74 분계 (分系) 50 분류 (分類, classif ica ti on ) 11, 14, 18-24, 36 분류군(分類群, tax on) 15, 24, 36-39, 42, 43, 49, 80, 172 분류의 원칙 23, 36 분류적 관계 (分類的 關係, tax -
onomi c relati on ship ) 46, 47 -50 분류적 등급(分類的 等級, tax onomi c rank) ll8, 121 분류적 범주(分類的 範'옵, tax -onomi c cate g o ry) 15, 16, 27, 60 분류적 형 질(分類的 形質,t ax anomi c characte r ) 60, 6x-62, 78, x97, 200, 204 분류학 (分類學, tax onomy , sys - tem ati cs) xx , 12, 29, 30, 35, 4x, 42 분산(分散, varia n ce) 151, x52 분석 단계 (分析段階, analyt ica l sta g e ) 15 분지도(分枝圖, cladog ram ) 189, x90, I9I . 분지 등급 (分枝等級, clades) 53 분지론(分枝論, cladis t i cs) 2x, 50-54, x69, 170, x73, x77, 2ox, 203, 207-2xo, 213 분지 론적 관계 (分枝論的 關係) 47 분지 분석 (分枝分析, cladis t i c analys i s ) 178, x90, x9x, 200, 205 분지 주의 (分枝主義, cladis m ) 52 분지학(分枝學) 50 분포적 형 질 (分布的 形質) 64 분화법 (分化法, div i s i v e meth o d) 106 비가중 평균결합(非加龜平均結合, unweig h t e d pa i r gr oup meth od usin g arith m eth ic averag e s, UPGMA) 111, x98 비 상동성 (非相ffil t:l:, homop la sy) 67 비유사도(非類似度, dis s im i la rity ) 94 바중(比龜 weig h t} 84 人 산술평균결합(算術平均結合,
arit hm eth ic averag e link ag e ) 109, 111 상관 (相賊 ph y si o g no my ) 128 상관계수(相觀係數, correlati on coeff ica nt) 45, 93, 139, 151, 159 상동기관(相同器管) 65, 67 상 동 성 (相 同 性, homolog y) 57, 67, 69, 173-176, 195, 201 상사기 관 (相似器官) 67 상사성 (相似性, analog y) 67 상위분류군(上位分顔群) 169, 174 생리적 형질(生理的 形質) 63 생물분류학(生物分類學) 2I 생 물학적 종 (生物學的 種) 27, 28 -30 생태적 형질(生態的 形質) 63 생 활사 단계 (生活史 段階, sema- ph oront) 80 속성 (周性, att rib u te ) 62, 88, 143 -145, 153, 157-160 수령 성 (收敏性, converge nce) 68, 69, 172 수령진화(收敏進化) 194, 195 수리분류학(數理分類學, numeri - cal tax onomy ) 16, 17, 21, 22, 39, 41, 53, 73-75, 87, 2·08 , 210 수지도(樹枝圖 dendrog ram ) 104, l18 수학분류학 (數學分類學, math e - mati ca l tax onomy ) 17, 209 식 물사회 학(植物社合學, pla nt socio l og y) 126 식 생 (植生, veg e ta t i on ) 125 등급분석 (等級分析, grad ie n t analys is ) 126-127 식 생 의 분류 (植生의 分類) 128 -140
。 연 (聯 for mati on ) 128 완전 경 합 (完全結合, comp le te lin- kage ) 109, 110 외부군(外部群, out- grou p ) 175, 176, 177, 190 요인 (要固 fac to r) 142 요인기록값(要因記錄값, fac to r score)167 요인부하행 렬 (要因負荷行 °-?I J, fac - to r loadin g matr i x ) 156 요인부하값(要因負荷값, fac to r odadin g ) 166 요인분석 (要因分析, fac to r analy- sis ) 140, 141, 142-145, 155, 162 운영분류단위 (運營分類單位, op e rati on al ta xonomi c unit ) 79-80, 81, 82, 103-108, 143, 154, 169, 198, 199 운영분류학 (運營分類學, op e ra- tion al ta xonomy ) 210 원거리 형질(遠距離 形質, ap o morph ic charac ter ) 172 원시조상군(原始祖上群) 181 원시조상(原始祖上) 179, 180, 182 원시형 (原始型) 179 원시 형 질 (原始形質, pr im i tive characte r ) 53, 68, 172, 173 -181 유사도 (類似腦J, sim i la rity ) 92, 125, 130, 170, 197, 198, 2ll 유사성 (類似性, sim i la rity ) 45, 46, 49, 50, 66, 67-72, 172-181 유사지 수 (類似指數, sim i la rit y ind ex) 92, 93, 97-103, 126, 131, 137, 138, 198 유사지수행 렬 (類似指갭ikfrlj 1 J, sim i - larity matr i x ) 101, 131
유연관계 (類緣關係) 47, 48 유전형 (迫傳型, ge noty pe ) 31, 79 유집 (類集) 105 이 명 법 (二 命 法, bio m i al nomen- clatu r e) 20 이소(異所) 35 이 시 기 종(異時期種, allochronic spe ci es ) 32 인위분류(人爲分類) 41 인위분류군(人爲分類群) 42 인위적 (人爲的) 38 인위적 배열(人爲的 配列) 41 일반성 (一般性) 41, 46 일반적 배열 (一般的 配:j l l) 41 일차결합(一次結合, line ar combi- nati on ) 146 일차독립 (一次獨立, line ar in- dep e ndent) 146, 152 일차종속(一次從 00, line ar dep e n-dent) 146, 151 A 자료행 렬 (査料行 ~I J, data matr i x ) 89, 143 자매 군 (姉妹群, sis t e r gro up ) 175 자연분류 ( 自 然分類, natu ral clas- sif ica ti on ) 37, 41 자연분류군(自然分類群, natu ral tax on) 36, 37, 40, 42, 45, 49, 75, 86 자연선택 ( 自 然選擇, natu ral selec- tion ) 20, 31, 32 자연성 (自然性) 36, 39, 40, 41, 43, 46, 47, 49, 50, 54, 85 자연적 (自然的) 37, 38 자 연 종 ( 自 然 種, natu ral spe cie s ) 38, 217 자연 체 계 ( 自 然體 系, natu ral sys -
ter n) 37 전유사성 (全類似性, overall sim i - larity ) 40, 54, 55, 77, 86, 194, 205 전통적 분류 (傳統的 分類) 200 전통분류학 (傳統分類學) 48, 49, 74, 192, 198, 203, 205, 206, 209, 219, 213, 217 전형태 (全形態, holomorph , tot a l for m) 81 정 량분류학 (定量分類學, qu anti ta- tive tax onomy ) 209 정 량자료(定 批貸料 , qu anti tat i ve data ) 90 정 성 자료 (定性査料, qu ali tat i ve data ) 89, 96, 97 조 (m, assoc iat i on ) 128 조상종(祖上種) 172, 173 조상형 (祖上型) 21, 95, 97 조상형 질 (祖上形質) 172, 190 조 합 계 수 (組合係 數, assoc iat i on coeff ici e n t) 95, 96-101 종(種, spe ci es ) 25-30, 32, 35, 49 종분화 (種分化, spe c i at i on ) 30, 32, 34, 35, 55 종분류학(種分類學, bio s ys - tem ati cs) 21 종차 (種差, dif fere nti a) 30 종합단계 (綜合段階) 15 주성 분분석 (主成分分析, pr in c iple comp o nent analys i s ) 147, 148-151, 162, 165, 168 중심 분석 (中心分析, centr o id meth o d) 147 중앙결합(中央結合, media n meth o d) 113 지리적 고립 (地理的 孤立) 34, 35 지리적 형질(地理的 形質) 64 직접등급분석 (直接等級分析,
dir e ct grad ie n t analys i s ) 129 진화(進化, evoluti on ) 31, 46, 50, 57, 171 진화단위 (進化單位) 29, 30 전화등급 (進化 等級, gra des) 53 진화분류학(進化分類學, evolu- tion ary tax onomy ) 20, 49, 200, 203 진화적 관계 (進化的 關係) 38, 48 -50 진화적 종 (進化的 種) 27,28, 29 집 괴 (集城 cluste r ) 105 집 괴 법 (集魂法, cluste r i ng meth o d) 104, 125 집 괴 분석 (集魂分析, cluste r analy- sis ) 87, 98, 105, 106, 107, 125, 126, 141, 166 집 적 법 (集積法, agg lo merati ve meth o d) 106 天 천 이 종 (遷移種, successio n al . spe c i es ) 32 첨가적 종분화(添加的 種分化, addit ive spe c i at i on ) 33 체 계 학 (體系學, sys t e m ati cs) 12, 14, 200 최 단거 리 법 (最短距離法, nearest neig h bour tec hniq u e) 110 최대거리법 (最大距離法, farthe st neig h bour tec hniq u e) 111 최대 법 (最大法, maxim um meth o d) 111 최대분산법 (最大分散法, varim a :l! meth o d) 159 최 소법 (最小法, mi ni m u m meth o d) 110 측계 통군 (側系統群, pa rap h y le ti< grou p ) 171, 172
분지 분지도 I89, I90, I 분지등급 53 분지론 21, 50-54, 169, 170, 173, 177, 201, 203, 207-210, 213 분지론적 관계 47 분지론적 분류 200 분지분석 178, 190, 191, 200, 205 분지주의 52 분지학 50 상동성 비 상동성 67 상동기관 65, 67 상동성 57, 67, 69, 173-176, 195, 20I 상사기관 67 상사성 67 요인분석 요인 142 요인기록값 167 요인부하행렬 156 요인부하값 166 요인분석 140, 142-145, 155, 162 유사도 부계적 유사성 66 비 유사도 94 유사도 92, 125, 130, 170, 197, 198, 211 유사성 45, 46, 49, 50, 66-72, 75, 172-181 전유사성 40, 54, 55, 77, 86, 194, 205 표현론적 유사성 71 후기 적 유사성 66, 68
자료 자료행렬 89, I43 정량자료 90 정성자료 89, 96, 97 자연성 계통적 자연성 39 자연분류 37, 4I 자연분류군 36, 37, 40, 42-45, 49, 75, 86 자연선택 20, 3I, 32 자연성 36, 39, 40, 41, 43, 46, 47, 49, 50, 54, 85 자연종 38, 2I7 자연체계 37 표현론적 자연성 39 조상 공동조상 21, 22, 52, 69, 175, 180, 181 원시조상군 181 원시조상 179, 180, 182 원시형 179 원시 형 질 53, 68, 172-181 조상종 172, 173 조상형 21, 95, 97 조상형 질 172, 190 후손 29, 30 후손종 170-173 후손형질 172 종
딸 종 170 부모종 170 생 물학적 종 27, 28-30 이시기종 32 자연종 38, 217 조상종 172, 173 종 25-30, 32, 35, 49종분화 30, 32, 34, 55 종분류학 2I 종차 30 전화적 종 27, 28, 29 천이종 32 파생종 I72 후손종 I70, I7I, I73 종분화 계통분화 I92 계통적 종분화 33 동시기 종분화 33, 34 동일지역 종분화 35 종분화 30, 32, 34, 35, 55 첨가적 종분화 33 타지역 종분화 34, 35 지수 거리지수 92, 131-139, 181-185 유사지수 92, 93, 97-103, 126, 131, 137, 138, 198 유사지수행 렬 101, 131 진화 진화 31, 46, 50, 57, 171 진화단위 29, 30 진화등급 53 전화분류학 20, 49, 200, 203 진화적 관계 38, 48-50 진화적 종 27, 28, 29 집괴 집괴 IO5 집 괴 분석 8:7 , 98, 105, 106, 107, 125, m6, I4I, I66 체계학 계통체계학 13, 51, 53 체계학 12, 14, 200
표현론 표현군 II9, I20, I94, I98, 2I2, 2Ii 표현도 II8 표현론 39, 54, 55, 169, 173, 174 I94, 20I-2IO 표현론적 분류 196, 200-202, 213 표현론적 유사성 7I 표현론적 자연성 9 표현형 형질 가설적 형질 155, 162 구조적 형질 65 기능적 형질 65 단위형질 65, 78, 79 부계적 형질 174 분류적 형 질 60-72, 78, 197, 200 204 분포적 형질 64 생리적 형질 63 생태적 형질 63 원거리 형질 172 원시 형 질 53, 68, 172-181 조상형질 172, 190 지리적 형질 64 파생 형 질 53, 68, 69, 172-178, 190 201 필수형질 203 행동학적 형질 64 형질 31, 39, 43, 55, 60-62, 76-7B 143, 172 형 질 비 평 가방법 99, 19p - 191 형 질상태 61, 179-183, 188-190 형 질평 가방법 190, 191 형태적 형질 55, 63 후손형질 172
► 찾아보기 3 : 영어 술어 찾아보기 Aris t o t e l ean Natu r alness 아리스 토텔레스적 자연성 39 New Sy s te m ati cs 신 분류학 30 a po ste r io r i 귀 납적 30 a prior i 연역적 30 acci de nt 우연성 27 addit ive spe cia t i on 첨 가적 종분 화 33 ag glo merati ve meth o d 집 적 법 106 allochronic spe ci es for mati on 이 시기 종형성 32 allop a tr i c sp e ci at i on 타 지 역 종 분화 34 analog y 상사성 67 analyt ica l sta g e 분석 단계 15 ap o morp h ic characte r 원 거 리 형 질 172 arith me ti c averag e link ag e 산술 평균결합 109 assoc iat i on 조 128 assoc iat i on coeff icien t 조합계 수 95 att rib u te , pro p e rty 속성 88 averag e link ag e 평균결합 109 bin o mi al nomenclatu re 이 명 법 20 bio s yt em ati cs 생물분류학 21 cate g o ry 범 주 15 cente r of orig in 기 원중심 176 centr o id meth o d 중심 결합 109 centr o id meth o d 중심 분석 147 characte r 형 질 61 characte r sta t e 형 질상태 61
characte r unweig h te d ap pr oach 형질비평가방법 190 characte r weig h te d ap pr oach 형 질평가방법 190 charact er , fea tu r e, att ri b u te , pro p - erty 특칭, 속성 62 clades 분지 등급 53 cladis m 분지주의 52 cladis t i c analys is 분지분석 178 cladis t i cs 분지 론, 분지 학, 분지 계통학 14, 21, 50, 169 cladog r am 분지도 189 class 강 16 classif ica ti on 분류 ll cluste r 집 괴 105 cluste r analys is 집 괴 분석 87 cluste r in g meth o d 집 괴 법 104 coeff icien t 계 수 92 column 열 89 communalit y 공동성 148 comp le te lin k ag e 완전결합 109, 110 converge nce 수령 성 68 correlati on coeff ici e n t 상관계수 93 covaria n ce 공분산 151 data matr i x 자료행 렬 89 daug h te r spe cie s 딸종 170 defo r mati on 변형 160 dendrog ram 수지 도 II 8 deriv e d characte r 파생 형 질 172 deriv e d ; advanced ; ap o morph ic characte r 파생 형 질 190 descrip tion 기술 17
descrip tive sta t i st i cs 가 술동계 학 87 dia g no sti c 식 별 60 dia g o nal 대 각 I dif fer enti a 종자 26 dir e ct gr adie n t analys is 직 접 등급 분석 I29 dis s im i la rit y 비 유사도 94 dis t a n ce coeff ici e n t 거 리 계 수 94 dis t a n ce ind ex 거 리 지 수 92 div i s i v e meth o d 분화법 106 eig e nvalue 고유치 149 essence 필소요건 26, 39 evoluti on ary bio l og y 진화생 물학 215 evoluti on ary tax onomy 진화분류 학 20, 49 fac to r 요인 142 fac to r analys i s 요인분석 140 fac to r loadin g 요인부하 166 fac to r loadin g matr i x 요 인 부 하 행렬 156 fac to r score 요인기록 167 fam i ly 과 16 far th e st neig h bor te,c h niq u e 최 대 거리법 III fea tu r e 특징 & for m 형 128 for mati on 연 128 frac tur e 균열 I60 fun cti on al bolog y 기 능 생 물 학 2I5 fun damenta l unit 기 본단위 82 gen ealog y 혈통 39 ge noty pe 유전형 ge nus 속 I6 grad es 전화등급 53 grad ie n t analys i s 등급분석 127
hie r achy 계충구조 15 hie r archic meth o d 계층법 106 his t o r ic a l grou p 역사적군 I holomorph 전형태 81 homolog y 상동성 67 homop la sti c sim i lar it y 후 기 적 유사성 66 homop la sy 비 상동성 67 hyp o th e ti ca l tax on (H.T) 가설적 분류군 183 ide nti fica ti on 동정 I I ide nti ty (of the spe cie s ) (종 의 ) 동일성 49 ind ir e ct grad ie n t analys is 간접 등 급분석 129 key 검색표 I6 kin g d om 계 I6 kin s hip , consang u in i t y, aff ini t y 혈연관계 47 level of univ e rsali ty 보편성 의 수준 I lin e ag e 가계 28 line ar combin a ti on 따결합 146 line ar ind ep en dent 1 차독립 I46 log o s 학 50 math e mati ca l tax onomy 수 학분 류학 17, 209 maxim um meth o d 최 대 법 111 media n meth o d 중앙결합 109 mi ni m um meth o d 최소법 IIO monop h y le ti c grou p 단개 체 군 170 monoth e ti c 단배 열성 43 monoth e ti c grou p 단배 열군 43 monoty pic 단형 성 42 multi di m ensio n al ordin a ti on 다 축배열 ·1 30 natu r al classif ica ti on 자연분류 37
natu r al selecti on 자연선덱 P natu r al spe ci es 자연종 38 natu ral sys t e m 자연체 계 37 natu r al tax on 자연분류군 37 nearest neig h bour tec hniq u e 최 단 거리법 IIO nomenclatu r e 명 명 I 5 nomos 법 II numeric a l classif ica ti on 수리 적 면ti 2r I7 numeric a l sys te m ati cs 수 리 체 계 nume학ri c a l tax onomy 수리 분류학 I6 obje c t 대상 88 ope rati on al tax onomi c unit 운영 분류단위 79 op e rati on al tax onomy 운 영 분 류 학 210 order 목 16 ordin a ti on 배 열 87, 105, 125 ordin a ti on al meth o d 배 열법 155 out- grou p 의부군 175 overal sim i la rity 전유사성 54, 193 pa leote m p e ratu r e 고기 온 160 pa ralleli sm 평 행 성 68 pa rap h y le ti c gr oup 측 개 통 군 171 pa renta l spe ci es 부모종 170 pa rt ris t i c sim i la rit y 부계 적 유사 성 66 pa tt er n 유형 105 ph eneti c relati on ship 표현론적 관계 54 ph eneti cs 표현론 55 ph enog ram 표현도 u 8 ph enon 표현군 ll9
ph enoty pe 표현 형 3 1 ph y le ti c spe cia t i on 계 통적 종분 화 33 ph y lo g e neti c natu r alness 계 통 적 자연성 39 ph y lo g e neti c sys te m ati cs 계 통체 계학 13 ph y lo g e neti cs 계 동학 13 ph y lo g e ny 계통 13 ph y lu m 문 16 ph y si o g no my 상관 128 ple sio m orph ic characte r 근거 리 형질 172 po lyp h y le ti c gro up 다개 체 군 171 po lyt he ti c 다배 열 성 43 po lyt ypic 다형 성 42 po p u lati on 개 체 군 21 po p u lati on sys te m ati cs 개 체 군 분류학 21 pr im i tive charac ter 원시 형 질 172 pr im i tive ; ancestr a l ; ple sio m or- ph ic characte r 조상형 질 190 pr in c iple comp o nent analys is 주 성분 분석 147 pro p e rty 속성 62 qu anti tat i ve tax onomy 정 량분류 학 209 rank 계수, 등급 118, 142 row 행 89 semap h oront 생 활사 단계 8o set, class 조 15 sim i lar ity 유사성 14 sim i lar ity ind ex 유사지 수 92 sim i lar ity ind ex matr i x 유사지 수 행렬 IOI sin g le link ag e 단일결합 109,
110 sis t e r gr oup 자매군 175 spe cie s 종 16, 25 spe c i m en 표본 sta n dardiz a ti on 표준화 91, 198 subset 부속조 44 successio n al spe c i es 천이 종 32 sym p a tr i c spe cia t i on 동일지 역 종분화 35 syn chronic spe c i at i on 동시 기 종 분화 33 syn th e ti c sta g e 종합단계 15 sys t e m a 체 계 I I sys t e m ati cs 분류학 II, 계통분류 학 12, 체계학 14 tax is 배열 II tax ometr i c s 정 량분류학 209 tax on 분류군 15 tax onomi c characte r 분류적 형 질 60 tax onomi c relati on ship 분류적
관계 46 tax onomy 분류학 11 the to s 배열 43 to ta l for m, holomorph 전 형 태 81 tra nsfo r mati on 전이 91 tra nsfo r mati on serie s 변 형 계 열 I76 unid i m ensio n al ordin a ti on 일 축 배열 I30 unit characte r 단위 형 질 78 unweig h te d averag e link ag e 비 가중 평균결합 I09 varia n ce 분산 I 5 I varim ax meth o d 최 대 분 산 법 I59 veg e ta t i on 식 생 I 2 5 weig h t 평 가, 비 중, 가중치 84 weig h te d averag e link ag e 가 중 평균결합 I09 weig h ti ng 평가 9I
고철환 제주도 출 생 서울대 학 교 문리과대학 식물학과 졸업 독일 킬대학교 이학박사 ( 해양생물학) 현재는 서울대학교 자연대학 해양학과 교수 주요 논문 「동해안 오호리지역 해조류 군집에 관한 연구」 외 다수 수리분류학 대• 우학술총서 • 자연과학 52 찍은날 __. ― -1988 년 I 월 15 일 펴 낸날 -—_-19 88 년 며 l 30 일 ■ 지은이-고철환 펴낸이-朴孟浩 펴 낸곳 __. ―一 民音社 ■ 출판등록 19 66. 5· 19 제 I·I42 호 우편대체계좌번호 OIOO4I·3I·523282 IIo 서울 종로구 관철동 44·I 734 자 234•6IIO( 편집부) 734·2 0 00·2IOI, 735 · 8524( 영 업부) ■ 값 4,800 원 파본은 바꾸어 드립니다. ©1988, 고철환 자연 과학, 생 뭉학 • KOC/472 • 02
대우학술총서 • 자연과학 I 소립자와 게이지상호작용 金鎭義 著 / 값 4, 800 원 2 動力學特論 封隸훗값 5,400 원 3 질소고정 宋承達 著 / 값 2, 800 원 4 相轉移와 臨界現 象김두철著 / 값 2,800 원 5 觸媒作用 陳宗植 著 / 값 2, 800 원 6 뫼스바우어分光學 王恒南著 / 값 2,800 원 7 극미량원소의 영양 昇正子著 / 값 6,500 원 8 水素 1 t W 素와 有機視素化合 物 尹能民 著 / 값 5, 000 원 9 抗生物質의 全合成 姜錫久 著 / 값 9, 000 원 lO 국소적 형태의 A ti y ah - S i n g er 지표이론 지동표著 / ~U, 800 원 11 Muc cip ol y sa cc har i des 의 生化學및生物理學 박쫑쭙값 3,800 원 12 ASTROPHYSICS ( 天體物理學) 洪承桐著 / 값 4,700 원 l3 프로스타글란딘 합성 金登표著 / 값 3,600 원 14 천연물화학연구법 禹源植著 / 값 7 , 000 원 IS 脂防營養 金淑喜 著 / 값 6, 300 원 16 結晶化유리 金炳息 著 / 값 4, 500 원 17 高分子의 化學反應 趙義煥 著 / 값 4, 000 원 18 과학혁명 金永植著 / 값 4,200 원 19 韓國地質論 章基弘 著 / 값 4, 000 원 20 정보이론 혼병열 著 / 값4,5 00 원 21 原子核反應論 鄭雲赫著 / 값 8,500 원 22 破壤力學 金相哲 著 / 값 4,700 원 23 분자궤도이론 이익춘著 / 값 3, 300 원 24 반응속도론 정경훈著 / 값 4,000 원 25 미분위상수학 李鉉求 골 / 값 2, 5 00 원 26 자기공명방법 조성호 畜 / 값 4 , 800 원 27 풀라스마물리학과 핵융합 최덕인 홀 / 값 4,8 00 원 28 천문관측과 분석 李時雨 쿨 / 값 4, 800 원 29 석탄에너지 변환 기술 金相敦 졸 / 값 6 , 500 원 30 海洋微古生物學 白光浩 꿀 / 값 6, 4 00 원 31 편마분방정식론 김종식著 / 값 4 , 000 원 32 大統-理論 소광섭 著 / 값 5, 0 00 원 33 金 屬電 子系의 多體理論 金 德 洲 暑 / 값 6, 6 00 원 쏴 액정중합체 陳政 - 著 / 값 6 , 200 원 35 복합재료 權肅仁著 값 5 , 200 원 36 단백질 생합성 朴仁源 著 / 값 9, 000 원 37 한국의鑛物種 金차 H I 값 7,000 원 38 일반상대론 李哲勳 著 값 5 , 000 원 39 레이저광산란분광학 金鍾 鎭 풀 / 값 5, 00 0 원 40 복소다양체론 金相文 풀 / 값 7, 000 원 41 역학적 연구방법 金 船 舜 훌 값 4 , 200 원 42 핵구조물리학 민동길 정 값 5, 300 원 43 후리에해석과 의미분 작용소 김 도 한 풀값 5, 8 00 원 44 한국의 古生物 李河榮 著 / 값 9 ,000 원 45 질량분석학 감명수 著 값 6,8 00 원 46 급변론 백서현풀 값 5,0 00 원 4 7 생체에너지 朱忠魯 若 값 8,5 0 0 원 4 8 리이만기하학 박을용 봅 W 6 ,000 원 49 群表現論 朴勝安 告/ 값 6 . 200 원 50 바 선형 편미분 방 정식 론 하기 식 著 / 값 6,000 원 51生 體膜 김 형 만 著 / 값 8 , 000 원