**** 몇 년전 블로그를 운영할 때 올렸던 글이라 일부 내용이 현재와의 상황과는 다를 수 있습니다. 하지만 SCI 에 대한 고민이 여전히 계속되고 있는 상황이고 보니 이곳에 다시 한 번 더 올려 봅니다. ****
최근 몇 년 사이에 우리 나라 대학과 관련된 언론 보도에서 자주 등장하는 단어가 SCI(Science Citation Index) 입니다. 그리고 “SCI 급 저널”이니 “SCI 급 논문”이니 하는 외국에서는 찾아 보기 힘든 말들도 들리구요. 학부생으로서 “SCI 급 저널”에 논문을 발표한 학생들이 화제의 대상으로 신문에 보도가 되기도 합니다. 대학마다 교수들이 “SCI 급 저널”에 발표한 논문의 수를 경쟁적으로 자랑하면서 그것을 통해 자신들의 대학이 우수한 대학임을 자랑합니다. 그리고 여기에서 더 나아가 저널의 피인용 지수(Impact Factor)를 따져서 일정한 피인용 지수 이상의 지수를 가진 ‘영향력 있는’ 저널에 논문을 싣도록 연구진을 압박하고 있고 그 인용 지수를 이용해서 보너스를 주기도 합니다. 바야흐로 SCI 와 IF 는 우리 나라 대학과 연구자들의 학문 성과를 판단하는 표준처럼 쓰이고 있는 듯 합니다.
그러다 보니 국내에서 출판되는 저널들은 SCI 에 실리기 위해 다각도로 노력을 하고 있고 심지어 어떻게 하면 SCI 에 실린 학술지(SCI 등재지)가 될 수 있는가에 대한 연구 논문도 나오고 “SCI 논문 쓰기” 워크숍과 같은 행사도 벌어지는 것이지요. 그렇다면 과연 이렇게 우리 나라에서 전성 시대를 맞이하고 있는 SCI 란 무엇인지 그리고 SCI 에 목을 매고 있는 현재 우리의 상황이 적절한 것인지 한 번 생각해 볼까 합니다.
흔히 SCI 라고 말하는 이 단어는 Science Citation Index(과학 인용 색인)의 줄임말입니다. 매 년 여러 차례 발행되는 이 색인에는 그 해 과학계의 저널에 실린 논문들이 나열되고 있고 각 논문들이 어디에서 인용되었는지를 알려주는 정보가 같이 들어 있습니다. 먼저 아래의 화면을 살펴보십시오.

위의 화면은 인쇄되어 책으로 발간된 SCI 의 한 부분인데요. 이 기록이 알려주는 것은 ANSARI A 라는 저자가 1988 년에 AM J GASTROENTEROL 이라는 저널의 제 50 권(volume), 456 페이지에 발표한 논문이 1997 년에 ANDERSSO, A 라는 사람이 AMER SURG 라는 저널의 제 42 권, 173 페이지에 발표한 논문에서 인용되었다는 정보입니다. 그리고 역시 같은 논문이 REDDI K K 라는 사람이 1997년 P NAS US 라는 저널의 제 73 권 2308 페이지에 발표한 논문에도 인용이 되었다는 사실도 알 수 있습니다. 그 다음 줄은 ANSARI A 씨가 역시 1988 년에 S MED J 라는 저널의 제 61 권, 858 페이지에 발표한 논문이 1997년에 WAYNE KS 라는 사람이 AM R RESP D 라는 저널의 제 114 권, 15페이지에 발표한 논문에도 인용이 되었다는 정보도 있습니다.
이와 같은 SCI 가 처음 만들어진 것은 1961년이었고 SCI의 탄생 뒤에는 유진 가필더(Eugene Garfield, 1925-)라는 천재적인 과학자가 있습니다. 계량서지학(Bibliometrics) 의 창시자 중 한 사람으로 이야기 되고 있는 가필더 씨는 컬럼비아 대학에서 화학을 전공했습니다. 대학을 졸업한 후 그는 화학 실험실에서 일을 하다가 몇 차례의 폭발 사고를 겪은 후 이 일이 자신과는 맞지 않다고 생각을 하게 되었고 진로를 수정합니다. 그 과정에서 가필더 씨는 화학 관련 각 종 문헌 정보들을 검색하고 정리하는 일도 직업이 될 수 있을 것이라는 생각을 하게 되었고 마침 존스 홉킨스 대학 의학 도서관에서 의료 정보 색인을 만드는 프로젝트에 참가 하게 됩니다. 그 프로젝트는 Index Medicus 로 이어지고 현재의 Medline 이라는 거대한 의학 관련 정보 데이터 베이스로 이어지게 되지요.
이 프로젝트에 참가하면서 가필더 씨는 정보를 정리, 조직하고 또 쉽게 찾을 수 있게 만드는 일에 흥미를 가지게 됩니다. 그리고 그러한 흥미는 당시 알려지기 시작한, 기계를 이용한 정보 처리에 대한 관심으로 이어지게 되었고 과학 관련 문헌 정보를 기계적으로 정리하는 방법에 대한 심포지움을 조직하기도 했습니다. 이 심포지움이 계기가 되어 가필더씨는 당시까지 존재하던 유일한 인용 색인인 Shepard’s Citations 를 접하게 됩니다.
Shepard’s Citations 는 1873년에 처음 만들어진 판례 인용 색인으로서 미국 내에서 이루어진 모든 재판과 그 재판에서 인용된 판례에 관한 정보를 담고 있는 자료였습니다. 판례가 중시되는 미국 법조계에서 이 색인은 필수불가결한 존재였지요. 가필더 씨는 법조계에서 사용되는 Shepard’s Citations 와 유사한 색인을 과학 관련 문헌들을 대상으로 만들어 볼 생각을 하게 되었습니다. 그는 색인에 대한 자신의 아이디어를 당시 재학 중이던 컬럼비아 대학의 도서관학과 석사 논문으로 발표하였고 1955년에는 “Citation Indexes for Science; A New Dimension in Documentation through Association of Ideas” 라는 제목의 논문으로 Science 지 에 발표하였습니다.
이 논문에서 가필더씨가 이야기한 것은 과학 문헌을 위한 문헌 정리 시스템이었는데요, 이 시스템을 통해 무비판적으로 과거의 문헌들을 인용함으로써 나타나는 단점을 극복하고자 하였습니다. 즉, 그의 목적은 이 전에 나온 다른 문헌들에 있을 수 있는 부정확하고 불완전한 정보들을 쉽게 파악할 수 있는 시스템을 만드는 것이었습니다.
예를 들어 제가 논문을 쓰면서 다른 사람의 글을 인용하려 한다고 가정해 보지요. 그런데 제가 인용하려는 그 글이 어떤 평가를 받았는지, 그 글에서 실린 자료들이 과연 정확한지 어떻게 확인할 수 있을까요? 만일 다른 사람들 역시 그 글을 인용하였고 그 글에 대한 비평을 한 것이 있으면 저는 그 비평들을 통해 제가 인용하려는 글에 실린 자료들을 간접적으로 나마 평가할 수 있을 것입니다. 그런데 이 작업은 결국 제가 인용하려는 그 글을 인용한 다른 글들을 모두 찾아 보아야 가능한 일입니다. 다른 글이 얼마나 되는지 그리고 그것들이 어디에서 출판이 되었는지 파악하는 일은 연구자로서는 매우 하기 힘든 작업이지요.
가필더 씨가 인용 색인에 대한 이러한 아이디어를 낼 그 당시까지는 이러한 인용 색인이 존재하지 않았다고 합니다. 당시까지 존재하던 것은 주제별 논저 목록과 같은 것으로서 위와 같은 경우 저는 제가 인용하려는 그 글의 주제를 짐작한 후 그 주제와 관련된 논저 목록을 구해 그 중에서 제가 인용하려는 글이 인용되었음직한 논저를 찾고 그 논저들 속에서 다시 그 글이 실제 인용이 되었는지 살펴보는 방법을 취할 수 있습니다. 그런데 ‘주제’라는 것은 목록을 만드는 사람의 생각에 따라 상당히 주관적인 것입니다.
물론 그렇다고 그런 주제별 논저 목록이 불필요하다는 것은 아니지만 제가 생각하는 특정 논문의 ‘주제’와 논저 목록을 만든 사람이 생각하는 주제가 다를 수도 있는 일이지요. 그래서 가필더 씨는 좀더 객관적인 방식으로 만들어진 목록을 원했고 그것은 인용 색인에 대한 아이디어로 이어지게 되었습니다. 이것을 통해 연구자들은 자신이 인용하려는 자료에 대한 평가가 실려있는 다른 자료들을 손쉽게 찾아 볼 수 있게 되었습니다. 그래서 훨씬 더 정확한 자료들을 인용할 수 있게 되는 것이지요.
위의 그림에서 예를 든 것 처럼 특정 논문을 인용한 다른 논문들에 대한 정보를 쉽게 찾아 볼 수 있으니 막대한 양의 논저 목록을 다 찾아 헤매야 하는 시간과 노력을 절약할 수 있게 된 것입니다. 그리고 원래 이 색인이 만들어진 목적과는 별개로 기대하지 않았던 수확을 얻을 수도 있었는데요. 예를 들면 이 색인을 통해 전혀 생각하지 않았던 주제 간에 만들어진 연결 고리를 찾을 수도 있었습니다. 예를 들면 한 연구자가 관심을 가진 생물학 논문이 공학에서도 인용이 되었고 그 공학 논문을 찾아 보니 공학자들은 같은 자료에 대해 생물학자들이 관심을 가진 것과는 전혀 다른 방식으로 접근을 했고 결국 그것이 그 연구자에게 새로운 아이디어를 주어 연구를 진행하는데 도움이 되었다 하는 식이지요. 이런 우연한 연결 고리의 발견은 과거의 주제별 논저 목록에서는 전혀 불가능했던 일이지요. 그래서 가필더 씨는 자신의 색인을 “association-of-ideas index”라고 부르기도 했습니다.
이 논문에서 제시된 아이디어를 바탕으로 가장 먼저 만들어진 것이 유전학 관련 논저들을 모은 Genetics Citation Index 였고 그것은 곧이어 Science Citation Index 로 이어집니다. 이 과정에서 가필더씨는 이 색인을 만들어 내는 회사, ISI(Institute for Scientific Information)를 설립했지요. 그리고 지난 1992년에 ISI 는 세계적인 정보 처리 회사인 Thomson Reuters 에 합병이 되었고 2008년부터는 Thomson Scientific 이라는 이름으로 계속해서 활동을 하고 있습니다. Institute for Scientific Information 이라는 이름때문에 종종 이 회사가 마치 하나의 정부 연구 기관이나 공공 기관처럼 생각하시는 분들도 계십니다만 영리를 목적으로 한 회사라는 점을 잊지 말았으면 좋겠습니다.
SCI 가 위에서 설명한 것과 같은 이유에서 시작된 도구라면 “피인용지수(IF, Impact Factor)”는 무엇일까요? 피인용 지수에 관한 내용은 이미 1955년에 발표된 가필드 씨의 논문에서 언급되었지만 이것이 본격적으로 일반에 알려지게 된 것은 1974년부터 JCR(Journal Citation Report)이라는 출판물이 나오고 부터였습니다. 이 곳에서 각 학술지의 피인용지수를 공개하면서 부터였지요. 그런데 처음으로 인용 지수가 도입된 것은 SCI 에 수록될 저널들을 선택하는 과정에서 필요했기 때문이었습니다.
1960년 초반 SCI 를 준비하면서 그 곳에 수록될 저널들을 선정하는 과정에서 가필더씨는 일단 절대적인 인용 횟수가 많은 대형 저널들을 선택했지만 주제에 따라서는 절대적인 인용 횟수가 적어도 중요한 논문을 싣고 있는 저널이 있을 수 있다고 보고 그런 저널들을 찾는 방법으로 피인용 지수를 이용하게 되었습니다.
지금도 매 년 측정되는 이 피인용 지수를 산출하는 과정에서 이용되는 공식은 지난 2 년간 한 저널에서 출판된 논문들을 대상으로 하여 그 논문들이 그 해에 다른 논문들에 의해서 인용된 횟수를 지난 2년간 그 저널에서 출판된 전체 논문의 수로 나누는 것입니다. 그래서 어떤 저널의 2008년 Impact Factor 가 10 이라고 한다면 그 말은 지난 2006년과 2007년에 그 저널에서 출판된 모든 논문들이 2008년 동안 다른 논문들에 의해서 의해서 평균적으로 10 번 인용되었다는 의미입니다. 이렇게 SCI 에 실릴 저널들을 선택하기 위한 도구로서 만들어진 피인용 지수는 결국 피인용 지수가 높을 수록 그 저널은 다른 사람들에 의해 많이 인용되었으므로 피인용 지수가 그보다 낮은 저널에 비해 우수하다는 생각으로 이어지게 되었지요. 그러나 과연 그렇게 간단하게 말 할 수 있을까요?
Email me when Clio publishes or recommends stories