연구성과

한욱신․유환조 교수팀, 수천배 빠른 분석엔진 개발

2013-09-25629

 “친구, 은사, 동문, 전 여친, 컴퓨터 한대로 1분이면 찾는다?”
POSTECH 한욱신․유환조 교수팀, 수천배 빠른 분석엔진 개발

 

대표적인 SNS, 페이스북에 접속하면 친구나 학교의 은사는 물론 헤어진 전 여자친구까지 찾을 수 있는 ‘알 수도 있는 사람’이란 기능이 있다. 실제로 이러한 기능을 통해 유럽과 아시아로 헤어진 가족이 다시 만나는가 하면, 놀라운 러브스토리가 펼쳐져 화제가 된 바 있다. 이 재미있는 기능은 원래 수백대~수천대의 고성능 컴퓨터를 통해 이루어지는 작업이지만, 이런 어려운 작업을 일반 컴퓨터 단 한 대로 최대 수천배까지 빠르게 찾아낼 수 있는 기술이 나와 학계의 주목을 받고 있다.
 

POSTECH 창의IT융합공학과/컴퓨터공학과 한욱신 교수․컴퓨터공학과 유환조 교수팀은 일반 컴퓨터만을 가지고도 대용량의 그래프 데이터를 분단위로 처리할 수 있는 획기적인 기술 ‘터보그래프’를 개발, 최근 열린 데이터마이닝 분야 최정상 국제학술대회인 KDD2013을 통해 발표했다. 
 

통상 페이스북이나 트위터에 탑재된, 비슷한 관심사를 가진 사용자를 찾아주거나, 친분이 있을 수도 있는 사용자를 자동으로 찾아주는 기능은 무려 10억명 사용자의 그래프 데이터를 모두 검색해 연결 고리를 찾아내는 분석기능이다. 그렇기 때문에 수백대의 고성능 컴퓨터를 이용해 끊임없이 분석작업을 실시해야 하지만, 한 교수팀이 개발한 터보그래프를 이용하면 일반적으로 사용하는 컴퓨터 한 대로도 수분이면 해결이 가능하다.
 

실제로 트위터 데이터를 통해 이미 개발된 기술과 비교해본 결과, 100대의 컴퓨터를 이용해 13분만에 검색되는 수준의 데이터를, 터보데이터는 단 한 대의 컴퓨터로 4분도 안 되는 시간만(3.7분)에 검색해 냈다.
 

연구팀은 이러한 소셜네트워크 뿐만 아니라, 데이터 분석을 통해 단백질간의 상호작용을 밝혀내는 생명분야, 화학 구조식이나 우리의 뇌 속 세포들의 움직임을 알 수 있는 뇌과학 등 광범위한 분야의 분석에도 활용될 수 있을 것으로 기대하고 있다.
 

연구를 주도한 한욱신 교수는 “이 기술을 활용하면 100만원 정도의 컴퓨터로도 대량의 그래프 데이터를 단시간에 처리할 수 있어 데이터 분석을 바탕으로하는 전산, 생명, 화학 등의 분야에서 활용할 수 있으며 속도와 정확성이 중요한 소셜네트워크서비스 기업들에도 큰 도움이 될 것”이라며 “산학협력을 통해 다양한 상용화도 계획하고 있다”고 밝혔다.