UPDATED. 2024-04-20 13:45 (토)
[포커스] 3세대 검색엔진 ‘발진’
[포커스] 3세대 검색엔진 ‘발진’
  • 김윤지 기자
  • 승인 2001.07.04 00:00
  • 댓글 0
이 기사를 공유합니다

검색어의 품사 분간하는 ‘엠파스XP’ 등장… 검색엔진 경쟁 다시 불붙을 듯
'문장으로 찾는 검색엔진’ 시대를 열었던 지식발전소가 지난 6월26일 기존의 엠파스 www.empas.com보다 한층 개선된 새로운 검색엔진 ‘엠파스XP’를 발표함으로써 3세대 검색엔진 경쟁에 불을 지폈다.


엠파스XP의 가장 큰 특징은 10~100배 빨라진 검색속도와, 문장으로 찾는 검색엔진의 완결판이라고 할 만큼 개선된 검색 서비스의 질이다.
1세대 검색엔진이 검색어 안에서 명사와 조사를 분리할 수 있는 수준이었다면, 엠파스가 주도했던 2세대 검색엔진은 형용사와 동사까지 구분 인식할 수 있었다.
예를 들어 ‘빨간 장미’라는 검색어를 하나의 의미로 받아들여 처리할 수 있었던 셈이다.


그런데 이번에 지식발전소가 코난테크놀로지 www.konantech.co.kr와 공동으로 개발해 선보인 엠파스XP는 명사, 동사, 형용사, 부사 등을 모두 분간하는 기능을 갖췄기 때문에 좀더 정확한 검색결과를 얻어낼 수 있다.
예를 들어 ‘달리의 그림’ ‘말 타고 달리기’ ‘그와 달리’라는 세가지 표현에서 ‘달리’라는 단어가 어느 위치에 놓여 있는가를 보고 그것이 화가 이름인지 부사인지, 아니면 동사인지를 판단해 검색결과를 내놓는다.
엠파스XP는 국내에서는 처음 시도되는 다른 다양한 기능도 담고 있다.
우선, 검색엔진 사용자들이 그동안 가장 크게 불만을 나타냈던 중복문서가 검색결과에서 제거된다.
중복된 문서에는 ‘표시 내용이 중복되는 문서입니다’라는 안내문이 달려 나온다.
불필요한 검색어는 제외하고 검색을 하는 ‘부정어 검색’ 기능도 추가됐다.
최민식이 나온 영화를 찾으면서 한석규가 함께 나온 영화는 빼고 싶다면 검색어로 ‘최민식이 나온 영화’, 부정어로 ‘한석규’를 입력하면 된다.
검색자가 가장 원하는 검색결과라고 판단되는 것을 제일 먼저 보여주는 ‘족집게 기능’도 국내에서는 처음 시도됐다.
이밖에 입력된 검색어에서 한글 띄어쓰기 오류를 자동으로 교정해주는 기능도 추가됐다.
일반적으로 문장으로 검색을 할 때는 띄어쓰기를 어떻게 하느냐에 따라 검색결과가 달랐다.
그러나 엠파스XP는 ‘김건모 7집의 타이틀 곡은’이나 ‘김건모7집의타이틀곡은’이나 동일한 검색 결과를 내놓는다.
하드웨어 요구량을 2분의 1 내지 4분의 1로 줄인 것도 의의가 크다.
보통 대형 포털사이트에선 늘어나는 사용량 때문에 서버 증설을 위해 한달에 수억원을 들이곤 한다.
엠파스도 지난해 서버 증설을 위해 약 40억원을 썼다.
그러나 이번 엔진 교체로 기존 서버의 반 이상이 쉴 수 있게 돼, 엠파스는 앞으로 1년간 하드웨어에 더 투자를 하지 않아도 된다.
설명대로라면 한푼이 아쉬운 닷컴 입장에서 40억원 이상을 굳히게 된 것이다.
이번 엠파스XP 공동개발에서 엔진개발을 담당한 코난테크놀로지는 이 분야의 숨은 실력자로 알려진 회사다.
10년 이상 한국어 정보처리와 자연언어 처리 관련 업무 경험을 가진 12명의 정부출연연구소·대학교수 출신 전산언어학 연구자들이 1994년 한국어 분석연구그룹 ‘코난’을 결성해 활동하다가 99년 4월 회사를 설립했다.
지식발전소와는 2000년 12월에 전략적 제휴를 맺었다.
두 회사는 코난테크놀로지쪽이 보유하고 있던 검색엔진 ‘도큐먼트 크루저’를 기반으로 이번에 엠파스XP를 공동개발한 것이다.
자동차로 비유하면 자동차의 엔진부분은 코난테크놀로지가, 엔진 이외 부분은 지식발전소가 개발한 것이다.
엠파스는 선발 포털사이트들이 자리를 잡은 시장에서 후발 업체로는 보기 드물게 성공한 사이트라는 평을 듣고 있다.
99년 11월 포털사이트들이 서비스의 다양화에 초점을 맞추고 있던 때에 뒤늦게 뛰어들어 검색엔진의 질 제고 경쟁을 촉발시키며 우위를 거머쥐었기 때문이다.
지식발전소 박석봉 사장도 엠파스XP 발표회장에서 남다른 감회를 나타냈다.
“당시에 모두들 이제야 검색엔진에 뛰어들어 선두업체들 속에서 살아남기 힘들다고 했지만 우린 순전히 검색의 질로 승부해서 여기까지 왔다.
하지만 검색 서비스의 수준이 늘 마음에 걸렸다.
해야 할 숙제를 이제야 마친 기분이다.
” 야후코리아, 네이버, 코리아닷컴, 다음 등 다른 주요 포털들은 올해 상반기에 검색엔진 교체를 끝냈다.
소강상태를 보이던 검색서비스 경쟁이 엠파스XP의 등장으로 다시 불붙을 조짐이다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.