UPDATED. 2022-01-27 17:41 (목)
[나는프로] 디오텍 문자인식개발팀장 성태진
[나는프로] 디오텍 문자인식개발팀장 성태진
  • 한정희
  • 승인 2000.12.27 00:00
  • 댓글 0
이 기사를 공유합니다

모든 필체는 내 손안에 있소이다
컴퓨터 모니터 한편에 날려 쓴 ‘인’자가 보인다.
그 옆에는 똑같은 ‘인’자가 마치 별자리처럼 여러개의 점들과 선들로 연결되어 있다.
그 옆에는 그보다 더 단순한 점과 선으로 글자가 새겨져 있다.
마치 뼈를 드러낸 것 같다.
하나의 곡선으로 흘려쓴 ‘인’자가 여러개의 점과 선으로 표현되면서 각각 꺾이는 각도와 길이 사이에 수식이 만들어진다.
컴퓨터는 고민한다.
과연 이 글자를 ‘인’자로 읽어야 할까, 아니면 ‘닌’으로 읽어야 할까. 혹시 ‘아’자는 아닐까. 날려 쓴 모양이 비슷한 대여섯개의 글자가 후보에 오르고, 각각의 오차범위가 점수로 표시된다.
오차점수가 제일 낮은 글자가 정답이다.
이 글자는 ‘인’자가 확실하다.

문자인식 개발업체 디오텍의 개발팀장 성태진(33)씨는 컴퓨터 모니터를 모래판 삼아 다양한 필체와 씨름한다.
대표 필체를 분석해 비교하는 ‘툴’도 그가 개발한 것이다.
사람들의 필체는 제각각 달라서 다양한 필체를 분석할수록 정확도가 올라간다.
대표적인 글자 패턴을 정하고, 글자에 조금씩 변화를 주고, 결과를 체크하고, 오차비율을 낮추는 일. 이런 일들을 반복하는 것은 어찌보면 그의 말대로 ‘노가다일’이기도 하다.
첨단제품인 PDA의 한글 문자인식은 이런 수많은 테스트를 거친 산물이다.
“문자인식도 뜰 것” 그는 아주 단순하지만 중요한 호기심에서 출발해 문자인식 개발을 시작했다.
“휴대용 단말기에는 키보드가 없잖아요? 어떻게 글을 쓸 수 있을까 고민했죠.” 그의 이력도 오로지 한길로 맞닿아 있다.
부산대 컴퓨터공학과를 졸업하고, 포항공대 전자계산학과 대학원에 입학해 문자인식기술 논문으로 석사학위를 땄다.
그리고 삼성종합기술원에서 99년 3월 디오텍에 합류하기까지 문자인식기술을 연구해왔다.
“90년도인가요? 한창 펜컴퓨터 바람이 불었어요. 그때 생각했죠. 앞으로 문자인식이 주류가 될 거라고요.” 하지만 기대했던 것만큼 문자인식기술은 주류가 되지 못했다.
2년간 연구해 매달렸지만 소비자들의 반응은 시큰둥했다.
기술에 비해 사람들의 기대치는 너무나 컸고, 성능은 한참이나 뒤떨어졌던 것이다.
그 후에 한 1년간을 그는 ‘암울한 기간’이라고 말한다.
소비자들이 선택해주지 않았기 때문에 시장은 죽었고, 투자도 줄어들었다.
한동안 문자인식기술은 정체된 듯 보였다.
하지만 삼성은 PDA 시장을 포기하지 않았고 다시 개발이 시작됐다.
“95년도에 삼성생명 보험설계사용으로 PDA가 많이 활용됐어요. 인식성능이 높아지고 에러율도 많이 낮아졌죠.” 문자인식 성능은 계속 좋아졌다.
삼성종합기술원에서 그가 속한 온라인문자팀은 96년에 삼성그룹 기술상을 받기도 했다.
영어·유럽어도 개발중 삼성종합기술원에서 잘 있던 그가 뛰어나오게 된 건 한가지 기술에만 매달렸던 정체된 그의 삶에 돌파구를 마련하고 싶어서였다.
“97년과 98년엔 자바가 인기를 끌었죠. 새로운 기술개발에 대한 갈망이 있었어요. 당시는 PDA가 지금처럼 환영받진 않았거든요.” 그는 몸집이 작고 융통성 있는 회사에서 다양한 기술개발의 가능성을 타진하고 싶었다.
삼성종합기술원을 나와 디오텍 설립에 동참한 것도 그런 이유 때문이다.
그는 이제 한글 인식에만 머무르지 않고, 영어 유럽어 등 다양한 외국어 적용에 골몰하고 있다.
진짜 그 사람의 서명인지 아닌지 구분하는 서명인식 기술개발도 주요한 연구과제이다.
현재 그가 개발한 기술은 각종 PDA에 탑재돼 소비자들에게 팔리고 있다.
2001년 무선인터넷 시대가 열리면서 단말기에 문자인식기술은 필수품목이 됐다.
“문자인식기술 수요는 계속 늘 것 같아요. 어쨌든 문서를 작성하기 위해선 글씨를 써야 하잖아요.” 그는 최근 PDA의 성공요인에 대해서도 나름대로 풀이를 내놓는다.
“예전에 비해 사람들의 기대치는 낮아진 반면 문자인식률은 높아졌거든요. 사람들이 기계를 다루는 데도 능동적이 됐어요. 이렇게 하면 더 잘되더라 하면서 기계에 적응하는 거죠.” 실제 PDA에는 ‘제스처’라는 것이 있다.
이를테면 빼기를 표시하면 문자가 지워지는 식이다.
PDA와 사용자간에 서로 통용되는 하나의 약속이다.
마치 사람들 사이에 언어가 하나의 약속인 것과 마찬가지다.
어찌보면 그는 컴퓨터와 인간이 대화하는 새로운 약속을 만들어내는지도 모른다.
그가 문자인식기술을 통해 세계 모든 나라의 언어를 섭렵하고 나면 무슨 일을 할까? 혹 PDA를 통해 세계 공통의 ‘제스처’를 만드는 건 아닌지 모르겠다.
PDA와 대화하기 대부분의 PDA는 한글을 거의 정확하게 인식한다. 다른 사람이 보아 알아보지 못할 정도가 아니면 PDA도 인식한다는 뜻이다. PDA는 비교적 또박또박 글씨를 쓰면 에러율이 거의 없다. 그렇다고 일부러 또박또박 쓸 필요는 없다. 단지 흘려쓰는 경우 다음의 몇가지 사례를 주의하면 오차율을 제로에 가깝게 줄일 수 있다. 예컨대 ‘ㄲ’과 ‘ㅁ’은 좀 흘려쓰면 비슷하게 인식될 수 있다. ‘ㄹ’과 혼동하기 쉬운 글자는 ‘ㅌ’이나 ‘ㅎ’이다. 모음과 같이 쓰는 경우 ‘리’와 ‘쾌’는 비슷하게 인식될 수 있다. ‘네’와 ‘비’도 마찬가지다. 이런 몇가지 경우 외에 혹시 특정 글자가 잘못 인식된다면 쓰는 방법에서 조금만 신경쓰면 된다. 그렇다고 글자를 입력하는 데 신경을 곤두세울 필요는 없다. 문자인식을 개발하는 사람들의 노력이 무위로 돌아갈지도 모르니까 말이다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.