UPDATED. 2024-04-25 17:19 (목)
[테크놀로지] 음성인식
[테크놀로지] 음성인식
  • 장미경/ <과학동아> 기자
  • 승인 2001.11.15 00:00
  • 댓글 0
이 기사를 공유합니다

'이리오너라' 말만 하면 된다 소리 파형 디지털 신호로 샘플링… 완전한 문장 인식기술 개발이 과제 '열려라, 참깨!' 착한 알리바바가 보물이 가득 숨겨져 있는 동굴 문을 열기 위해 외쳤던 주문이다.
이제 우리는 이와 비슷한 주문을 동화나 꿈이 아닌 현실에서 외쳐볼 수 있다.
음성인식 기술이 적용된 각종 첨단제품들이 ‘말만 하면 그대로 이뤄지는 세상’으로 우리를 안내하고 있기 때문이다.
인간의 언어를 알아듣는 기계, 어떻게 그게 가능할까? 컴퓨터가 인간의 음성을 인식하게 하려면 우선 소리가 갖는 불규칙한 파동 데이터를 0과 1이라는 디지털 데이터로 바꿔야 한다.
즉 입력된 소리의 파형을 일정한 시간 간격으로 정렬해 잘게 자른 뒤 0과 1이라는 단순한 신호로 변환해 기록하는 샘플링 작업을 해야 한다.
그러나 음성의 파형을 분리시키는 작업이 말처럼 쉽지 않다.
이를 위해서는 특정 주파수의 소리만 통과시키는 복잡한 수학적 계산이 필요한데, 여기서 구해지는 각 음성의 고유한 특성을 ‘특징 파라미터’라고 부른다.
예를 들어 ‘우리 집’이나 ‘본부’라는 단어를 인식해 바로 전화를 걸어주는 음성인식 컴퓨터가 있다고 가정하자. 컴퓨터가 이를 구별할 수 있는 것은 사람이 처음 어떤 발음을 할 때 각각의 소리에 대한 특징 파라미터를 저장해놓았기 때문이다.
여기서 미리 저장된 특징 파라미터는 표준 패턴이 된다.
즉 컴퓨터는 표준 패턴 파라미터를 미리 등록해놓은 뒤 새로운 음성이 입력되면 그에 대한 특징 파라미터를 구한 뒤 등록된 표준패턴 파라미터와 비교해 가장 비슷한 것을 그 음성으로 인식한다.
하지만 발음하는 음성의 특징이 항상 같을 수는 없다.
빨리 발음할 경우와 천천히 발음할 경우를 비교해보면 음성의 길이가 달라지므로 당연히 그 파라미터 값에 변화가 온다.
가령 ‘우리 집’ 발음은 사람에 따라 '우리이집'이나 '우리지입'이 될 수 있다.
이렇게 발음이 바뀌면 파라미터 값이 달라지기 때문에 앞쪽 발음의 ‘리이’를 ‘리’로 줄이거나, 뒷쪽 발음의 ‘지입’을 ‘집’으로 줄이는 방법으로 차이값을 없앨 수 있다.
결국 컴퓨터는 단어의 시작점에서 끝점까지 차이값이 가장 적은 특징 파라미터를 찾아야 한다.
이를 해결하기 위해 전산학 알고리즘 분야의 ‘동적(다이내믹) 프로그래밍’이 동원된다.
행렬 안의 시작점, 중간점, 끝점을 각각 A, B, C라고 가정하자. A에서 C까지의 최소 누적거리는 A에서 B까지의 최소 누적거리와 B에서 C까지의 최소 누적거리를 합한 것과 같다.
이 원리를 컴퓨터에 적용하면 문제가 간단하게 해결된다.
마이크를 통해 어떤 음성이 들어오면 컴퓨터는 단어의 시작점에서 끝점까지의 누적거리를 계산해 가장 길이가 잘 맞는 단어를 인식하게 된다.
그렇다면 내 음성으로 등록된 ‘우리 집’이라는 명령어를 동생이 사용할 경우 컴퓨터가 제대로 인식할 수 있을까? 모든 사람의 지문이 각각 다르듯 목소리도 사람마다 다르다.
마치 외국어를 제대로 학습하기 위해 학원 강사, TV 채널, 현지인 등 다양한 형태의 음성을 많이 들어야 하는 것처럼, 컴퓨터도 많은 사람의 목소리를 듣고 학습해야 인식률을 높일 수 있다.
즉 음성의 높낮이나 발음의 유형이 다른 수많은 사람들의 목소리를 녹음해서 표본화시킨 후, 특정 단어가 얼마나 다양한 형태로 발음되는지를 학습하는 프로그램이 있어야 한다.
이 프로그램을 통해 학습한 컴퓨터는 각양각색의 음성을 인식할 수 있다.
지금까지 소개한 음성인식 기술의 원리는 빙산의 일각에 불과하다.
사실 컴퓨터가 인간의 음성을 알아듣고 이해하기 위해서는 아직 해결해야 할 문제가 많다.
완전한 문장까지 이해할 수 있는 컴퓨터를 만들어내려면 각 언어의 문법체계를 제대로 인식할 수 있는 기술, 의미없는 소리와 음성을 구별할 수 있는 기술 등이 필요하다.
또한 언어의 이해에 필수적으로 뒤따라야 하는 문화적인 문제를 해결하는 기술도 빼놓으면 안 된다.
인간이 문화적인 배경지식 없이는 다른 나라의 유머를 이해할 수 없는 것과 같은 이치다.
이런 정성적인 것을 과연 기술로 해결할 수 있는지는 잘 모르겠다.

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.