UAE 대학생들, 생각만으로 말하는 'KALAM' 앱 개발: 청각 장애인에게 새 희망 제시¶
원제목: Two UAE students create app that translates thoughts into spoken Arabic - Gulf News
핵심 요약
- UAE 대학생들이 생각한 단어를 음성으로 변환하는 'KALAM' 앱을 개발했음.
- EEG 기술을 활용하여 뇌파를 분석, 30개의 아랍어 단어를 실시간으로 인식하고 발화함.
- 특히 아랍어 기반의 상상된 음성 기술에 집중하여 기존 영어 중심의 BCI 연구에서 차별점을 보임.
상세 내용¶
아랍에미리트(UAE)의 아메리칸 대학교(American University of Sharjah)에 재학 중인 두 명의 대학생, 아메드 자히르(Ahmed Zahir)와 아메드 샤디드(Ahmed Shadid)가 획기적인 애플리케이션 'KALAM'을 개발했습니다. 이 앱은 사용자가 생각하는 단어를 실시간으로 음성이나 텍스트로 변환시켜, 말하기 어려운 사람들이 소통할 수 있도록 돕는 혁신적인 기술입니다. 특히, 이번 개발은 연설 장애가 있거나 말을 할 수 없는 사람들이 아랍어로 소통할 수 있는 새로운 길을 열어줄 것으로 기대됩니다.
KALAM은 첨단 뇌-컴퓨터 인터페이스(BCI) 기술, 특히 뇌파검사(EEG) 헤드셋을 활용합니다. 사용자가 특정 아랍어 단어를 생각하면, EEG 헤드셋이 뇌 신호를 포착합니다. 이렇게 수집된 뇌 신호는 먼저 잡음을 제거하기 위해 필터링 과정을 거친 후, 핵심적인 뇌파 패턴을 식별하기 위한 처리가 이루어집니다. 이 과정은 매우 정교하며, 사용자의 의도를 정확하게 파악하는 것이 핵심입니다.
이후, 분석된 뇌파 패턴은 미리 학습된 30개의 아랍어 단어 라이브러리와 대조됩니다. 일치하는 단어가 발견되면, 해당 단어는 즉시 텍스트로 화면에 표시되거나 애플리케이션에 의해 음성으로 발화됩니다. 이 모든 과정은 어떠한 물리적인 움직임 없이, 오직 생각만으로 실시간으로 이루어진다는 점에서 매우 놀랍습니다. 이는 기존의 보조 도구들이 안구 추적, 물리적 스위치, 혹은 제한된 상징 보드에 의존했던 것과는 근본적으로 다른 방식입니다.
KALAM의 가장 큰 특징은 기존의 뇌-컴퓨터 인터페이스 연구가 대부분 영어에 집중되어 있던 것과 달리, 아랍어 기반의 '상상된 음성(imagined speech)'에 초점을 맞추었다는 점입니다. 이러한 특정 언어 및 사용자의 상상된 음성에 대한 집중은 해당 언어 사용자들에게 훨씬 더 맞춤화되고 효과적인 소통 경험을 제공할 수 있습니다. 개발자들은 이 기술이 아랍어 사용 세계에서 더욱 포용적인 커뮤니케이션 기술 발전에 기여할 수 있기를 희망하고 있습니다.
이번 KALAM 개발은 제임스 다이슨 어워드 UAE 2025에서 2위를 수상하며 그 혁신성과 잠재력을 인정받았습니다. 이는 단순히 기술적인 성과를 넘어, 사회적 약자를 위한 기술 개발의 중요성을 다시 한번 보여주는 사례이며, 앞으로 BCI 기술이 우리 사회에 가져올 긍정적인 변화에 대한 기대를 높이고 있습니다. 특히, 소외된 언어권의 사용자들에게도 최신 기술의 혜택이 돌아갈 수 있다는 점에서 의미가 큽니다.
편집자 노트¶
이번 UAE 대학생들의 KALAM 앱 개발 소식은 뇌-컴퓨터 인터페이스(BCI) 기술이 어떻게 우리 삶의 질을 실질적으로 개선할 수 있는지 보여주는 좋은 사례입니다. 우리가 흔히 SF 영화에서 접하는 '생각만으로 기계를 조작하는' 기술이 실제로 말을 할 수 없는 사람들에게 '목소리'를 돌려주는 도구로 현실화되고 있다는 점이 매우 고무적입니다. 특히, 아랍어라는 특정 언어에 집중하여 기술을 개발함으로써, 기존에 소외되었던 언어권 사용자들에게도 BCI 기술의 혜택이 돌아갈 수 있다는 점에서 더욱 큰 의미를 가집니다.
KALAM은 뇌파(EEG)를 통해 사용자의 생각, 즉 '상상된 음성'을 인식하고 이를 실제 음성으로 변환하는 기술을 사용합니다. 이는 마치 우리가 속으로 단어를 떠올리는 것처럼, 뇌에서 발생하는 특정 신호를 읽어내어 데이터로 처리하는 것입니다. 이 과정에서 30개의 아랍어 단어로 학습된 딥러닝 모델이 핵심적인 역할을 하며, 생각과 실제 발화 간의 간극을 좁힙니다. 이러한 기술은 단순히 정보 전달을 넘어, 정서적 교감과 사회적 참여를 가능하게 하는 강력한 도구가 될 수 있습니다.
앞으로 이러한 기술이 더욱 발전한다면, 현재의 제약된 단어 인식 범위를 넘어 더 복잡하고 미묘한 의사소통이 가능해질 것입니다. 또한, 아랍어뿐만 아니라 다른 언어권에서도 유사한 기술이 개발된다면, 전 세계적으로 소통의 장벽이 크게 낮아질 수 있습니다. 이는 언어, 신체적 제약으로 인해 사회적으로 고립되기 쉬운 많은 사람들에게 큰 희망을 줄 뿐만 아니라, 미래 사회의 소통 방식을 근본적으로 변화시킬 잠재력을 가지고 있습니다. 'KALAM'의 등장은 BCI 기술이 가진 사회적 가치와 무한한 가능성을 다시 한번 확인시켜 주는 사건입니다.