최신 연구
[정윤영 교수] Lightweight Speech Enhancement Model Based on Harmonic
- 등록일2025.08.01
- 조회수52
-

교수정윤영
[주요 연구 내용 요약]
사람이 시끄러운 환경에서 스마트폰, 헤드셋 등의 마이크를 이용할 때, 일반 마이크는 목소리뿐 아니라 주변 소음까지 함께 포함되어 음질이 떨어집니다. 피부 부착형 가속도 센서는 목의 진동을 직접 감지해 소음에는 매우 강인한 장점을 갖지만, 음성의 고주파 성분을 측정하지 못하는 단점이 있습니다.
본 연구에서는 두 센서의 장점을 모두 살리기 위해, 가속도 센서와 일반 마이크 신호를 효율적으로 처리하는 초경량 음질 향상 인공지능 모델을 개발했습니다. 본 연구에서 개발된 인공지능 모델은 소음의 영향을 거의 받지 않는 가속도 센서 신호에서 발화자의 핵심 음성 특징을 정밀하게 추출합니다. 이렇게 얻은 정보로 발화자의 고유 음성 패턴을 선택적으로 강조하여, 잡음이 있는 환경에서도 음성이 올바르게 추출합니다. 또한, 주변 소음 정도를 분석해 두 센서 중 가장 선명하게 들리는 소리 파형 특성을 자동으로 골라 합성함으로써, 마치 깨끗한 음성을 직접 녹음한 것처럼 복원합니다.
이 모든 과정을 기반으로 한 연구 결과는 기존 모델 대비 연산량과 요구되는 메모리를 크게 줄이는 형태로 구현되었습니다. 이를 통해서 초소형 컴퓨터 에서도 실시간으로 기기를 구동할 수 있었습니다. 결과적으로, 소음이 심한 거리, 공사장, 재난 현장과 같은 환경에서도 착용형 기기 하나로 선명한 목소리를 들을 수 있는 기술을 실현했습니다.
[성과와 관련된 이미지 및 간단한 설명]
<이미지 설명>
1. 가속도 센서(목 부착) → 소음에 강한 저주파 목소리 정보 추출
2. 마이크 → 전체 음역대 수집 (단, 소음 포함)
3. 인공지능 모델 → 두 신호의 장점을 결합, 소음을 줄이고 고주파까지 복원 (음성의 하모닉 성분과 위상 정보 활용)
4. 결과 → 실시간으로 깨끗한 음성 출력

[그림 1] 관련 이미지.
[논문 링크]
현재, 인공지능 음질 향상 기술을 탑재한 웨어러블 디바이스를 제작하고 있습니다. 앞으로 실제 소음이 심한 환경에서 실시간으로 선명한 목소리를 전달할 수 있는지 성능을 검증할 예정입니다. 또한, 재난 구조, 군사 통신, 산업 현장 등 고소음 환경에서의 안전과 의사소통 향상을 위해 적용 범위를 지속적으로 확대해 나갈 계획입니다.

