최신 연구

최신 연구

[정윤영 교수] Modality-Specific Speech Enhancement and Noise-Adaptive Fusion for Acoustic and Body-Conduction Microphone Fram

  • 등록일2025.08.01
  • 조회수69
  • 정윤영  교수

    교수정윤영

[주요 연구 내용 요약]

딥러닝 음성 향상 모델은 주변 소음이 담긴 음성에서 소음만을 효과적으로 제거합니다. 소음이 극심한 환경에서는 딥러닝 음성 향상 모델이 제거할 수 있는 한계에 도달하는데, 이러한 환경에서도 의사소통이 가능하도록 사람 피부를 통해 음성을 측정하는 체전도 마이크를 이용하는 기술이 개발되고 있습니다. 또한, 보다 좋은 음성 통신이 가능하도록 체전도 음성을 향상시키는 딥러닝 음성 향상 기술도 연구되고 있습니다. 

 체전도 음성은 고소음 환경에서 일정한 음성 품질을 제공하지만, 저소음 환경에서는 오히려 일반적인 음성 통신보다 품질이 떨어지는 문제가 있습니다. 저희 연구팀은 체전도 음성과 일반 음성을 모두 활용하여, 소음의 크기에 상관없이 일정하게 고품질의 음성 통신이 가능한 “노이즈 적응형 음성 융합기술”을 연구했습니다. 노이즈 적응형 음성 융합기술은 딥러닝 기술을 이용하여 노이즈가 많은 부분은 체전도 음성을 이용하고, 노이즈가 적은 부분은 일반 음성을 이용하는 방식으로, 노이즈 레벨에 따라 적응형으로 신호를 융합하기 때문에 다양한 상황에서 높은 음성 통신 품질을 제공합니다.


[성과와 관련된 이미지 및 간단한 설명]

<그림 설명>

 1. 체전도 신호 → 매핑 모델을 통해 일반 음성으로 향상 → 향상된 체전도 신호 출력

 2. 노이즈가 포함된 음성 신호 → 마스킹 모델을 통해 노이즈 제거 → 노이즈 제거된 음성 신호 출력

 3. 마스킹 모델이 노이즈가 있는 음성 영역을 자동으로 판별

 4. 노이즈가 있는 영역은 향상된 체전도 신호의 비율이 높게, 그렇지 않은 영역은 노이즈 제거된 음성 신호의 비율이 높게 설정하여 신호 융합

 5. 결과 → 신호가 융합된 깨끗한 신호 출력

[그림 1] 관련 이미지.


[연구결과의 진행 상태 및 향후 계획]

본 연구실에서는 딥러닝 음성 향상 기술의 고도화를 통해, 노이즈 적응형 융합 방식의 성능을 개선하고 있습니다. 또한, 실제 웨어러블 디바이스를 제작하여 기술을 실증 가능한 형태로 구현하고 있습니다. 이를 통해 다양한 소음 환경에서 언제나 명료한 음성을 얻을 수 있는 의사소통 기술이 실현될 것입니다.