출처=유튜브(ColumbiaSEAS) |
미국 컬럼비아대학교 연구진이 입 모양을 학습해 말하고 노래하는 로봇 얼굴 '이모(Emo)'를 개발했습니다.
이모는 정밀 제어 모터 26개를 활용해 모음·자음과 노래 발성을 구현하며, 발음 규칙을 입력하지 않고 학습 방식으로 입 모양을 익힌 것이 특징입니다. 거울 앞에서 무작위로 표정을 반복하며 자신의 얼굴 움직임을 학습한 뒤, 유튜브 영상 속 사람의 말과 노래를 관찰해 음성과 입 모양의 관계를 익혔습니다.
이 과정에서 단어 번역 없이도 소리의 파형과 입 움직임을 직접 연결해 프랑스어·아랍어·중국어 발화가 가능해졌습니다. 실험에서는 노래 수행과 함께 비교적 명확한 발음과 리듬 표현을 보였지만 일부 파열음은 개선이 필요한 것으로 나타났습니다.
연구진은 이 기술이 대화형 휴머노이드와 AI 비서의 자연스러운 소통에 활용될 수 있을 것으로 보고 있습니다.
이창민 기자 re34521@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]

![[GAM] 씨게이트 ① AI 기반 데이터 혁명, HDD 시장 재편](/_next/image?url=https%3A%2F%2Fstatic.news.zumst.com%2Fimages%2F52%2F2026%2F01%2F20%2F6f2845594d064827bf786d307d767096.jpg&w=384&q=100)





































































