[박찬 기자]
음성 인공지능(AI) 선두 스타트업인 일레븐랩스가 이틀 새 제품 2개를 출시했다. 지난 주 픈AI가 음성 비서 기능이 강화된 'GPT-4o'를, 구글이 '프로젝트 아스트라'를 공개하자 대응에 나선 것이다.
벤처비트는 18일(현지시간) 일레븐랩스가 텍스트-음성 변환 기술을 통해 웹 페이지 콘텐츠를 자동으로 설명하는 임베디드 음성 플레이어 '오디오 네이티브(Audio Native)'를 출시했다고 보도했다. 또 전날에는 웹 페이지와 PDF, 기타 문서 등을 11가지 목소리로 음성화할 수 있는 '일레븐랩스 리더(ElevenLabs Reader)'를 내놓았다.
우선 오디오 네이티브는 모든 기사와 블로그, 뉴스레터 등에 자동화된 음성 해설을 생성하고 링크를 삽입할 수 있다.
음성 인공지능(AI) 선두 스타트업인 일레븐랩스가 이틀 새 제품 2개를 출시했다. 지난 주 픈AI가 음성 비서 기능이 강화된 'GPT-4o'를, 구글이 '프로젝트 아스트라'를 공개하자 대응에 나선 것이다.
벤처비트는 18일(현지시간) 일레븐랩스가 텍스트-음성 변환 기술을 통해 웹 페이지 콘텐츠를 자동으로 설명하는 임베디드 음성 플레이어 '오디오 네이티브(Audio Native)'를 출시했다고 보도했다. 또 전날에는 웹 페이지와 PDF, 기타 문서 등을 11가지 목소리로 음성화할 수 있는 '일레븐랩스 리더(ElevenLabs Reader)'를 내놓았다.
우선 오디오 네이티브는 모든 기사와 블로그, 뉴스레터 등에 자동화된 음성 해설을 생성하고 링크를 삽입할 수 있다.
웹사이트 콘텐츠를 음성으로 변환라면 간단한 HTML 스니펫만 입력하면 된다. 웹사이트 도메인을 허용 목록에 추가하고 음성과 플레이어 배경색 및 색상을 설정한 뒤, 임베디드 코드를 복사해 웹사이트에 붙여넣으면 끝이다.
또 페이지의 모든 텍스트를 음성화할 수 있고, 일부만 선택할 수도 있다. 이 기능은 한국어 등 29개 국어를 지원한다.
"놀랍다" "접근성을 향상하는 데 큰 도움이 된다" 등 사용자들의 반응도 나쁘지 않다.
일레븐랩스는 "이 도구는 맞춤 설정이 가능하고 설정이 쉬우며, 독자의 참여를 유도하고 전 세계 독자를 위해 콘텐츠를 접근 가능하게 한다"라고 말했다.
새로운 오디오 네이티브는 월 11달러에 크리에이터 등급에서 사용할 수 있으며, 청중 참여를 모니터링할 수 있는 메트릭스와 대시보드도 포함돼 있다.
전날 공개한 '일레븐랩스 리더'는 모바일에서 웹 페이지나 문서 등을 소리내 읽어주는 기능이다. 즉 휴대폰을 통해 접근성응 강화한 것이다. 현재는 iOS로만 출시됐다,
그동안 음성 AI 분야의 대표 주자로 꼽혔던 일레븐랩스로서는 오픈AI나 구글의 음성 비서가 위협적일 수 있다.
특히 이 회사는 "인간의 억양과 억양을 비교할 수 없이 충실하게 렌더링하고 상황에 따라 전달을 조정한다"라는 것을 강점으로 내세웠다. 하지만 오픈AI의 'GPT-4o'도 다양하고도 풍부한 감정 표현을 전달했다는 평가다. 이에 따라 빠르게 사용 사례를 확장, 음성 비서와는 다른 용도를 만들어내야 한다.
한편 일레븐랩스는 2022년 설립 후 2년 만에 기업 가치 11억달러(약 1조5000억원)의 기업 가치를 평가받으며 유니콘 대열에 합류했다.
지난 1월에는 사용자가 AI로 복제한 음성을 판매할 수 있는 음성 라이브러리 마켓플레이스를 출시하기도 했다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
































































