당신의 음성, 잘 알아듣고 진짜 사람 같은 다양한 목소리로 말할 수 있습니다.
VOICE STUDIO는 다양한 음성 비즈니스에 활용 가능한 고품질 음성인식, 음성합성의 생성형AI 제품입니다. 정확한 음성인식과 사람같이 자연스러운 음성 합성 기술로 사람과 AI의 원활한 커뮤니케이션이 가능해집니다.
- #인공지능상담확장
- #자동자막생성
- #음성기반가상비서
- #음성검색
- #AI음성녹음
- #AI휴먼


VOICE STUDIO의 특별함
VOICE STUDIO는 10,000시간 이상 학습된 기본 모델 탑재를 통해
적은 양의 도메인 데이터 학습만으로
고품질의 음성인식·합성 서비스를 제공합니다.
-
Point 01
95.6% 음성인식률
및 자연스러운 합성
-
Point 02
실시간 스트리밍
음성인식
-
Point 03
초당 5분 음성데이터
화자분리
-
Point 04
전이학습기반
음성합성
-
Point 05
원 클릭 통합
관리도구
시스템구성
Core Technology
Real-Time STT
95.6% 높은 정확도의 실시간 음성인식
VOICE STUDIO의 음성인식 엔진은 음성 인터페이스 기반의 다양한 실시간 음성 서비스에 활용될 수 있으며 기존 언어모델, 음향모델, 발음사전 등 각각 별도로 학습하는 방식에서 벗어나 종단형 통합 학습을 통해 더 빠르고 정확한 음성인식이 가능합니다.
특장점
-
0110,000시간 이상 학습 고성능 베이스 모델
약 10,000 시간 분량의 탄탄한 8kh/16kh 데이터로 학습된 고성능 베이스라인 모델을 제공으로 적은 데이터로도 도메인에 충분한 퍼포먼스를 보장합니다.
-
02종단형 실시간 스트리밍 음성인식기술
스트리밍 트랜스포머 음성인식 기술을 적용하여 음성인식을 실시간으로 처리함으로써 자연스러운 대화 처리가 가능합니다.
-
03화자분리 엔진 탑재
i-Vector 기반 화자 분리엔진을 탑재하여, 일괄처리 방식으로 동작 시 1초당 5분의 음성데이터 화자분리가 가능합니다.
-
04원 클릭 통합 관리도구
개발전문가가 아니더라도 쉬운 클릭만으로 음성학습, 모델 생성 및 배포, 검증과 서비스를 관리 할 수 있는 도구를 제공합니다.
Realistic TTS
진짜 사람 같은 음성합성
VOICE STUDIO의 음성합성 엔진은 Text를 학습한 목소리 모델을 통해 사람의 음성을 인공적으로 만들어 주며 특히, 딥러닝 기반 End-to-End 전이학습을 통해 적은 양의 데이터로도 고품질의 음성합성이 가능합니다.
특장점
-
01전이학습 기반 음성합성 기술
전이학습 기반 음성 합성 모델을 통해 스타일 전이 대상의 소량 음성 데이터를 기존의 음성 데이터에 결합하여 원하는 대상의 스타일로 비즈니스에 맞게 음성 TTS 구축이 가능합니다.
-
0230분 음성데이터로 목소리 합성
기존 음편합성 방식이 아닌 딥러닝 기반의 End-to-End 전이학습을 통해 적은 양의 학습 데이터로도 원하는 대상의 고품질의 음성합성이 가능합니다.
-
03도메인 특화 한글 표기변환 기능 제공
다양한 비 한글 표기에 대한 발음생성을 위해 비 한글 표기(숫자, 외래어,약어 등)와 영어 단어 발음기호 변환 기능을 제공하여 원활한 음성합성 서비스를 제공합니다.
-
04원 클릭 통합 관리도구
관리도구를 통해 쉽게 음성합성 모델 생성이 가능하며, 소규모의 데이터를 기존모델에 병합하는 전이학습까지 기능을 제공합니다.
VOICE STUDIO TOOL
음성 인식 및 합성 전문도구VOICE STUDIO는 음성인식/합성 모델 구축부터 배포, 관리까지 음성 서비스 생성AI의 핵심 기능을 제공합니다.
-
데이터 관리
-
학습 관리
-
검증 관리
-
사전관리
-
앤드 포인트 관리
-
이력 관리
도구소개
-
01음성인식 관리
-
실시간 스트리밍 지원 음성인식엔진
- 스트리밍 트랜스포머 기반 실시간 음성인식 모델 지원
- 도메인 데이터를 통한 연결학습 지원
- 실시간 사용자 어휘 등록 기능
- 관리도구를 통한 음성인식 이력조회 관리 기능
- 음성인식 학습 데이터 및 음성인식 모델 관리
- 음성인식 모델 검증 기능
- 음성인식 서버 모니터링 및 자원관리 기능
-
-
-
02음성합성
-
음성합성 모델 생성과 소규모 데이터를 기존 모델과 병합하는 전이학습 기능 제공
- 질의응답세트 관리 기능
- JSON파일 내보내기/가져오기 기능
- 질의응답 재교육 기능
- 질문 추천 기능
- 유사질문 수동 등록 기능
- 질의문장 자동 등록 기능
-
-
-
03음성전사
-
도메인별 특화된 음성인식/합성 모델 구현을 위한 학습데이터 구축
- 작업 단계 통합 모니터링 기능
- 오디오 음성 파일 업로드 및 Pre-Text 생성 기능
- 도메인별 전사작업 세트 관리 기능
- 작업 담당자별 내 작업 관리 기능
- 작업 결과물 검수 및 결재처리 기능
- 사용자 권한관리를 통한 따른 작업자 권한 부여 기능
-
-
Success Story
-
AI 메타휴먼(METAHUMAN)
LGU+ ‘TV 아이들나라’ AI프로젝트 디지털 휴먼 ‘AI가람이’
디지털휴먼 가람이를 어린이용 정제된 컨텐츠를 학습시킨 AI와 연령 구분 없이 무분별한 영상 콘텐츠로 학습한 AI로 구분하여 두명의 AI아이를 구현 자연어처리(NLP), 음성합성, 음성인식 등 기술집약 도입효과
아이들나라 광고보기 -
- AI실험이라는 형식의 독창성, 공익적, 교육적 성과로 ‘2020 대한민국광고대상 수상’
-
AI 음성인식
국회 인터넷 의사중계 사업 실시간 회의 AI 자막시스템 구축
국회법 개정(2020. 12.22)에 따른 장애인 의정활동 접근성 강화를 위한 의회의사중계에 Al 음성인식 생중계 자막 시스템 시범 구축
-
- 지능형 국회 구현 및 의정활동에 대한 국민의 정보 접근성 강화
-
아웃바운드 AI음성봇
콜센터 아웃바운드 AI음성봇 활용 업무 자동화
아웃바운드 콜봇 구축을 통해 고객의 연체 자동 알림, 필수 고지안내, 수익증권 해피콜 등의 상담사 업무 자동화
-
- 문의 상담의 질적 제고와 검증이 완료된 지식 정보 안내로 상담 품질 향상
-
AI음성봇
1세대 고객응대 챗봇 고도화 딥러닝 기술 접목한 AI챗봇
기존 운영중인 챗봇에서 미답변된 질문에 대해 MRC기술을 활용하여 답변 응대 고도화 및 콜센터 안내 멘트에 대해 음성합성을 이용한 자연스러운 발화 서비스 제공
-
- 기존 답변이 어려웠던 질문에 대해 최적의 답변을 제공하여 고객에게 챗봇 활용도와 만족도를 동시에 높이고 이질감 없는 음성 서비스 제공
Reference
-
인공지능 기반 상담 부스
신용회복위원회
AI상담사 채무조정 민원상담 시스템 구축
-
고객 상담 AI음성봇
NH 농협은행
국내 금융권 컨택센터 최초, 실시간 비대면 AI 콜봇 서비스
-
아웃바운드 AI 음성봇
NH 농협은행
콜센터 아웃바운드 AI음성봇 활용 업무 자동화
-
아웃바운드 AI 콜봇
한국투자증권
인공지능(AI)기반 상담 콜봇 및 직원용 업무 챗봇 시스템 구축
-
인터넷의사 중계시스템
대한민국 국회
AI음성인식 국회 의사 생중계 자막시스템 구축
-
AI음성 민원안내 시스템
대전광역시
스마트 미러 AI음성인식 민원 안내 시스템 구축
-
AI휴먼 평양친구
통일부
북한정보 및 주민들의 말투, 억양 등 음성을 학습한 가상 평양사람
-
비대면 민원처리 디지털 휴먼
광주광역시
광주시장 디지털 휴먼 구현 민원상담시스템 구축
-
퇴행성뇌질환자 음성
한국지능정보사회
진흥원퇴행성 뇌질환 음성 데이터 수집을위한 AI학습데이터 구축 도구 공급
-
주제별 음성데이터
한국지능정보사회
진흥원방송데이터 10,000시간 이상 회의 관련 음성 7,000시간 이상
-
방송콘텐츠 대화체 AI데이터
한국지능정보사회
진흥원방송 콘텐츠 총 17,000 시간 음성전사 학습데이터 구축
-
한국어 방언 AI 데이터 구축
한국지능정보사회
진흥원총 15,000시간, 총 250만 문장 지역별 방언 전사 학습데이터 구축