Ver 2.x

당신의 음성, 잘 알아듣고 진짜 사람 같은 다양한 목소리로 말할 수 있습니다.

VOICE STUDIO는 다양한 음성 비즈니스에 활용 가능한 고품질 음성인식, 음성합성의 생성형AI 제품입니다. 정확한 음성인식과 사람같이 자연스러운 음성 합성 기술로 사람과 AI의 원활한 커뮤니케이션이 가능해집니다.

  • #인공지능상담확장
  • #자동자막생성
  • #음성기반가상비서
  • #음성검색
  • #AI음성녹음
  • #AI휴먼

VOICE STUDIO의 특별함

VOICE STUDIO는 10,000시간 이상 학습된 기본 모델 탑재를 통해 적은 양의 도메인 데이터 학습만으로
고품질의 음성인식·합성 서비스를 제공합니다.

  • Point 01

    95.6% 음성인식률

    및 자연스러운 합성

  • Point 02

    실시간 스트리밍

    음성인식

  • Point 03

    초당 5분 음성데이터

    화자분리

  • Point 04

    전이학습기반

    음성합성

  • Point 05

    원 클릭 통합

    관리도구

시스템구성

Core Technology

Real-Time STT

95.6% 높은 정확도의 실시간 음성인식

VOICE STUDIO의 음성인식 엔진은 음성 인터페이스 기반의 다양한 실시간 음성 서비스에 활용될 수 있으며 기존 언어모델, 음향모델, 발음사전 등 각각 별도로 학습하는 방식에서 벗어나 종단형 통합 학습을 통해 더 빠르고 정확한 음성인식이 가능합니다.

특장점

  • 0110,000시간 이상 학습 고성능 베이스 모델

    약 10,000 시간 분량의 탄탄한 8kh/16kh 데이터로 학습된 고성능 베이스라인 모델을 제공으로 적은 데이터로도 도메인에 충분한 퍼포먼스를 보장합니다.

  • 02종단형 실시간 스트리밍 음성인식기술

    스트리밍 트랜스포머 음성인식 기술을 적용하여 음성인식을 실시간으로 처리함으로써 자연스러운 대화 처리가 가능합니다.

  • 03화자분리 엔진 탑재

    i-Vector 기반 화자 분리엔진을 탑재하여, 일괄처리 방식으로 동작 시 1초당 5분의 음성데이터 화자분리가 가능합니다.

  • 04원 클릭 통합 관리도구

    개발전문가가 아니더라도 쉬운 클릭만으로 음성학습, 모델 생성 및 배포, 검증과 서비스를 관리 할 수 있는 도구를 제공합니다.

Realistic TTS

진짜 사람 같은 음성합성

VOICE STUDIO의 음성합성 엔진은 Text를 학습한 목소리 모델을 통해 사람의 음성을 인공적으로 만들어 주며 특히, 딥러닝 기반 End-to-End 전이학습을 통해 적은 양의 데이터로도 고품질의 음성합성이 가능합니다.

특장점

  • 01전이학습 기반 음성합성 기술

    전이학습 기반 음성 합성 모델을 통해 스타일 전이 대상의 소량 음성 데이터를 기존의 음성 데이터에 결합하여 원하는 대상의 스타일로 비즈니스에 맞게 음성 TTS 구축이 가능합니다.

  • 0230분 음성데이터로 목소리 합성

    기존 음편합성 방식이 아닌 딥러닝 기반의 End-to-End 전이학습을 통해 적은 양의 학습 데이터로도 원하는 대상의 고품질의 음성합성이 가능합니다.

  • 03도메인 특화 한글 표기변환 기능 제공

    다양한 비 한글 표기에 대한 발음생성을 위해 비 한글 표기(숫자, 외래어,약어 등)와 영어 단어 발음기호 변환 기능을 제공하여 원활한 음성합성 서비스를 제공합니다.

  • 04원 클릭 통합 관리도구

    관리도구를 통해 쉽게 음성합성 모델 생성이 가능하며, 소규모의 데이터를 기존모델에 병합하는 전이학습까지 기능을 제공합니다.

VOICE STUDIO TOOL

음성 인식 및 합성 전문도구

VOICE STUDIO는 음성인식/합성 모델 구축부터 배포, 관리까지 음성 서비스 생성AI의 핵심 기능을 제공합니다.

  • 데이터 관리

  • 학습 관리

  • 검증 관리

  • 사전관리

  • 앤드 포인트 관리

  • 이력 관리

도구소개

  • 01음성인식 관리

    • 실시간 스트리밍 지원 음성인식엔진

      1. 스트리밍 트랜스포머 기반 실시간 음성인식 모델 지원
      2. 도메인 데이터를 통한 연결학습 지원
      3. 실시간 사용자 어휘 등록 기능
      4. 관리도구를 통한 음성인식 이력조회 관리 기능
      5. 음성인식 학습 데이터 및 음성인식 모델 관리
      6. 음성인식 모델 검증 기능
      7. 음성인식 서버 모니터링 및 자원관리 기능
  • 02음성합성

    • 음성합성 모델 생성과 소규모 데이터를 기존 모델과 병합하는 전이학습 기능 제공

      1. 질의응답세트 관리 기능
      2. JSON파일 내보내기/가져오기 기능
      3. 질의응답 재교육 기능
      4. 질문 추천 기능
      5. 유사질문 수동 등록 기능
      6. 질의문장 자동 등록 기능
  • 03음성전사

    • 도메인별 특화된 음성인식/합성 모델 구현을 위한 학습데이터 구축

      1. 작업 단계 통합 모니터링 기능
      2. 오디오 음성 파일 업로드 및 Pre-Text 생성 기능
      3. 도메인별 전사작업 세트 관리 기능
      4. 작업 담당자별 내 작업 관리 기능
      5. 작업 결과물 검수 및 결재처리 기능
      6. 사용자 권한관리를 통한 따른 작업자 권한 부여 기능

Success Story

  • AI 메타휴먼(METAHUMAN)

    LGU+ ‘TV 아이들나라’ AI프로젝트 디지털 휴먼 ‘AI가람이’

    디지털휴먼 가람이를 어린이용 정제된 컨텐츠를 학습시킨 AI와 연령 구분 없이 무분별한 영상 콘텐츠로 학습한 AI로 구분하여 두명의 AI아이를 구현 자연어처리(NLP), 음성합성, 음성인식 등 기술집약 도입효과

    아이들나라 광고보기
    • AI실험이라는 형식의 독창성, 공익적, 교육적 성과로 ‘2020 대한민국광고대상 수상’
  • AI 음성인식

    국회 인터넷 의사중계 사업 실시간 회의 AI 자막시스템 구축

    국회법 개정(2020. 12.22)에 따른 장애인 의정활동 접근성 강화를 위한 의회의사중계에 Al 음성인식 생중계 자막 시스템 시범 구축

    • 지능형 국회 구현 및 의정활동에 대한 국민의 정보 접근성 강화
  • 아웃바운드 AI음성봇

    콜센터 아웃바운드 AI음성봇 활용 업무 자동화

    아웃바운드 콜봇 구축을 통해 고객의 연체 자동 알림, 필수 고지안내, 수익증권 해피콜 등의 상담사 업무 자동화

    • 문의 상담의 질적 제고와 검증이 완료된 지식 정보 안내로 상담 품질 향상
  • AI음성봇

    1세대 고객응대 챗봇 고도화 딥러닝 기술 접목한 AI챗봇

    기존 운영중인 챗봇에서 미답변된 질문에 대해 MRC기술을 활용하여 답변 응대 고도화 및 콜센터 안내 멘트에 대해 음성합성을 이용한 자연스러운 발화 서비스 제공

    • 기존 답변이 어려웠던 질문에 대해 최적의 답변을 제공하여 고객에게 챗봇 활용도와 만족도를 동시에 높이고 이질감 없는 음성 서비스 제공
  • LG U+
    AI 메타휴먼(METAHUMAN)

    LGU+ ‘TV 아이들나라’ AI프로젝트 디지털 휴먼 ‘AI가람이’

    • AI실험이라는 형식의 독창성, 공익적, 교육적 성과로 ‘2020 대한민국광고대상 수상’
    아이들나라 광고보기
  • 국회사무처
    AI 음성인식

    국회 인터넷 의사중계 사업 실시간 회의 AI 자막시스템 구축

    • 지능형 국회 구현 및 의정활동에 대한 국민의 정보 접근성 강화
  • 키움증권
    아웃바운드 AI음성봇

    콜센터 아웃바운드 AI음성봇 활용 업무 자동화

    • 아웃바운드 콜봇 구축을 통해 고객의 연체 자동 알림, 필수 고지안내, 수익증권 해피콜 등의 상담사 업무 자동화
  • 요기요
    AI음성봇

    1세대 고객응대 챗봇 고도화 딥러닝 기술 접목한 AI챗봇

    • 기존 답변이 어려웠던 질문에 대해 최적의 답변을 제공하여 고객에게 챗봇 활용도와 만족도를 동시에 높이고 이질감 없는 음성 서비스 제공

Reference

  • 인공지능 기반 상담 부스

    신용회복위원회

    AI상담사 채무조정 민원상담 시스템 구축

  • 고객 상담 AI음성봇

    NH 농협은행

    국내 금융권 컨택센터 최초, 실시간 비대면 AI 콜봇 서비스

  • 아웃바운드 AI 음성봇

    NH 농협은행

    콜센터 아웃바운드 AI음성봇 활용 업무 자동화

  • 아웃바운드 AI 콜봇

    한국투자증권

    인공지능(AI)기반 상담 콜봇 및 직원용 업무 챗봇 시스템 구축

  • 인터넷의사 중계시스템

    대한민국 국회

    AI음성인식 국회 의사 생중계 자막시스템 구축

  • AI음성 민원안내 시스템

    대전광역시

    스마트 미러 AI음성인식 민원 안내 시스템 구축

  • AI휴먼 평양친구

    통일부

    북한정보 및 주민들의 말투, 억양 등 음성을 학습한 가상 평양사람

  • 비대면 민원처리 디지털 휴먼

    광주광역시

    광주시장 디지털 휴먼 구현 민원상담시스템 구축

  • 퇴행성뇌질환자 음성

    한국지능정보사회
    진흥원

    퇴행성 뇌질환 음성 데이터 수집을위한 AI학습데이터 구축 도구 공급

  • 주제별 음성데이터

    한국지능정보사회
    진흥원

    방송데이터 10,000시간 이상 회의 관련 음성 7,000시간 이상

  • 방송콘텐츠 대화체 AI데이터

    한국지능정보사회
    진흥원

    방송 콘텐츠 총 17,000 시간 음성전사 학습데이터 구축

  • 한국어 방언 AI 데이터 구축

    한국지능정보사회
    진흥원

    총 15,000시간, 총 250만 문장 지역별 방언 전사 학습데이터 구축