화자 분리·식별로 데이터 가치를 높이는 AI 음성 분석 솔루션
사이냅 보이스애널라이저는 많은 양의 음성 데이터를 빠르게 처리하고,
각 화자를 정확히 분리, 식별하여 데이터 가치를 높이는 음성 데이터 분석 솔루션입니다.
특장점
정확한 음성 분석, 대량 음성 데이터 배치 처리, 다중 화자 분리, 화자 인식으로
음성데이터 분석 효율 극대화
01.
신뢰할 수 있는 음성 인식 품질
· CER 4%, 최신 음성 인식 모델 기반으로 높은 정확도 제공
· 발화 맥락을 고려한 자연스러운 문장 처리
· 녹음 환경과 음질 편차가 다른 데이터에서도 안정적 성능 제공
02.
20배 빠른 처리 속도, 더 빠른 실시간 체감 속도
· 재생시간 대비 20배 빠른 성능 제공
· 전체 파일 전사 완료 전 실시간 전사 내용 우선 사용 가능
03.
화자-내용-시간 파악으로 분석 가치 극대화
· 음성 간 차이를 인식하여 화자 분리 지원
· 특정 화자의 음성 특징으로 화자 인식 제공
· 각 발화의 시작과 끝 시간을 정확히 표시
04.
한국어 특화 · 다국어 지원
· 한국어 인식 품질 최적화, 국내 환경에 특화된 정확도 제공
· 사투리 등 다양한 발화에서도 안정적 인식
· 영어·러시아어·베트남어·일본어·중국어 등 외국어 안정적 지원
05.
다양한 입력 포맷 지원
· WAV, MP3, MP4, FLAC 등 다양한 오디오·영상 포맷 인식 지원
06.
손쉬운 연동
· REST API 제공으로 시스템 적용 및 통합 편의성 보장
주요 기능
맥락 이해 기반 음성 분석
· 최신 AI 음성 인식 모델 활용
· 맥락 이해 기반의 정확한 텍스트 변환
초고속 ASR 처리 시스템
· 대규모 데이터 신속 처리
· 스트리밍 ASR 방식으로 실시간 변환 지원
발화 기반 타임라인 정보 제공
· 단순 문장 단위가 아닌 단어 단위의 발화 시간 생성
· 시간 별 검색·타임라인 분석 효율성 향상
화자 분리
· 다중 화자 분리 지원
· 복잡한 상황에서 발화자별 정리
화자 인식
· 화자 음성 벡터 DB 구축 지원
다국어 언어 지원
· 주요 언어 지원
(영어, 러시아어, 베트남어, 일본어, 중국어 등)
· 다국어 혼재 환경에서도 안정적인 인식 성능 보장
적용 분야
수사/증거분석 효율화
대량 음성 증거 파일 고속 분석
화자별 발화
구간 탐지
화자 식별을 이용한 분석 편의 제공
의회 회의
발화 기반 타임라인
화자 분리로
회의 속기록 작성
내용 분석 편의 제공
보이스피싱 데이터 분석
내용 특정 키워드
특정 발화시간 확인
키워드 추적으로 분석 편의 기능 제공
콜센터 데이터 분석
감성 분석을 통해 고객의 부정
불만 구간 추적, 상담의 만족도 평가
실시간 처리 내용 상담에 활용
제원
|
하드웨어 |
• CPU : Intel i7 이상의 x86 기반 CPU 아키텍처 • Memory : 최소 16GB 이상, 권장 32GB 이상 • Storage(HDD) : 13GB 이상 • GPU : CUDA 코어가 탑재된 데이터센터 운영 가능한 GPU 보드 권장 (최소 10GB 이상 메모리) • 멀티 GPU 환경 : 다중 GPU 사용 시 최소 16코어 이상의 CPU, 32GB 이상의 메인 메모리 |
|
지원 OS |
x86 계열의 64bit 리눅스 시스템 8.0 이상 • Ubuntu – 22.04 x86_64 • RedHat – CentOS 8, 9 x86_64 |
|
제품구성 |
• 라이선스, VoiceAnalyzer엔진, 메뉴얼 |
|
지원 포맷 |
• WAV – Waveform Audio File Format • MP3 – MPEG-1 Audio Layer III • M4A – MPEG-4 Audio • FLAC – Free Lossless Audio Codec • MP4 – MPEG-4 Part 14 • MPEG – Moving Picture Experts Group • MPGA – MPEG Audio • Ogg – Ogg Vorbis • WebM – WebM Audio/Video 상단에 나열된 포맷 외에도, FFmpeg에서 지원하는 다양한 오디오/비디오 포맷들을 추가로 지원 |