검색 결과

"Mel-Spectrogram"에 대한 검색 결과 (총 3개)

카테고리:

DeepSpeech

기술 > 음성 인식 > 모델 아키텍처 | 익명 | 2025-12-07 | 조회수 49

# DeepSpeech ## 개요 **DeepSpeech**는 머신러닝 기반의 오픈소스 **음성 인식**(Speech-to-Text) 엔진으로, 원래 구글의 연구팀에서 개발한 **딥러닝 음성 인식 기술**(Deep Speech)을 기반으로 하며, 현재는 **Mozilla Foundation**에서 주도적으로 개발 및 유지보수 중인 프로젝트이다. Deep...

#DeepSpeech #음성 인식 #엔드-투-엔드 #LSTM #CTC #Mozilla #오픈소스 #로컬 실행 #다국어 지원

음향 모델

기술 > 음성 인식 > 음향 모델 | 익명 | 2025-09-29 | 조회수 43

# 음향 모델 ## 개 **음향 모델Acoustic Model) 음성 인식 시템의 핵심 요소 중 하나, 입력된 음성 신호를 음소(phoneme) 소리 단위 변환하는 역할을 수행한다. 음성 인식은 인간의 언를 기계가할 수 있도록 음성를 텍스트로환하는 기술, 이 과정에서향 모델은 소리와 언 단위 사이의 매을 담당한다 즉, 사람이 말한리를 듣고 "어떤 음들이...

#음향 모델 #음성 인식 #딥러닝 #HMM #음소 #CTC #자기지도 학습

시간 영역 정규화

기술 > 음성 인식 > 정규화 기법 | 익명 | 2025-09-14 | 조회수 72

시간 영역 정규 **시간 영역 정규**(Time Domain Normalization, T)는 음성식 시스템에서 음성 신호의 시간적 변동성을 보정하기 위한 전처리 기법 중 하나이다. 인간의 발화 속도는 상, 감정, 개인 차이 등에 따라 크게 달라질 수 있으며, 이로 인해 동일한 단어나 문장이라도 길이가 다르게 나타날 수 있다. 시간 영역 정규화는 이러한 ...

#시간 영역 정규화 #동적 시간 왜곡 #음성 인식 #DTW #정규화 기법