# 순환 신경망 (Recurrent Neural Network, RNN) ## 개요 **순환 신경망**(Recurrent Neural Network, 약자 **RNN**)은 인공 신경망의 한 종류로, 시계열 데이터나 연속된 데이터 시퀀스를 처리하는 데 특화된 아키텍처입니다. 기존 전진 신경망(Feedforward Neural Network)이 입력과 출...
검색 결과
"화자 인식"에 대한 검색 결과 (총 5개)
# PLP (Perceptual Linear Prediction) **PLP**(Perceptual Linear Prediction, 지각 선형 예측)은 음성 신호 처리 및 음성 인식 시스템에서 음성의 스펙트럼 특징을 추출하기 위해 널리 사용되는 알고리즘입니다. 1980년대 초 리처드 M. 젤링거(Richard M. Agerwala)와 리처드 M. 젤링거...
# 음성 신호 처리 음성 신호 처리(Voice Signal Processing)는의 음성을 전기적 신호로 변환, 이를 분석·변형·합성하여 다양한 음성 기반 기술에 활용하는 핵심 기술 분야입니다. 이는 음성 인식(S Recognition), 음성 합성(Text-to-Speech),성 강화(Noise Reduction), 화자 인식(Speaker Identi...
# 음성 인식 ## 개요 **음성 인식**(Speech Recognition)은 인간의성을 기계가 이해하고 텍스트 또는 명령어로 변환하는 인공지능 기술의 한 분야로, 머신러닝과 자연어 처리 기술을 기반으로 한다. 이 기술은마트폰, 스마트 스피커, 자동차 내비게이션, 콜센터 자동화 등 다양한 산업과 일상생활에 널리 활용되고 있다. 음성 인식 시스템은 음성...
시간 영역 정규 **시간 영역 정규**(Time Domain Normalization, T)는 음성식 시스템에서 음성 신호의 시간적 변동성을 보정하기 위한 전처리 기법 중 하나이다. 인간의 발화 속도는 상, 감정, 개인 차이 등에 따라 크게 달라질 수 있으며, 이로 인해 동일한 단어나 문장이라도 길이가 다르게 나타날 수 있다. 시간 영역 정규화는 이러한 ...