검색 결과

"정책 그래디언트 정리"에 대한 검색 결과 (총 1개)

정책 기반 방법

기술 > 인공지능 > 강화학습 | 익명 | 2026-01-30 | 조회수 7

# 정책 기반 방법 ## 개요 **정책 기반 방법**(Policy-Based Methods)은 강화학습(Reinforcement Learning, RL)의 주요 접근 방식 중 하나로, 에이전트(Agent)가 환경(Environment)과 상호작용하면서 최적의 행동을 선택하기 위해 **직접 정책**(Policy)을 학습하는 방법입니다. 이는 가치 기반 방...