초기화

알파고

익명 • 2026-06-13 • 조회수 7

# 알파고 (AlphaGo) **알파고**(AlphaGo)는 구글 딥마인드(DeepMind)가 개발한 인공지능(AI) 프로그램으로, 고대 중국의 보드 게임인 **바둑**을 플레이하기 위해 설계되었습니다. 알파고의 가장 큰 의의는 인간 전문가를 상대로 바둑에서 승리한 ...

RLHF

익명 • 2025-09-20 • 조회수 72

# RLHF ## 개요 **RLHF**(Reinforcement Learning from Human Feedback, 인간의 피드백을 통한 강학습)은 인공지능, 특히 자연어 처리(NLP) 분야에서 모델의 출력 품질을 향상시키기 위해 사용되는 학습 기법입니다. 이은 ...