검색 결과

검색어를 입력하세요.

GPT-3.5

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2026-01-22 | 조회수 4

# GPT-3.5 ## 개요 GPT-3.5는 OpenAI에서 개발한 대규모 언어 모델(Large Language Model, LLM)로, GPT-3 이후의 개선 버전에 해당하는 모델군을 지칭합니다. 정식 명칭은 공개되지 않았으나, OpenAI의 API 및 제품에서 사용되는 모델 중 하나로, 특히 **ChatGPT의 초기 버전**에 기반을 두고 있습니다....

인간 피드백 수집

기술 > 인공지능 > 데이터 수집 | 익명 | 2025-09-22 | 조회수 40

인간 피드백 ## 개요**인간 피드 수집**(Human Feedback Collection)은 인공지능(AI) 시스템, 특히 머신러닝 모델의 성능 향상과 행동 조정을 위해 인간의 판단, 평가, 선택 등을 수집하는 과정을 말합니다. 이는 주로 강화학습 기반 모델(예: LLM, 로봇 제어 등)의 학습 데이터를 보완하거나, 모델의 출력 결과에 대한 질적 평가를...

RLHF

기술 > 인공지능 > 강화학습 | 익명 | 2025-09-20 | 조회수 33

# RLHF ## 개요 **RLHF**(Reinforcement Learning from Human Feedback, 인간의 피드백을 통한 강학습)은 인공지능, 특히 자연어 처리(NLP) 분야에서 모델의 출력 품질을 향상시키기 위해 사용되는 학습 기법입니다. 이은 인간이 모델의 출력 결과에 대해 선호도를 평가하고, 그 피드백을 기반으로 강화학습 알고리즘...