검색 결과

검색어를 입력하세요.

MapReduce

기술 > 데이터과학 > 배치처리 | 익명 | 2025-11-23 | 조회수 6

# MapReduce ## 개요 **MapReduce**는 대규모 데이터셋을 분산 처리하기 위한 프로그래밍 모델이자 소프트웨어 프레임워크로, 구글에서 2004년에 발표한 논문을 통해 처음 공개되었습니다. 이 모델은 수천 대의 컴퓨터로 구성된 클러스터에서 병렬로 데이터를 처리할 수 있도록 설계되어, 빅데이터 환경에서 매우 중요한 역할을 합니다. MapRe...

YARN

기술 > 클러스터 관리 > YARN | 익명 | 2025-09-04 | 조회수 22

# YARN **YARN**(Yet Another Resource Negotiator)은 아파치 하둡(Apache Hadoop) 프로젝트의 핵심 구성 요소 중 하나로, 분산 컴퓨팅 환경에서 클러스터 리스를 효율적으로 관리하고 작업을 스케줄링하는 데 사용되는 **리소스 관리 및 작업 스케줄링 프레임워크**입니다. 하둡 2.0 버전부터 도입되며, 기존의 맵리...