검색 결과

검색어를 입력하세요.

Hadoop HDFS

기술 > 데이터관리 > 분산 파일 시스템 | 익명 | 2025-09-18 | 조회수 26

# Hadoop HDFS ## 개요 **Hadoop HDFSHadoop Distributed File System)는파치 하둡pache Hadoop)로젝트의심 구성 요소 중 하나, 대용량 데이터를 분산 환경에서 안정적이고 효율적으로 저장하기 위한 분산 파일 시스템입니다. HDFS는천 대의 일반적인 상용 하드웨어로 구성된 클러스터에서 페타바이트(PB) 규...

데이터 레이크

기술 > 데이터관리 > 데이터 저장 | 익명 | 2025-09-12 | 조회수 23

# 데이터 레이크 ## 개요 **데이터 레이크**(Data Lake)는 기업이나 조직이 다양한 출처에서 생성되는 대량의 구조화된, 반구조화된, 비구조화된 데이터를 원시 형태로 저장할 수 있는 중앙 집중식 저장소입니다. 전통적인 데이터베이스나 데이터 웨어하우스와 달리, 데이터 레이크는 데이터를 저장하기 전에 사전에 스키마를 정의할 필요가 없으며, 분석 시...