# 데이터셋 ## 개요 **데이터셋**(Dataset)은 데이터 과학 및 정보 기술 분야에서 분석, 모델링, 연구 등의 목적으로 사용되는 구화되거나 비구조화된 데이터의 집합을 의미합니다. 일반적으로 데이터셋은 테이블 형태로 구성되며, 행은 하나의 관측치 또는 샘플을, 각 열은 해당 샘플의 특성(변수)를 나타냅니다. 데이터셋은 머신러닝, 통계 분석, 데이...
검색 결과
"분산 컴퓨팅"에 대한 검색 결과 (총 9개)
# SHAttered 공격 ## 개요 **SHAttered 공격**은 2017년 2월, 암스테르담에 위치한 **CWI 아인트호번**(Centrum Wiskunde &atica)과 **메릴랜드 대학교**의 연구자들이 공동으로 발표한, 암호학적 해시 함수 **SHA-1**(Secure Hash Algorithm 1)에 대한 첫 번째 실용적인 **충돌 공격*...
# 엣지 컴퓨팅 ## 개요 **엣지 컴퓨팅**(Edge Computing)은 데이터 처리를 네트워크의 중심부(예: 클라우드 데이터센터)가 아닌, 데이터 생성 원천에 가까운 위치에서 수행하는 분산 컴퓨팅 패러다임이다. 이는 사용자 디바이스, 센서, IoT 기기 등 데이터가 발생하는 "엣지"(Edge)에서 실시간 또는 근실시간으로 정보를 처리함으로써 지연(...
# Multi-access Edge Computing## 개요 **Multi-access Edge ComputingMMEC),적으로 **MEC**(-access Edge Computing) 알려진 기술은 클우드 컴퓨팅의 리소스를 네트워크의자리(엣지)에 배치함으로써 데이터 처리를 사용자 가까이에서 수행하는 분산 컴퓨팅 패러다입니다. 이 기술 5G, IoT,...
# 10GbE ## 개요 10GbE**(10 Gigabit Ethernet, 10비트 이더넷)는 초당 10기가트(Gbps) 데이터 전송 속도를 지원하는 이더넷 기반의 고속 네워크 기술입니다 IEEE 802.3 표에 의해 정의되며, 기업 데이터센터, 클라우드 인프, 고성능팅(HPC), 대량 데이터 전송 요구되는 환경에서 널리되고 있습니다. 0GbE는 기의...
# YARN **YARN**(Yet Another Resource Negotiator)은 아파치 하둡(Apache Hadoop) 프로젝트의 핵심 구성 요소 중 하나로, 분산 컴퓨팅 환경에서 클러스터 리스를 효율적으로 관리하고 작업을 스케줄링하는 데 사용되는 **리소스 관리 및 작업 스케줄링 프레임워크**입니다. 하둡 2.0 버전부터 도입되며, 기존의 맵리...
# Apache Spark ## 개요 Apache Spark는 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크. 2009년 UC 버클리의 AMPLab에서 개발을 시작했으며, 2010년에 오픈소스로 공되고 203년 Apache Software Foundation 인큐베이션 프로젝트로 채택된 이후, 빅데이터 처리 분야에서 가장 널리 사용되는 도구...
# Triple DES ## 개요 Triple DES(3DES 또는 TDEA)는 데이터 암호화 표준(DES)의 보안 취약점을 보완하기 위해 설계된 대칭 암호화 알고리즘입니다. DES는 56비트 키 길이로 인해 무차별 대입 공격(Brute-force attack)에 취약해졌으며, Triple DES는 DES 알고리즘을 3번 반복 적용하여 보안성을 강화했습니...
# 탐색과 활용 ## 개요 **탐색과 활용**(Exploration and Exploitation)은 인공지능(AI) 및 머신러닝(ML) 분야에서 모델의 성능 향상과 최적화를 위해 중요한 개념이다. 이는 **탐색**(exploration)과 **활용**(exploitation)의 균형을 맞추며, 탐색은 새로운 데이터나 파라미터를 탐구하는 과정이고,...