검색 결과

"Hive"에 대한 검색 결과 (총 19개)

XSum

기술 > 자연어처리 > 데이터셋 | 익명 | 2025-12-10 | 조회수 3

# XSum ## 개요 **XSum**은 자연어처리(NLP) 분야에서 특히 **문서 요약**(text summarization) 연구에 널리 사용되는 영어 기반의 대규모 요약 데이터셋입니다. 이 데이터셋은 BBC 뉴스 기사를 원본 텍스트로, 기사의 핵심 내용을 담은 매우 짧은 요약문을 정답(label)으로 구성하고 있으며, **추출형 요약**(extra...

LaTeX

기술 > 문서작성 > 학술문서포맷 | 익명 | 2025-12-02 | 조회수 15

# LaTeX LaTeX(라텍 또는 라테크라고 발음)는 고품질의 문서, 특히 수학적·학술적 문서를 작성하기 위한 문서 준비 시스템(document preparation system)입니다. 텍스트와 수식, 도표, 참고문헌 등을 정교하게 배치할 수 있는 능력 덕분에 수학, 물리학, 컴퓨터 과학, 공학, 언어학 등 다양한 학문 분야에서 널리 사용되고 있습니다...

MapReduce

기술 > 데이터과학 > 배치처리 | 익명 | 2025-11-23 | 조회수 7

# MapReduce ## 개요 **MapReduce**는 대규모 데이터셋을 분산 처리하기 위한 프로그래밍 모델이자 소프트웨어 프레임워크로, 구글에서 2004년에 발표한 논문을 통해 처음 공개되었습니다. 이 모델은 수천 대의 컴퓨터로 구성된 클러스터에서 병렬로 데이터를 처리할 수 있도록 설계되어, 빅데이터 환경에서 매우 중요한 역할을 합니다. MapRe...

Google Cloud Storage

기술 > 스토리지 > 클라우드 스토리지 | 익명 | 2025-10-22 | 조회수 16

Google Cloud Storage Cloud Storage(GCS는 구글 클라우드 플폼(Google Cloud Platform, GCP)에서 제공하는성능, 확장성 있는 객체 기반 클라우드 스토리지 서비스입니다. 데이터 유형을 안전하고 효율적으로 저장, 관리, 공유할 수 있도록 설계되어 있으며, 기업, 개발자, 데이터 과학자들이 대용량 데이터를 처리하...

The DAO 해킹

기술 > 보안 > 보안 사고 | 익명 | 2025-10-11 | 조회수 16

# The DAO 해킹 ## 개요 **The DAO**(Decentralized Autonomous Organization) 해킹 201년 블록체인술 역사상 가장 주목은 보안 사고 중 하나로, 이더리움(Ethereum) 플랫폼 위에서되던 분산 자율 조직(The DAO)이 심각한 스마트 계약 취약점을 악용당해 약 360만 이더(ETH)가 탈취된 사건이다....

데이터셋

기술 > 데이터과학 > 데이터 준비 | 익명 | 2025-10-11 | 조회수 17

# 데이터셋 ## 개요 **데이터셋**(Dataset)은 데이터 과학 및 정보 기술 분야에서 분석, 모델링, 연구 등의 목적으로 사용되는 구화되거나 비구조화된 데이터의 집합을 의미합니다. 일반적으로 데이터셋은 테이블 형태로 구성되며, 행은 하나의 관측치 또는 샘플을, 각 열은 해당 샘플의 특성(변수)를 나타냅니다. 데이터셋은 머신러닝, 통계 분석, 데이...

Overleaf

기술 > 소프트웨어 > 웹 기반 편집기 | 익명 | 2025-10-07 | 조회수 14

# Overleaf ## 개요 **Overleaf**는 클라드 기반의시간 협업 웹 편기로, 주 **LaTeX**(텍) 문서를 작성하고 공유하는 데 특화된 플랫폼이다. 학술문, 보고서, 수학 공식, 기술 문서 등 정교한 문서 작성이 필요한 분야에서 널리 사용되며, 특히 연구자, 대학 교수, 대학원생 및 학생들에게 인기가 많다. Overleaf는 복잡한 L...

학습 데이터

기술 > 데이터과학 > 데이터 수집 | 익명 | 2025-10-02 | 조회수 19

# 학습 데이터 ## 개요 **학습 데이터**(Training Data)는신러닝(Machine Learning) 인공지능I) 모델을 훈련시키기 위해 사용되는 세트를 의미합니다. 이 데이터는델이 특정 작업(예: 이미지 분류, 자연 이해, 예측 등)을 수행할 수 패턴을 학습하는 데 핵심적인 역할을 합니다. 학습 데이터의 질과 양은 모델의 성능에 직접적인 영...

자연철학의 수학적 원리

출판 > 학술 자료 > 물리학 서적 | 익명 | 2025-09-26 | 조회수 23

자연철학의학적 원리## 개요 《연철학의학적 원리》라틴어: *Philosophiæ Naturalis Principia Mathematic*, 영어: *Mathematical Principles of Natural Philosophy*)는국의 과학자 아이작 뉴턴(Isaac Newton)이 687년에 출판한 과학 서적이며, 현대 물리학과 천문학의 기초를 마련한...

MQTT

기술 > 네트워크 > 무선 통신 프로토콜 | 익명 | 2025-09-21 | 조회수 23

# MQTT ## 개요 MQTT(** Queuing Telemetry**)는 경량의 **메시지 기반 무선 통신 프로토콜**로, 주로 **사물인터넷**(IoT), 센서 네트워크, 모바일 애플리케이션 등에서 네트워크 대역폭이 제한적이거나 장치의 처리 능력이 낮은 환경에서 사용된다. MQTT는 **TCP/IP 기반**으로 동작하며, **게시-구독**(Publ...

빅데이터 분석 플랫폼

기술 > 데이터과학 > 빅데이터 | 익명 | 2025-09-18 | 조회수 31

# 빅데이터 분석 플랫폼 ## 개요 빅데이터석 플랫폼은 대의 구조화, 반구조, 비구조화 데이터를 수집, 저장, 처리, 분석 시각화할 수 있도록 설계 소프트웨어 시스템 또는 통합 환경을 의미합니다. 현대 기업과 기관은 매일 페타바이트(PB) 단위의 데이터를 생성하며, 이러한 데이터를 효과적으로 활용하기 위해서는 고성능의 분석 인프라가 필수적입니다. 빅데이...

Hadoop HDFS

기술 > 데이터관리 > 분산 파일 시스템 | 익명 | 2025-09-18 | 조회수 28

# Hadoop HDFS ## 개요 **Hadoop HDFSHadoop Distributed File System)는파치 하둡pache Hadoop)로젝트의심 구성 요소 중 하나, 대용량 데이터를 분산 환경에서 안정적이고 효율적으로 저장하기 위한 분산 파일 시스템입니다. HDFS는천 대의 일반적인 상용 하드웨어로 구성된 클러스터에서 페타바이트(PB) 규...

SmartScreen

기술 > 보안 > 웹 보안 | 익명 | 2025-09-15 | 조회수 69

# SmartScreen ## 개요 **SmartScreen**은 마크로소프트(Microsoft에서 개발한 보안 기능으로, 주로 Windows 운영체제 및 Microsoft Edge 브라우저에 내장되어 사용자에게 악성 소프트웨어, 피싱 사이트, 신뢰할 수 없는 다운로드 등으로부터 보호하는 역할을 수행합니다. SmartScreen은 사용자의 온라인 활동 ...

실행 파일

기술 > 소프트웨어 개발 > 빌드 아티팩트 | 익명 | 2025-09-07 | 조회수 26

# 실행 파일 ## 개요 **실행 파일**(Executable File)은 컴퓨터 시스템에서 직접 실행 가능한 형태로 저장된 프로그램 파일을 의미합니다. 사용자가 프로그램을 실행 때 운영체제는 이 실행 파일을 로드하여 메모리에 적재하고, CPU가 명령어를 순차적으로 처리하도록 합니다. 실행 파일은 소프트웨어 개발 과정의 최종 산물 중 하나로, 빌드 과정...

YARN

기술 > 클러스터 관리 > YARN | 익명 | 2025-09-04 | 조회수 23

# YARN **YARN**(Yet Another Resource Negotiator)은 아파치 하둡(Apache Hadoop) 프로젝트의 핵심 구성 요소 중 하나로, 분산 컴퓨팅 환경에서 클러스터 리스를 효율적으로 관리하고 작업을 스케줄링하는 데 사용되는 **리소스 관리 및 작업 스케줄링 프레임워크**입니다. 하둡 2.0 버전부터 도입되며, 기존의 맵리...

Apache Spark

기술 > 데이터과학 > 데이터 처리 | 익명 | 2025-09-02 | 조회수 42

# Apache Spark ## 개요 Apache Spark는 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크. 2009년 UC 버클리의 AMPLab에서 개발을 시작했으며, 2010년에 오픈소스로 공되고 203년 Apache Software Foundation 인큐베이션 프로젝트로 채택된 이후, 빅데이터 처리 분야에서 가장 널리 사용되는 도구...

LaTeX

기술 > 문서작성도구 > LaTeX | 익명 | 2025-09-02 | 조회수 30

# LaTeX LaTeX(라텍)은 고품질의 문서를 작성하기 위한 문서 준비 시스템(document preparation system)으로, 특히 수학 공식, 학술 논문, 기술 문서, 책, 보고서 등을 제작하는 데 널리 사용됩니다. TeX 타이포그래피 시스템을 기반으로 하며, 고등 수학 기호와 복잡한 레이아웃을 정교하게 표현할 수 있는 능력 덕분에 자연과학...

Perl

기술 > 프로그래밍 > 언어 | 익명 | 2025-07-18 | 조회수 42

# Perl ## 개요 Perl은 1987년에 라리 월(Larry Wall)이 개발한 프로그래밍 언어로, 텍스트 처리와 시스템 관리에 특화된 고급 스크립팅 언어이다. 초기에는 UNIX 환경에서의 텍스트 분석을 위한 도구로 설계되었으나, 현재는 웹 개발, 네트워크 프로그래밍, 데이터 분석 등 다양한 분야에서 활용되고 있다. Perl은 유연한 문법과 강력한 ...