검색 결과

검색어를 입력하세요.

이미지넷

기술 > 인공지능 > 이미지넷 | 익명 | 2026-06-20 | 조회수 0

# 이미지넷 (ImageNet) **이미넷(ImageNet)**은 대규모의 고해상도 이미지 데이터셋과 해당 이미지에 대한 엄격한 레이블링을 제공하는 오픈 소스 프로젝트이자 관련 연구 커뮤니티입니다. 주로 컴퓨터 비전(Computer Vision) 분야의 알고리즘 개발, 평가, 그리고bench marking(벤치마킹)을 위해 사용되며, 현대 인공지능, 특히...

MultiNLI

기술 > 자연어처리 > 데이터셋 | 익명 | 2026-06-20 | 조회수 0

# MultiNLI **MultiNLI**(Multi-Genre Natural Language Inference)는 자연어 처리(NLP) 분야에서 널리 사용되는 대규모 텍스트 데이터셋으로, **자연어 추론(Natural Language Inference, NLI)** 과제를 평가하고 발전시키기 위해 설계되었습니다. 이 데이터셋은 스탠포드 대학교의 자연어 ...

캐글

기술 > 데이터과학 > 분석 | 익명 | 2026-06-20 | 조회수 0

# 캐글(Kaggle) **캐글(Kaggle)**은 데이터 과학, 머신러닝, 인공지능(AI) 분야에서 세계 최대 규모의 온라인 커뮤니티이자 플랫폼입니다. 2010년 이반 오스틴(Ivan Osuna), 로버트 머피(Robert Murphy), 애덤 아론슨(Adam Aronson)에 의해 설립되었으며, 2017년 구글(Google)에 인수되어 현재는 구글의 ...

XSum

기술 > 자연어처리 > 벤치마크 | 익명 | 2026-06-20 | 조회수 0

# XSum (Extreme Summarization) **XSum**은 자연어 처리(NLP), 특히 텍스트 요약(Text Summarization) 분야에서 널리 사용되는 대규모 엔드투엔드(End-to-End) 요약 벤치마크 데이터셋입니다. 2018년 옥스퍼드 대학의 NLP 연구팀에 의해 공개된 이 데이터셋은 기존 요약 데이터셋들이 가진 한계를 극복하기...

F1 score

과학 > 데이터과학 > 머신러닝 | 익명 | 2026-04-13 | 조회수 35

# F1 score ## 개요 **F1 score**(F1 점수)는 머신러닝과 데이터 과학 분야에서 분류 모델의 성능을 평가하는 데 널리 사용되는 지표입니다. 특히 **정밀도**(Precision)와 **재현율**(Recall) 사이의 균형을 중요시할 때 유용하며, 두 지표의 조화 평균(Harmonic Mean)으로 정의됩니다. F1 score는 불균형...

# 커뮤니티 기반 데이터 ## 개요 **커뮤니티 기반 데이터**(Community-based Data)는 특정 커뮤니티(온라인 커뮤니티, 오프라인 집단, 전문가 그룹 등)의 구성원들이 자발적으로 생성, 공유, 기여하는 정보를 의미합니다. 이러한 데이터는 전통적인 기관 중심의 데이터 수집 방식과는 달리, 분산되고 참여 기반의 특성을 가지며, 특히 **공개...

데이터셋

기술 > 데이터과학 > 데이터 준비 | 익명 | 2025-10-11 | 조회수 51

# 데이터셋 ## 개요 **데이터셋**(Dataset)은 데이터 과학 및 정보 기술 분야에서 분석, 모델링, 연구 등의 목적으로 사용되는 구화되거나 비구조화된 데이터의 집합을 의미합니다. 일반적으로 데이터셋은 테이블 형태로 구성되며, 행은 하나의 관측치 또는 샘플을, 각 열은 해당 샘플의 특성(변수)를 나타냅니다. 데이터셋은 머신러닝, 통계 분석, 데이...

데이터셋 구축

기술 > 데이터과학 > 데이터 준비 | 익명 | 2025-09-12 | 조회수 70

# 데이터셋 구축 ## 개요 데이터셋 구축(Data Set Construction)은 데이터 과학 프로젝트의 첫 번째이자 가장 중요한 단계 중 하나로, 분석, 모델링, 머신러닝 등의 작업을 수행하기 위해 필요한 데이터를 체계적으로 수집, 정제, 통합하고 구조화하는 과정을 의미합니다. 고품질 데이터셋은 정확한 인사이트 도출과 신뢰할 수 있는 예측 모델 개...