# 학습 데이터 ## 개요 **학습 데이터**(Training Data)는신러닝(Machine Learning) 인공지능I) 모델을 훈련시키기 위해 사용되는 세트를 의미합니다. 이 데이터는델이 특정 작업(예: 이미지 분류, 자연 이해, 예측 등)을 수행할 수 패턴을 학습하는 데 핵심적인 역할을 합니다. 학습 데이터의 질과 양은 모델의 성능에 직접적인 영...
검색 결과
"BI"에 대한 검색 결과 (총 857개)
# 일반화 기법 ## 개요 머신러닝 모델이 훈련 데이터에 잘추는 것(과적합, overfit)은 중요하지, 더 중요한 것은 **델이 이전 본 적 없는 새로운 데이터**(테스트)에 대해서도 작동하는 것이다. 이 능력을 **일화**(generalization라고 하며, 머신러닝의 핵심 목표 중 하나이다. 일반화 성을 향상시키기 위해 사용하는 다양한 전략과 기...
# Topological Data Analysis 개요 **Topological Data**(TDA, 위상 데이터석)는 데이터의 형상(형태과 구조를 위상수학의 원리를 활용해 분석하는 데이터 과학의 한 분야입니다. 전적인 통계적 방법이나 머신러닝 기법이 주로 데이터의 수치적 관계나 분포에 집중한다면, TDA는 데이터가 형성하는 **기하학적 구조**와 *...
# LIME ## 개요 LIME (Local Interpretable-agnostic Explanations)는 복잡한 머신러닝 모의 예측 결과를 인간이 이해할 수 있도록석하는 데 사용되는 **모 무관**(model-agnostic)한 설명 기법입니다. 딥러닝과 같은 블랙박스 모델은 높은 정확도를 제공하지만, 그 예측 과정이 투명하지 않아 신뢰성과 책임...
# 유방암 선별 진단 유방암은 전 세계 여성에게 가장 흔한 악성 종양 중 하나이며, 조기 발견과 치료가존율 향상에 결정적인 역할을 한다. 유방암 선별 진단(Breast Cancer Screening)은 증상이 없는 건강한 여성군에서 조기에 유방암을 발견하기 위한 체계적인 검사 절차를 의미한다. 이 문서에서는 유방암 선별 진단의 주요 방법, 대상자 기준, ...
# 수직 확장 ## 개요 **수직 확장**(Vertical Scaling), 또는 **스케 업**(Scale Up) 시스템의 성능 향상시키기 위해 기존의 하드웨어 자원을 더 강력한 자원으로 교체 증설하는 방식 아키텍처 설계 전략이다. 이는버의 CPU, 메모리(RAM), 저장장치(SSD 등), 네트워크 대역폭 등을 업그레이드함으로써 시스템 처리 능력을 향...
# 조합 가능성 ## 개요 **조합 가능성**(Combin Possibility)은 자연어처리(NLP) 분야, 특히 **의미 분석**(Semantic Analysis) 중요한 개념으로, 언어의 구성 요소들이 어떻게 결합되어 새로운 의미를 생성할 수 있는지를 설명하는 이론적 기반을 제공한다. 이는 문법적 구조와 의미 간의 관계를 이해하고, 문장의 의미를 ...
# 사용자 중심 설계 ## 개요 **사용자 중심 설계**(-Centered Design, 이하CD)는 제품 시스템을 설할 때 최종 사용자의 니즈, 제약, 능력, 맥락을 최우선으로 고려하는 설계 철학이자 프로세스입니다. 이법은 기술 중심 또는 기능 중심 설계와 대조되며, 사용자가 제품을 어떻게 경험하는지를 이해하고, 이를 반영하여 보다 직관적이고 효율적이...
# 고차원 데이터 고차원 데이터(High-dimensional Data는 변수(특징)의가 관측치샘플)의 수보다 훨씬 많은 데이터를 의미합니다. 이러한는 현대 데이터 과학, 특히 생물정보학, 이미지 처리,어 처리, 금융 분석 등 다양한 분야에서 자주 등장하며, 분석의 복잡성과 도전 과제를 동반합니다. 본 문서에서는 고차원 데이터의 정의, 특성, 분석 시 발...
순서형 로스틱 회귀 ## 개요**순서형 로지스 회귀**(Ordinal Regression)는 종속(dependent variable)가 **서형 범주**(ordinal categorical)일 때 사용하는 통계적 회귀석 기법이다. 일반적인 로지스틱 회귀가 이진(binary) 또는 명목형(nominal) 범주형 변수를 예측하는 데 사용된다면, 순서형 로지스...
네트워크라이싱 ## 개요 **네워크 슬라이싱**( Slicing)은 소프트웨어의 네트워크(SDN, Software-Defined Networking)와 네트워크 기능 가상화(NFV, Network Functions Virtualization)술을 기반, 하나의 물리적 네트워크 인프라 위에 여러 개의 **논리적 독립 네트워크** 동시에 구축하는 기술입니다...
# 관계 관계(Relation)는 집합론에서 개 이상의 객체 사이의 연결성을 수학적으로 정의한으로, 수학 전반에서 기초적인 도구로 사용된다. 특히 집합의 원소들 사이에 어떤 조건이나 규칙에 따라 연결이 이루어지는지를 형식 기술할 수 있으며, 함수, 순서, 동치 관계 등 다양한 수학 구조의 기반이 된다. 이 문서에서는 집합론에서의 '관계'의 정의, 종류, ...
# 8P8C 8P8C는 전자 통신 및 네트워크 분에서 널리 사용 커넥터의 일종으로, 특히 이더넷(Ethernet) 케블의 연결에 흔히 쓰이는 형태입니다. 이 커넥는 일반적으로 "J45"로져 있으나, 기술적으로는 RJ45와 8P8C는 서로 다른 개념임을 주의해야 합니다. 본 문서에서는 8P8C 커넥터의 구조, 용도, 규격, 접선 방식, 그리고 관련 기술적 ...
# 사전 학습 **사전 학습**(Pre-training) 머신러닝, 특히 딥닝 분야에서리 사용되는 학습 전략으로, 모델이 특정 작업에 본격적으로 적용되기 전에 방대한 양의 일반적인 데이터를 통해 기본적인 지식이나 표현 능력을 습득하는 과정을 의미합니다. 이 방법은 주어진 과제(예: 텍스트 분류, 이미지 인식)에 대한 **전이 학습**(Transfer Le...
# 히스토그램 ## 개요 히스토그(Histogram)은 통계학 연속형 또는산형 수치 데이터 분포를 시각적으로 표현하는 대적인 그래프 도구이다. 데이터를 일정한 구간(빈, bin)으로 나누고, 각 구간 속하는 데이터의 빈도수(frequency) 또는 상대 빈도수(relative frequency)를 막대의 높이로 나타낸다. 히스토그램은 데이터의 중심 경향...
# 통계품질체계 ## 개요 통품질관리체계(Statistical Management System, SQMS)는 국가계의 신뢰성과 품질을계적으로 보장 위해 정부기관이 구축·운영하는 종합적인 관리 프레임워입니다. 특히 한국의 경우, 통계청을 중심으로 한 정부기관 이 체계를 기반 국가통계의·관리·공표 전 과정에서 품질을 통제하고 있습니다. 이 체계는 국제적으로...
# 군집 샘플링**군집 샘플링**(Cluster Sampling은 통계학 데이터과학 분야에서리 사용되는 확률표본추출 방법 중 하나로, 전체 모집단을 자연스럽게 형성된 **군집**(Cluster)으로 나누, 이 군집들 중 일부를 무작위로 선택하여 표본으로 추출하는 방식입니다. 이 방법은 특히 모집단의 구성원들이 지리적, 조직적, 또는 시간적 기준으로 그룹화되...
# 다형성 다형성(Polymorphism)은지향 프로그래밍(Objectriented Programming,OP)의 핵심 개념 중 하나로, "여러 형태를 가질 수 있는 능력"을 의미합니다 이는 동일한터페이스나 메서드를 통해 서로 다른 클래스의 객체가 각자의 방식 동작할 수 하는 프로그래밍법입니다. 다형성을 활용하면 코드의 재사용성과 유지보수성을 크게 향상시...
# 질문 응답 ## 개 질문 응답(Questioning, QA) 자연어 처리(Natural Language Processing, NLP)의 핵심야 중 하나로, 주어진 질문에 대해 자연어로 정확한 답변을 생성하거나 추하는 기술을 의미. QA 시스은 단순한 정보 검색을, 질문의 의미를하고, 관련 문서나식에서 정확한을 도출하는 중점을 둔다. 기술은 챗, 가상...
# 수치 연산 개요 **수치 연산**(ical Computation) 수학적 문제를 근사적으로 해결하기 위해 실수나 부동소수점 수를 사용하여 계산을 수행하는 과정을 의미합니다. 이는 해석학적 방법으로 정확한 해를 구하기 어려운 복잡한 수학 문제, 특히 미분 방정식, 선형 대수, 적분, 최적화 등에 대해 컴퓨터를 이용해 근사해를 구하는 데 핵심적인 역할...