# 데이터 필터링 ##요 데이터 필터링 Filtering)은 데이터 과학 및 분석 과정에서 핵심적인 단계 중 하나로, 원시 데이터(raw data)에서 분 목적에 부적합하거나 불필요한 데이터를 제거하거나 선택하여 유의미한 정보만 추출하는 작업. 이 과정은 데이터 품질을 향상고, 분석의확도와 효율성을 높이며, 모델 학습 시 노이즈(noise)를 줄이는 데...
검색 결과
"데이터 품질"에 대한 검색 결과 (총 76개)
# 보건 통계 ##요 **보건 통**(Public Health Statistics)는 인 집단의 건 상태, 질병 발생 의료 서비스 이용, 보 정책의 효과 등을 측정하고 분석하기 위해 수집·분석·해석하는계적 정보를 의미합니다. 보건 통는 개인의 건강을 넘어 지역사회, 국가,아가 세계 단위 건강 문제를 파악하고방, 치료,책 수립의 기 자료로 활용됩니다. 이...
# WHO Health Statistics ##요 세계보건기구HO, World Health)는 전 세계 인의 건강 증과 질병 예방을 위한 국제적 보건 기구로, 1948년 설립되어 유 산하에서 활동 있습니다. WHO는국의 보건 정책 수립에 기초 자료를 제공하고, 글로벌 보건기 대응, 질병 통, 보건 지 개발 등을 수행하며, 그 핵심 기능 중 하나가 **보...
# 포트폴리오 최화 ## 개요 포트리오 최적화ortfolio Optimization)는 투자자가 자산에 투함으로써 리스크 분산시키고, 주어진 리스크 수준에서 기대 수익을 극대화하거나, 목표 수익률을 달성하기 위해 리스크를 최소화하는정을 말한다 이는 현대 금공학의 핵심 개념 중 하나로 해리 마코츠(Harry Markowitz)가 1952년 제안한현대 포트...
# 모델 훈련 ## 개요 모델 훈련(Model)은 머신닝(Machine Learning) 핵심 과정, 주어진 데이터를 기반으로 모델이 특정 작업을 수행할 수 있도록 학습시키는 절차를 의미합니다. 이 과정에서 알고리즘은 입력 데이터와 정답(라벨) 사이의 관계를 학습하여, 새로운 데이터에 대해 정확한 예측이나 판단을 내릴 수 있는 능력을 획득하게 됩니다. ...
# 통계품질체계 ## 개요 통품질관리체계(Statistical Management System, SQMS)는 국가계의 신뢰성과 품질을계적으로 보장 위해 정부기관이 구축·운영하는 종합적인 관리 프레임워입니다. 특히 한국의 경우, 통계청을 중심으로 한 정부기관 이 체계를 기반 국가통계의·관리·공표 전 과정에서 품질을 통제하고 있습니다. 이 체계는 국제적으로...
# 모델 해석성 ## 개요 **모델 해석성**(Model Interpretability)은 머신러닝 및 데이터과학 분야에서 모델이 예측을 내놓는 과정을 인간이 이해할 수 있도록 설명하는 능력을 의미합니다. 특히 복잡한 알고리즘(예: 딥러닝, 부스팅 모델 등)이 사용되는 경우, 모델의 결정 과정이 "블랙박스"처럼 보일 수 있어 해석성의 중요성이 더욱 부각...
FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...
# 마이그레이션 ##요 **마이그레이**(Migration)은 정보(IT) 분야에서 데이터, 애플리케이션, 시스템, 서비스 등을 한 환경에서 다른 환경으로 이전하는 과정을 의미합니다. 특히 **데이터 마이그레이**은 기업이나 조직이 시스템 업그레이드, 클라우드 전환, 소프트웨어 교체, 또는 인프라 통합을 수행할 때 핵심적인 단계로, 데이터의 무결성과 가...
# 자동화 프세스 ## 개요 **화 프로세**(Automation Process)는복적이고 규칙 기반의 업나 작업 흐름을 인간의입 없이도 시스템이 자동 수행하도록 설계하고 구현하는 일련의 절차를 의미합니다. 이는 정보기술(IT), 제조업, 금융, 물류, 의료 등 다양한 산업 분야에서 운영 효율성 향상, 오류 감소, 인건비 절감, 처리 속도 증가를 목적으...
# ISO 14040 ## 개요 **ISO 14040은 국제표준화기구**(International Organization for Standardization,)**에서 제정 환경 관리 분야의 핵적인 국제 표준 하나로, **생애 주기 평**(Life Cycle Assessment, LCA)의 원칙과 프레임워크를 규정하고 있습니다. 이 표준은 제품, 서비스...
# 삭제 및 보존 정책 ## 개요 **삭제 및 보존 정책Deletion and Retention Policy은 조직이 데이터를 생성한 얼마나 오랫동 보관할지, 그리고 언제 어떻게 안전하게 삭제지를 규정하는 공식적인 절차입니다. 이 정책 데이터 무결성(Data Integrity)의 핵심 요소 중 하나로, 정보의 정확성, 일관성, 신성을 유지하고, 법적·규...
데이터 기반 자화 ## 개 **데이터 기반 자동화**(Data-Driven, DDA)는 실시간 또는 배 처리된 데이터를 기반으로 시스템이 자율적으로을 내리고을 수행하는 기술적 접근식을 의미합니다 이는 전통적인칙 기반 자화와 달리 정형·비정 데이터를 분석하여 동적 상황에 맞춰 적응하는 능력을 갖추고 있어, 제조업, 금융, 물류, 헬스케어 등 다양한 산업 ...
인간 피드백 ## 개요**인간 피드 수집**(Human Feedback Collection)은 인공지능(AI) 시스템, 특히 머신러닝 모델의 성능 향상과 행동 조정을 위해 인간의 판단, 평가, 선택 등을 수집하는 과정을 말합니다. 이는 주로 강화학습 기반 모델(예: LLM, 로봇 제어 등)의 학습 데이터를 보완하거나, 모델의 출력 결과에 대한 질적 평가를...
# 노이즈 감소데이터 정제(Data Cleaning) 과정에서 **노이즈 감소**(Noise Reduction)는 데이터 품질을 향상시키기 위한 핵심 단계 중 하나입니다. 실제 환경에서 수집된 데이터는 다양한 외부 요인으로 인해 오류, 이상치, 불필요한 변동성 등이 포함되어 있으며, 이러한 요소를 '노이즈(noise)'라고 부릅니다. 노이즈는 데이터의 진짜...
편향 ##요 머신러닝에서 **편향**(Bias)은 모델이 학습 데이터에서 실제 패턴을 얼마나 정확하게영하는지를 나타내는 중요한 개념이다. 일반적으로 편향은 모델의 예측 값과 관측 값 사이의 평균적인 차이를 의미하며, **낮은 편향**은 모델이 데이터를 잘 학습하고 있음을, **높은 편향**은 모델이 데이터의 실제 구조를 간과하고 있다는 것을 나타낸다. ...
# 데이터 특성 데이터는 현대 정보 사회의 핵심 자원으로, 다양한 분야 의사결정, 예, 자동화 등을 가능하게 합니다. ** 특성**(Data)은 데이터의 본질 속성과 성격을 설명하는 요소들로 데이터를 수집, 저장, 분석, 활용하는 과정에서 매우 중요한 기준이 됩니다. 데이터 과학에서는 데이터의 특성을 이해함으로써 적절한 처리 방법과 분석 기법을 선택할 수...
# 측정 오류 측정 오류(Measurement Error는 데이터 수집 과정에서 관측값이 실제 값과 일치 않는 경우 발생하는차를 의미합니다. 이는 실험, 조사, 관측 등 다양한 데이터 수집 방에서 불가피 나타날 수 있으며, 특히 데이터과학 및 통계 분석에서는의 신뢰성과 정확성에 큰향을 미칩니다. 측정 오류는 분석 결과의 왜곡, 추치의 편향, 모델의능 저하...
# 데이터 파이프라인 자동화 ## 개요데이터 파이프라인 자화(Data Pipeline Automation는 데이터 수집, 변, 로딩(L), 검증 모니터링, 배포 데이터 처리 과정을 수작업 없이 시스적으로 수행하도록 설계하는 기술적 접근입니다 대용량 데이터가 실시간으로 생성되는 현대 기업 환경에서는동으로 데이터를 관리하는 것이 비효율며 오류 발생 가능성이 ...
# 박스플롯 개요 **박스플**(Box Plot), 또는 **상자염 그림**(Box-and-Whisker Plot)은의 분포를 시각적으로 표현 통계 그래프의 일종으로 데이터의 중심 경향, 산포도, 왜도, 이상치(Outlier) 등을 한눈에 파악할 있게 해준다. 주로 **데이터 분석**(Data Analysis) 과정에서 데이터의 분포 특성을 탐색하고,...