# Topological Data Analysis 개요 **Topological Data**(TDA, 위상 데이터석)는 데이터의 형상(형태과 구조를 위상수학의 원리를 활용해 분석하는 데이터 과학의 한 분야입니다. 전적인 통계적 방법이나 머신러닝 기법이 주로 데이터의 수치적 관계나 분포에 집중한다면, TDA는 데이터가 형성하는 **기하학적 구조**와 *...
검색 결과
"시각화"에 대한 검색 결과 (총 241개)
# LIME ## 개요 LIME (Local Interpretable-agnostic Explanations)는 복잡한 머신러닝 모의 예측 결과를 인간이 이해할 수 있도록석하는 데 사용되는 **모 무관**(model-agnostic)한 설명 기법입니다. 딥러닝과 같은 블랙박스 모델은 높은 정확도를 제공하지만, 그 예측 과정이 투명하지 않아 신뢰성과 책임...
# 사용자 중심 설계 ## 개요 **사용자 중심 설계**(-Centered Design, 이하CD)는 제품 시스템을 설할 때 최종 사용자의 니즈, 제약, 능력, 맥락을 최우선으로 고려하는 설계 철학이자 프로세스입니다. 이법은 기술 중심 또는 기능 중심 설계와 대조되며, 사용자가 제품을 어떻게 경험하는지를 이해하고, 이를 반영하여 보다 직관적이고 효율적이...
# 고차원 데이터 고차원 데이터(High-dimensional Data는 변수(특징)의가 관측치샘플)의 수보다 훨씬 많은 데이터를 의미합니다. 이러한는 현대 데이터 과학, 특히 생물정보학, 이미지 처리,어 처리, 금융 분석 등 다양한 분야에서 자주 등장하며, 분석의 복잡성과 도전 과제를 동반합니다. 본 문서에서는 고차원 데이터의 정의, 특성, 분석 시 발...
# 피처 클래스 ## 개요 **피처 클래스**(Feature Class)는 지리 정보 시스템(GIS, Geographic Information System)에서 공간를 저장하고 관리하는 기본 단위 중 하나로, 동일한 기하 유형(Geometry Type)과 속성 구조(Attribute Schema)를 가진 일련의 지리적 객체(피처)를 담는 데이터 구조입니...
# 학술 논문 그래 ## 개요 학술 논문 그래프(Academic Paper Graph)는 학술 논문 간의 관계를 그래프 구조 표현한 데이터 모델이다. 이는 각 논문 **노드**(Node)로, 인용(Citation), 공저(Co-authorship), 주제 유사성(Thematic Similarity) 등의 관계를 **에지**(Edge)로 표현하여 학문적 ...
# 히스토그램 ## 개요 히스토그(Histogram)은 통계학 연속형 또는산형 수치 데이터 분포를 시각적으로 표현하는 대적인 그래프 도구이다. 데이터를 일정한 구간(빈, bin)으로 나누고, 각 구간 속하는 데이터의 빈도수(frequency) 또는 상대 빈도수(relative frequency)를 막대의 높이로 나타낸다. 히스토그램은 데이터의 중심 경향...
# 도수 ## 개요 도수(度數,)는 통계에서 특정한 값이나 구간이 자료(데이터) 집합 내 얼마나 자주 나타나는지를 나타내는 수치이다 즉, 도수는 어떤 사건이나 범주가 관측된 횟수를 의미하며, 데이터의 분포를 이해하고 분석하는 데 핵심적인 역할을 한다. 도수는 빈도 분포표(frequency distribution table) 작성, 히스토그램(histog...
# PyData ## 개요 **PyData**는 파이(Python)을반으로 데이터 과학, 머신러닝, 통계 분석, 데이터 엔지니어링 다양한 데이터 관련 작업을 수행하는 데 사용되는 오픈소스 생태계와 커뮤니티를 총칭하는 용어입니다. PyData는 단순한 도구의 집합을 넘어서, 데이터 과학자, 연구자, 개발자들이 협업하고 지식을 공유하는 글로벌 커뮤니티이기도...
# pandas **pandas**는 파이썬 데이터 조작과 분석을 위한 강력하고수준의 오픈스 라이브러리. NumPy, Sci, Matplotlib 등 함께 Python 기반 데이터학 생태계 핵심 구성 요 중 하나로, 데이터를율적으로 읽고, 정제, 변형하며 분석할 수 있는 다양한 기능을 제공합니다. 특히 **2차원 테이블 형식의 데이터**(데이터프레임)를 ...
# RPS ## 개요**RPS**(Requests Per Second는 시스템 성능을 측정 핵심 지표 중 하나로, **초당 처리 가능한 요청 수**(초당 요청 수) 의미합니다. 특히 웹버, API 서비스, 마이크로서비스 아키텍처 등과 같은 소프트웨어 시스템의 성능 평가와 스케일링 전략 수립에 널리 사용됩니다 RPS는 시스템의 처리 능력, 응답 속도, 리소...
# 공정성 ## 개요 인공지능(A)의 **공정성**(Fair)은 AI 시스템이 개인 집단에 대해 차별적이거나 편향된 결정을 내리지 않도록 보장하는 핵심 윤리 원칙입니다. AI 기술이 의료, 채용, 금융, 사법 등 민감한 분야에 광범위하게 적용되면서, 시스템의 판단이 특정 인종, 성별, 연령, 지역, 사회경제적 지위 등에 따라 불공정한 결과를 초래하지 않...
# 모델 해석성 ## 개요 **모델 해석성**(Model Interpretability)은 머신러닝 및 데이터과학 분야에서 모델이 예측을 내놓는 과정을 인간이 이해할 수 있도록 설명하는 능력을 의미합니다. 특히 복잡한 알고리즘(예: 딥러닝, 부스팅 모델 등)이 사용되는 경우, 모델의 결정 과정이 "블랙박스"처럼 보일 수 있어 해석성의 중요성이 더욱 부각...
# OpenVAS ##요 **OpenVAS**(Open Vulner Assessment System)는 오픈소스반의 보안 취약점 스캐닝 도구로, 네트워크, 시스템, 애플리케이션 등에서 존재 수 있는 보안 취약 자동으로 탐지하고 평가하는 데 사용됩니다. 이 도구는 기업, 정부 기관, 보안 전문가들이 정보 시스템의 보안 상태를 진단하고 보안 정책을 강화하는...
# BIM ## 개요 **BIM**(Building Information Modeling, 건축 정보 모델링)은 건축, 인프라, 토목 등 건설 산업 분야에서 디지털 기술을 활용하여 구조물의 물리적·기능적 특성을 통합적으로 모델링하고 관리하는 프로세스입니다. BIM은 단순한 3D 설계 도구를 넘어서, 프로젝트의 전 생애주기(계획, 설계, 시공, 운영, 유...
# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...
FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...
# ACF ## 개요 ACF(Autorrelation Function, 자기관함수)는 시계열 분석에서 중요한 개념 중 하나로, **한 시계열 데이터 내에서 서로 다른 시점의 관측값 사이의 상관관계 측정하는 함수**입니다 시계열 데이터는 시간에 따라 순차적으로 수집된 데이터이므로, 현재과 과거의 사이에 일정한 관계가 존재할 수 있으며, 이러한 관계를 수치...
# ACF 플롯 ## 개요 ACF 플롯utocorrelation Function Plot), 즉자기상관 함수 플롯**은 시계열 분석에서 핵심적인 시각화 도구 중 하나입니다. 이 플롯은 시계열의 각 시점 간 상관관계를 나타내며, 특히 과거 관측값이 현재 관측값에 어떤 영향을 미치는지를 파악하는 데 사용됩니다. ACF 플롯은 시계열 모델링, 특히 ARIMA...
# 과학기술 계산 과학기술 계산(Scientific)은 과학 및 공학 분야의 복잡한 문제를 수치적 방법과 컴퓨터 시뮬레이션을 통해 해결하는 학제 간 기술 영역입니다. 이 분야는 수학, 물리학, 컴퓨터 과학, 공학 등 다양한 분야의 지식을 융합하여 실험적 또는 이론적 접근만으로는 해결하기 어려운 문제를 분석하고 예측하는 데 핵심적인 역할을 합니다. 현대 과...