# 포트폴리오 최화 ## 개요 포트리오 최적화ortfolio Optimization)는 투자자가 자산에 투함으로써 리스크 분산시키고, 주어진 리스크 수준에서 기대 수익을 극대화하거나, 목표 수익률을 달성하기 위해 리스크를 최소화하는정을 말한다 이는 현대 금공학의 핵심 개념 중 하나로 해리 마코츠(Harry Markowitz)가 1952년 제안한현대 포트...
검색 결과
"확률"에 대한 검색 결과 (총 267개)
# 일반화 기법 ## 개요 머신러닝 모델이 훈련 데이터에 잘추는 것(과적합, overfit)은 중요하지, 더 중요한 것은 **델이 이전 본 적 없는 새로운 데이터**(테스트)에 대해서도 작동하는 것이다. 이 능력을 **일화**(generalization라고 하며, 머신러닝의 핵심 목표 중 하나이다. 일반화 성을 향상시키기 위해 사용하는 다양한 전략과 기...
# RAID 6 ##요 RAID 6은 **undant Array of Independent Disks독립 디스크의 중복 배열 기술 중 하나로, 데이터 안정성과 가용 높이기 위해 설계된 스토지 기술입니다 RAID 6은 RAID 5의 단 보완하여, **두 개의스크가 동시에 실패하더라도 데이터를 복구할 수 있는 이중 패리티**(Dual Parity) 기능을 ...
# 모델 훈련 ## 개요 모델 훈련(Model)은 머신닝(Machine Learning) 핵심 과정, 주어진 데이터를 기반으로 모델이 특정 작업을 수행할 수 있도록 학습시키는 절차를 의미합니다. 이 과정에서 알고리즘은 입력 데이터와 정답(라벨) 사이의 관계를 학습하여, 새로운 데이터에 대해 정확한 예측이나 판단을 내릴 수 있는 능력을 획득하게 됩니다. ...
순서형 로스틱 회귀 ## 개요**순서형 로지스 회귀**(Ordinal Regression)는 종속(dependent variable)가 **서형 범주**(ordinal categorical)일 때 사용하는 통계적 회귀석 기법이다. 일반적인 로지스틱 회귀가 이진(binary) 또는 명목형(nominal) 범주형 변수를 예측하는 데 사용된다면, 순서형 로지스...
# 드롭아웃 ## 개요 **드롭아웃**(out)은 인공지능, 특히 딥러닝 분야에서 널리 사용되는 **정규화**(Regularization) 기법 중 하나로,경망 모델의 과적합(Overfitting)을 방하기 위해 고안. 드롭아웃은 훈련 과정 중 임의로 일부 뉴런(neuron)을 일시적으로 제거함으로써 모델의 복잡도를 줄이고, 각 뉴런이 다른 뉴런에 과도...
# 군집 샘플링**군집 샘플링**(Cluster Sampling은 통계학 데이터과학 분야에서리 사용되는 확률표본추출 방법 중 하나로, 전체 모집단을 자연스럽게 형성된 **군집**(Cluster)으로 나누, 이 군집들 중 일부를 무작위로 선택하여 표본으로 추출하는 방식입니다. 이 방법은 특히 모집단의 구성원들이 지리적, 조직적, 또는 시간적 기준으로 그룹화되...
# 해싱 트릭## 개요 **해싱 트**(Hashing Trick)은 기 학습 및 데이터 과학 분야 고차원의 범주형 데이터를 효율적으로 처리하기 위한 기술이다. 특히 자연어 처리(NLP)나 대규모 범주형 피처를 다룰 때, 원-핫 인코딩(Oneot Encoding)과 같은 전통적인 인코 방식이 메모리와 계산 자원을 과도하게 소모하는 문제를 해결하기 위해 제안...
# Label Bias Problem ## 개요 **Label Bias Problem**(벨 편향 문제)은신러닝, 조건부 확률 모델(Conditional Random Fields, CRFs 등)과 순차적 예측 모델(Sequential Models)에서 발생 수 있는 중요한 이슈이다. 이 문제는델이 각 출력 라벨을 독립적으로 예측하려는 경향 때문에,전 상...
# 텍스처 ## 개요 **텍스처**(Texture)는 디지털지 처리 분야에서 물체 표면의 시각적 질감을 나타내는 중요한 특징 중 하나입니다. 텍스는 색상, 밝기, 패턴의 반복성, 표면의 거칠기 등 다양한 시각적 속성의 조합으로 구성되며, 이미지 내의 객체 인식, 분할, 분류 등 다양한 컴퓨터 비전 작업에 핵심적인 역할을 합니다. 예를 들어, 나무, 석조...
# 언어 모델링 ## 개요 **언어 모델링**(Language Modeling)은 자연어처리(NLP, Natural Language Processing)의심 기술 중 하나, 주어진어 시퀀스(문장 또는 문맥)가 자연스러운 언어로 구성될 확률을 계산하는 작업을 말합니다. 즉, 언어 모델은 "어떤 문장이 인간 언어로 얼마나 자연스러운가?"를 수학적으로 평가하...
# Label Bias Problem ## 개요 **Label Bias Problem**(라벨 편향 문제)은 머신러닝, 특히건부 확률 모(Conditional Random Fields, CRFs 등과 순차적 데이터(sequence modeling)를 다루는 모델에서 자주 발생하는 이슈로, 모델이 특정 출력 라벨(클래스)에 지나치게 편향되어 다른 라벨을 ...
# 음향 모델 ## 개 **음향 모델Acoustic Model) 음성 인식 시템의 핵심 요소 중 하나, 입력된 음성 신호를 음소(phoneme) 소리 단위 변환하는 역할을 수행한다. 음성 인식은 인간의 언를 기계가할 수 있도록 음성를 텍스트로환하는 기술, 이 과정에서향 모델은 소리와 언 단위 사이의 매을 담당한다 즉, 사람이 말한리를 듣고 "어떤 음들이...
# 공정성 ## 개요 인공지능(A)의 **공정성**(Fair)은 AI 시스템이 개인 집단에 대해 차별적이거나 편향된 결정을 내리지 않도록 보장하는 핵심 윤리 원칙입니다. AI 기술이 의료, 채용, 금융, 사법 등 민감한 분야에 광범위하게 적용되면서, 시스템의 판단이 특정 인종, 성별, 연령, 지역, 사회경제적 지위 등에 따라 불공정한 결과를 초래하지 않...
# 샘플링 ## 개요 **샘플링**()은 전체 모집(Population)에서 일부 선택하여 그 특성을 조사함으로써 모단의 성질을 추정하는 통계적 방법이다. 현실 세계 모든 데이터를 수집하거나 분석하는 것은 비용, 시간 자원 등의 제약으로 인해 불능한 경우가 많기 때문에, 데이터과학에서는 샘플링을 통해 효율적이고 신뢰성 있는 분석을 수행한다. 샘플링은 사...
# 모델 해석성 ## 개요 **모델 해석성**(Model Interpretability)은 머신러닝 및 데이터과학 분야에서 모델이 예측을 내놓는 과정을 인간이 이해할 수 있도록 설명하는 능력을 의미합니다. 특히 복잡한 알고리즘(예: 딥러닝, 부스팅 모델 등)이 사용되는 경우, 모델의 결정 과정이 "블랙박스"처럼 보일 수 있어 해석성의 중요성이 더욱 부각...
# LDA (Lat Dirichlet Allocation) ## 개요 **LDA**(Latent Dirichlet Allocation, 잠재 디리클레 할당) 자연어 처리(Natural Language Processing, NLP) 분야에서 널리 사용되는주제 모델**(Topic Modeling) 기 중 하나입니다. 주로 문서 집합(corpus) 내에서 잠...
# AlexNet ## 개요 **AlexNet**은 인공지능, 특히 **컴퓨터비전**(Computer Vision) 분야에서 혁명적인 영향을 미친 심층 신경망Deep Neural Network)** 모이다. 212년에 알스 크리제브스키Alex Krizhev)**, 이오리츠케버**(Ilya Sutskever)**, 그리고 제프리 힌튼**(Geoffrey ...
# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...
FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...