검색 결과

"트리 기반"에 대한 검색 결과 (총 25개)

LightGBM

기술 > 인공지능 > 머신러닝 | 익명 | 2026-01-24 | 조회수 4

# LightGBM LightGBM은 마이크로소프트에서 개발한 고성능의 경량 그래디언트 부스팅 프레임워크로, 대규모 데이터셋에서도 빠르고 효율적인 학습을 가능하게 하는 머신러닝 알고리즘입니다. 특히 분류, 회귀, 순위 예측 등 다양한 머신러닝 과제에서 뛰어난 성능을 보이며, XGBoost, CatBoost 등과 함께 대표적인 그래디언트 부스팅 트리(Gra...

인코딩

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-11-13 | 조회수 16

# 인코딩 ## 개요 데이터 전처리 과정에서 **인코딩**(Encoding)은 범주형 데이터(categorical data)를 머신러닝 모델이 이해할 수 있는 수치형 형식으로 변환하는 핵심 기술입니다. 대부분의 머신러닝 알고리즘은 문자열이나 라벨 형태의 범주형 데이터를 직접 처리할 수 없으므로, 이를 숫자로 변환하는 과정이 필수적입니다. 인코딩은 데이터...

SHAP 값

기술 > 데이터과학 > 분석 | 익명 | 2025-10-10 | 조회수 24

# SHAP 값 ## 개요 SHAP 값(Shapley Additive exPlanations) 머신러닝 모델의 예측 결과를 해석하기 위한모델 해석성**(Interpretability) 기법 중로, 게임 이론의 **샤플리 값**(Shapley Value) 개념을 기반으로 합니다. SHAP은 각 특성(feature)이 모델의 개별 예측에 기여한 정도를 정량...

계층적 소프트맥스

기술 > 자연어처리 > 전처리 | 익명 | 2025-10-06 | 조회수 27

# 계층적 소프맥스 ## 개요 **층적 소프맥스**(Hierarchicalmax)는 자연처리(NLP) 대용량 어휘(vocabulary)을룰 때 발생하는산 비용 문제를 해결하기 위해 제된 기술입니다 특히 언어 모델, 단어 임베딩(예: Word2Vec), 기계 번역 등에서 출력층의 소프트맥스 계산이 단어 사전의 크기에 비례하여 매우 비효율적이라는 문제가 있...

OneHotEncoder

기술 > 데이터과학 > 데이터 분석 도구 | 익명 | 2025-09-30 | 조회수 28

# OneHotEncoder ##요 **OneHotEncoder**는 머신러닝 및 데이터 과 분야에서 범주형 데이터(c data)를 모이 처리할 수 있는 수치 형태로 변환 위해 사용되는 전처리 도구입니다. 사이킷런(Scikit-learn 라이브러리에서 제공하는 `sklearn.preprocessing.OneHotEncoder 클래스는 범주 변수를 **원...

고차원 희소 데이터

기술 > 데이터과학 > 데이터 특성 | 익명 | 2025-09-19 | 조회수 32

# 고차원 희소 데이터 ## 개요 **고차원 희소 데이터**(High-dimensional sparse data)는 데이터 과학 및 머신러닝 분야에서 자주 등장하는 중요한 개념으로, 특성의 수가 매우 많지만 각 데이터 포인트가 실제로 값을 가지는 특성은 극히 일부에 불과한 데이터를 의미한다. 이러한 데이터는 텍스트, 유전자 정보, 추천 시스템, 이미지 ...

페이지 계층 구조

기술 > 소프트웨어 > 위키 플랫폼 | 익명 | 2025-09-18 | 조회수 47

# 페이지 계층 구조페이지 계층 구조(Page Hierarchy)는 위키 플랫폼 내에서 정보를 조직하고 관리하는 핵심적인 방법 중 하나입니다. 이 구는 사용자가 콘텐츠를 쉽게 탐색하고, 관련 정보를 논리적으로 연결하며, 문서 간의 관계를 명확히 하기 위해 사용됩니다. 특히 대규모 위키 시스템(예: 위키미디어, Confluence, Notion 등)에서는 정...

부모 커밋

기술 > 데이터관리 > 버전 관리 | 익명 | 2025-09-16 | 조회수 31

# 부모 커밋 ## 개요 **부모 커**(Parent Commit)은 버전 관리 시스템, 특히 **Git**에서 중요한 개념 중 하나로, 특정 커밋이 생성되기 이전에 존재하던 커밋을 의미합니다. 즉, 각 커밋은 자신의 변경 사항이 기반으로 삼은 하나 이상의 이전 커밋을 **부모 커밋**으로 가집니다. 이 구조는 Git의 **트리 기반 히스토리**(com...

필터 방법

기술 > 데이터과학 > 특성 분석 | 익명 | 2025-09-15 | 조회수 30

# 필터 방법 ## 개요**필터 방법**( Method)은 데이터과학, 특히 머신러닝과 통계 모델링에서 **특성 선택**(Feature Selection)을 수행하는 대표적인 기법 중 하나입니다. 이은 모델 훈련 과정에 의존하지 않고, 데이터 자체 통계적 특성만을 기반으로 각 특성의 중요도를 평가하여 불필요하거나 중복된 변수를 제거하는 것을 목표로 합니다...

하이퍼파라미터 조정

기술 > 머신러닝 > 모델 최적화 | 익명 | 2025-09-07 | 조회수 39

하이퍼파미터 조정 ## 개요 하이퍼파라미터 조정(Hyperparameter Tuning)은 머신러닝 모델의 성능을 최적화하기 위해 모델 학습 전에 설정 하는 **하이퍼파라미터**(Hyperparameter)의 값을 체계적으로 탐색하고 선택하는 과정입니다. 하이퍼파라미터는 모델의 구조나 학습 방식을 결정하는 외부 파라미터로, 예를 들어 학습률(Learni...

특성 변수

기술 > 데이터과학 > 데이터 분석 | 익명 | 2025-09-03 | 조회수 50

특성 변수 개요 **성 변수**(Feature Variable), 또는 단히 **특성**(Feature), **입력 변수**(Input Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 학습하거나 예측을 수행하는 데 사용하는 데이터의 개별적인 속성(attribute)을 의미합니다. 예를 들어, 집값 예측 모델에서 방의 수, 면적, 위치, 연...

사기 탐지

기술 > 데이터과학 > 이상치 탐지 | 익명 | 2025-09-02 | 조회수 49

# 사기 탐지 ## 개요 사기 탐지(Fraud Detection)는 금융 거래, 보험 청구, 전자상거래, 신용카드 사용 등 다양한 영역에서 부정행위를 식별하고 예방하기 위한 데이터과학 기반의 핵심 기술입니다. 특히 딥러닝, 머신러닝, 통계적 이상치 탐지 기법을 활용하여 정상적인 패턴에서 벗어난 비정상적인 행동이나 거래를 자동으로 감지하는 데 초점을 맞춥...

명목형 범주

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-02 | 조회수 47

명목형 범 ## 개요**명목형 범주**(inal Category)는 통계학 및 데이터과학에서 범주형 자료(Categorical Data)의 한 유형으로, 서로 구분 가능한 범주를지만 **서로 간 순서나 크기 관계가 없는 데이터를 의미합니다. 명목형주는 단순히 이름(Name) 또는 레이블)에 기반한 분류 제공하며, 수치적인 해이나 대소 비교가가능합니다. ...

데이터 인코딩 기법

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 38

# 데이터 인코딩 기법 데이터 인코딩 기법은 데이터 과학과 머신러닝 프로세스에서 매우 중요한 전처리 단계 중 하나입니다. 실제 데이터는 텍스트, 범주형 값, 날짜, 기호 등 다양한 형태로 존재하지만, 머신러닝 모델은 일반적으로 수치형 데이터만을 입력으로 처리할 수 있습니다. 따라서 범주형 변수나 텍스트 데이터를 모델이 이해할 수 있는 **수치 형태로 변환...

라벨 인코딩

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-01 | 조회수 39

# 라벨 인코딩 ## 개요 라벨 인코딩(Label Encoding)은 머신러 및 데이터 과학 분야에서 범주형(categorical) 데이터를 모델이 처리할 수 있는 수치형 형식으로 변환하는 대표적인 **데이터 인코딩 기법** 중 하나입니다. 머신러닝 알고리즘은 일반적으로 문자열이나 텍스트 형태의 범주형 변수를 직접 처리할 수 없기 때문에, 이러한 변수들...

범주형 변수

기술 > 데이터과학 > 데이터 준비 | 익명 | 2025-09-01 | 조회수 34

# 범주형 변수 ## 개요 **범주형 변수**(Categorical Variable)는 데이터 과학과 통계학에서 중요한 데이터 유형 중 하나로, 특정 범주나 그룹에 속하는 값을 가지는 변수를 의미합니다. 이 변수는 정량적인 수치가 아닌 정성적인 속성을 표현하며, 데이터 분석, 머신러닝 모델링, 데이터 시각화 등 다양한 과정에서 핵심적인 역할을 합니다. ...