위키너와나

단일 활성화

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-30 | 조회수 65

# 단일 활성화 ## 개요 **단일 활성화**(One-Hot Encoding)는 범주형 데이터(categorical data)를 기계학습 모델이 처리할 수 있도록 수치형 형태로 변환하는 대적인 데이터 인코딩 기 중 하나입니다.주형 변수는 특정한 카테고리나 레이블을 가지는 데이터로, 예를 들어 "성별(남, 여)", "지역(서울, 부산, 대구)" 등이 있습...

#단일 활성화 #범주형 데이터 #OneHotEncoder #데이터 인코딩 #기계학습 전처리

TF-IDF

기술 > 데이터과학 > 데이터 분석 도구 | 익명 | 2025-09-30 | 조회수 69

# TF-IDF ## 개 TF-IDF(Term Frequencyverse Document Frequency) 자연어 처리(NLP와 정보 검색Information Retrieval) 분야에서 널 사용되는 **텍스트 데이터의 중요도를 수치화하는 가중치 기**입니다. 이은 특정 단어(term)가 하나의 문서(document) 내에서 얼마나 중요한지를 평가하기...

#TF-IDF #자연어 처리 #텍스트 분석 #scikit-learn #초급

미세 조정

기술 > 머신러닝 > 모델 훈련 | 익명 | 2025-09-30 | 조회수 64

# 미세 조정 개요 **미세 조정**(Fine-tuning)은 머신러닝, 특히 딥러닝 분야에서 사전 훈련된(pre-trained) 모델 새로운 과제(task)에 맞게 추가로 훈련하여 성능을 개선하는법입니다. 이은 대규모 데이터셋으로 학습된 모델의 일반적인 특징 추출 능력을 활용하면서도, 특정 도메인이나 목적에 최적화된 성능을 얻을 수 있도록 해줍니다....

#미세 조정 #전이 학습 #BERT #파라미터 효율 미세 조정 #자연어 처리

OneHotEncoder

기술 > 데이터과학 > 데이터 분석 도구 | 익명 | 2025-09-30 | 조회수 68

# OneHotEncoder ##요 **OneHotEncoder**는 머신러닝 및 데이터 과 분야에서 범주형 데이터(c data)를 모이 처리할 수 있는 수치 형태로 변환 위해 사용되는 전처리 도구입니다. 사이킷런(Scikit-learn 라이브러리에서 제공하는 `sklearn.preprocessing.OneHotEncoder 클래스는 범주 변수를 **원...

#OneHotEncoder #범주형 데이터 #원-핫 인코딩 #Scikit-learn #데이터 전처리

원-핫 인코딩

기술 > 자연어처리 > 인코딩 | 익명 | 2025-09-30 | 조회수 62

# 원-핫 인코딩 ## 개요 **원핫 인코딩**(One-Hot Encoding)은 범주형 데이터(c data)를 기계학습 모델이 이해할 있도록 수치형 데이터로 변환하는 대표적인 방법 중 하나입니다. 이 기은 각 범주)를 고유한 이진 벡터(binary vector)로 표현하며, 벡터 내에서 해당 범주에 해당하는 위치만 1로 설정하고 나머지 모든 위치는 0...

#원-핫 인코딩 #범주형 데이터 #데이터 전처리 #자연어처리 #임베딩

인공지능

기술 > 인공지능 > 기계학습 | 익명 | 2025-09-29 | 조회수 44

# 인공지능 인공지능(Artificial Intelligence, AI)은의 지능을 모방하거나장하기 위해 컴퓨터 시스템이 지을 학습, 추론, 인식, 문제 해결, 의사결정 등의 능력을 갖도록 설계하는 기술 분야이다. 인공지능은 단순한 자동화를 넘어, 환경을 인지하고 경험을 통해 개선하는 능력까지 포함하며, 특히 **기계학습**(Machine Learning...

#인공지능 #기계학습 #딥러닝 #자연어처리 #책임 있는 AI

오버샘플링

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-28 | 조회수 113

# 오버샘플링 ## 개요 오버샘플(Over-sampling은 기계 학습 데이터 과학 분야에서불균형 데이터(imbalanced data)** 문제를 해결하기 위해 사용되는 데이터 전 기법 중 하나. 불균형란 특정 클래스의 샘플 수가 다른에 비해 현히 적은 경우를 말하며, 이는 분류 모델의 성능에정적인 영향 미칠 수 있습니다. 예를, 질병 진 데이터에서 건...

#오버샘플링 #불균형 데이터 #SMOTE #ADASYN #데이터 전처리

파인튜닝

기술 > 자연어처리 > 모델 평가 | 익명 | 2025-09-28 | 조회수 61

# 파인튜닝 ## 개요 **파인튜닝**(Fine-tuning)은 사전 훈련된(pre-trained) 머신러닝 모델을 특정 과제나 도메인에 맞게 추가로 훈련하여 성능을 개선하는 과정을 의미합니다. 자연어처리(NLP, Natural Language Processing) 분야에서 파인튜닝은 전이학습(Transfer Learning)의 핵심 기법으로 자리 잡았...

#파인튜닝 #자연어처리 #전이학습 #BERT #LoRA

AlexNet

기술 > 인공지능 > 컴퓨터비전 | 익명 | 2025-09-28 | 조회수 68

# AlexNet ## 개요 **AlexNet**은 인공지능, 특히 **컴퓨터비전**(Computer Vision) 분야에서 혁명적인 영향을 미친 심층 신경망Deep Neural Network)** 모이다. 212년에 알스 크리제브스키Alex Krizhev)**, 이오리츠케버**(Ilya Sutskever)**, 그리고 제프리 힌튼**(Geoffrey ...

#AlexNet #CNN #ReLU #드롭아웃 #GPU 병렬 처리

MSE

기술 > 데이터과학 > 회귀 분석 | 익명 | 2025-09-27 | 조회수 63

# MSE ## 개요 **MSE**(Mean Squared Error, 평균 제곱 오차)는 회귀 분석에서 예측 모델의 정확도를 평가하는 데 널리 사용되는 지표입니다. 이 값은 예측값과 실제 관측값 사이의 차이(오차)를 제곱한 후, 그 평균을 계산함으로써 모델의 전반적인 오차 크기를 수치화합니다. MSE는 회귀 모델의 성능을 비교하거나 하이퍼파라미터 최적...

#MSE #회귀 분석 #손실 함수 #모델 평가 #데이터과학

ROC 곡선

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-27 | 조회수 66

# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...

#ROC 곡선 #AUC #이진 분류 #모델 평가 #민감도 #위양성율 #scikit-learn

회귀

기술 > 머신러닝 > 회귀 분석 | 익명 | 2025-09-27 | 조회수 63

# 회귀 회귀(Regression)는 머신러닝 통계학에서 기법 중 하나로 하나 이상의 독립 변수(입력 변수)와 종속 변수(출력 변수) 사이의 관계를 모델링하여 연속 값을 예측하는 데 사용됩니다. 회귀 분석은 데이터의 패턴을 이해하고, 미래의 값을 추정하거나 간의 인과 관계를 탐색하는 데 널리 활용됩니다. 이 문서에서는 회귀 분석의 기본 개념, 주요 유형,...

#회귀 분석 #선형 회귀 #정규화 #모델 평가 #지도 학습

예측 정확도 평가

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-27 | 조회수 63

# 예측 정확도 평가 예측 정확도가는 데이터과학에서 머신러닝 모델이나 통계 모델의 성능을 판단하는 핵심 과정이다. 모델이 학습된 후, 새로운 데이터에 대해 얼마나 정확하게 예측하는지를 평가함으로써 모델의 신뢰성과 실용성을 판단할 수 있다. 특히 분류, 회귀, 시계열 예측 등 다양한 예측 과제마다 적절한 평가 지표가 다르므로, 과제의 특성에 맞는 정확도 평...

#예측 정확도 #평가 지표 #분류 모델 #회귀 모델 #교차 검증

Forecasting: Principles and Practice

출판 > 학술 자료 > 데이터과학 서적 | 익명 | 2025-09-27 | 조회수 73

# Forecasting: Principles and Practice ## 개요 **Forecasting: Principles and**(이하 F)는 예측 분석의 기에서 고급 기법까지를 체계적으로 다루는 대적인 데이터과학 서적 중 하나로, 특히 시계열 예측(Time Series Forecasting) 분야에서 널리 활용되는 오픈 액세스(Open Acce...

#시계열 예측 #R 프로그래밍 #ETS 모델 #ARIMA #데이터과학 서적

전자기 상수

과학 > 물리학 > 전자기학 | 익명 | 2025-09-26 | 조회수 77

# 전자기 상수 전자기 상수(電磁氣常數, electromagnetic constants)는 전자기학의 기본 법칙을 기술하는 데 사용되는 물리 상수들로, 전기와 자기 현상의 상호작용을 수학적으로 표현하는 데 핵심적인 역할을 한다. 이러한 상수들은 맥스웰 방정식, 전자기파의 전파 속도, 물질 내에서의 전자기적 거동 등을 정량적으로 분석하는 데 필수적이며, ...

#전자기 상수 #맥스웰 방정식 #진공 유전율 #진공 투자율 #빛의 속도

시계열 예측

기술 > 데이터과학 > 예측 분석 | 익명 | 2025-09-26 | 조회수 61

# 시계열 예측 ## 개요 **시계열 예측**(Time Series Forecasting)은 시간에 따라 순차적으로 수집된 데이터를 기반으로 미래의 값을 예하는 데이터 과학의 핵심법 중 하나입니다. 이법은 경제표, 주가,상 데이터, 판매량 웹 트래픽 등 시간의 흐름에 따라 변화하는 다양한 현상에 적용되며, 기업의 전략 수립, 자원 배분, 리스크 관리 등...

#시계열 예측 #ARIMA #LSTM #지수 평활법 #Prophet

사회적 형평성

사회 > 사회문제 > 형평성 | 익명 | 2025-09-26 | 조회수 68

# 사회적 형평성 ## 개요 **사회적 형평성Social Equity)은 사회 구성 모두가 공정한 기회를 보장받고, 사회적 자원과 혜택을 형평성 있게 분배받으며, 차별 없이 존중받는 상태를 의미한다. 형평성(equity)은 단순한 평등(equality)과는 구별되는데, 평등이 모든 사람에게 동일한 자원을 제공하는 것을 의미한다면, 형평성은 각 개인의 출...

#사회적 형평성 #형평성 vs 평등 #기회 형평성 #정책 사례 #사회정의

클러스터링

기술 > 머신러닝 > 클러스터링 | 익명 | 2025-09-24 | 조회수 57

# 클러스터링 ## 개요 클러스터(Clustering)은 머신러의 대표적인 **비지도 학습**(Unsupervised Learning) 기 중 하나로, 데이터 간의 유사성을 기반으로 데이터를룹화하는 과정을 말합니다. 이 기법은전에 레이블이 주어지지 않은 데이터셋에 적용되며, 데이터의 숨겨진 구조나 패턴을 발견하는 데 유용합니다. 클러스터링은 고객 세분화...

#비지도 학습 #K-평균 #DBSCAN #계층적 클러스터링 #실루엣 점수

가치 기반 마케팅

경제 > 비즈니스 > 마케팅 | 익명 | 2025-09-23 | 조회수 66

# 가치 기반 마케팅 ## 개요 **가치반 마케팅(Value-Based Marketing)**은 소비자에게 제공하는 제품이나 서비스의 '가치'에 초점을 맞추어 마케팅 전략을 수립하고 실행하는 접근 방식입니다. 전통적인 마케팅 가격, 제품 기능, 광고 등에 중심을 두었다면, 가치 기반 마케팅은 고객이 느끼는 **전체적인 가치 경험**(Total Custo...

#가치 기반 마케팅 #고객 가치 #가치 제안 #브랜드 충성도 #지속 가능성

num_leaves

기술 > 인공지능 > 머신러닝 | 익명 | 2025-09-22 | 조회수 63

# num_leaves `num_leaves`는 그래디언트 부스팅 머신 러닝 알고리즘 중 하나인 **LightGBM**(Light Gradient Boosting Machine)에서 중요한 하이퍼파라터로, 각각의 결정 트리(decision tree) 가질 수 있는 **최대 잎 노드 수**(maximum number of leaf nodes)를 지정합니다....

#num_leaves #LightGBM #하이퍼파라미터 튜닝 #과적합 방지 #리프 중심 성장

검색 결과