위키너와나

파인튜닝

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-03 | 조회수 84

# 파인튜닝 ## 개요 **파인튜닝**(Fine-tuning)은 사전 훈련된(pre-trained) 인공지능 모델을 특정 작업이나 도메인에 맞게 추가로 훈련하여 성능을 최적화하는 기법입니다. 주로 딥러닝 기반의 자연어 처리(NLP), 컴퓨터 비전(CV), 음성 인식 등 다양한 분야에서 널리 사용되며, 전이 학습(Transfer Learning)의 핵심 ...

#파인튜닝 #전이 학습 #LoRA #BERT #모델 평가

K-Fold 타겟 인코딩

기술 > 데이터과학 > 모델 평가 | 익명 | 2025-09-03 | 조회수 76

K-Fold 타 인코딩 개요 **K-Fold 타겟 인코딩**(K-Fold Target Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 고급 인코 기법 중 하나로, 특히 **과적합**(Overfitting) 방지하기 위해계된 방법입니다. 범주형 변수의 카테고리를 해당테고리에하는 타겟 변수의 평균값으로 대체하는...

#K-Fold 타겟 인코딩 #데이터 리크 방지 #범주형 변수 인코딩 #과적합 감소 #중급

Stopword Removal

기술 > 자연어 처리 > 전처리 | 익명 | 2025-09-03 | 조회수 80

Stopword Removal 개요 **Stopword Removal**(불용어 제거)는 자연어 처리(Natural Language Processing, NLP)에서 전처리 과정의 핵심계 중 하나로, 텍스트 분석의 효율성과 정확도를 높이기 위해 자주 사용되는 기술입니다. 이 과정은 문장 내에서 의미적 기여도가 낮거나 문맥 분석에 거의 영향을 주지 않는...

#불용어 제거 #Stopword Removal #자연어 처리 #NLP #전처리 #형태소 분석 #TF-IDF

smoothing parameter

기술 > 머신러닝 > 모델 최적화 | 익명 | 2025-09-03 | 조회수 73

# smoothing parameter ## 개요 **Smoothing parameter**(스무딩 파라터)는 머신러닝 및계 모델링에서 데이터의 노이즈ise)를 줄 모델의 일반화능을 향상시키기 위해 사용되는 중요한 하이퍼파라미터입니다. 이 파라미터 모델이 데이터에 **과적합overfitting)되는 것을 방지하고, 관측된 데이터의 불확실성이나 변동성을 ...

#smoothing parameter #kernel density estimation #나이브 베이즈 #모델 최적화 #편향-분산 트레이드오프

컴파일

기술 > 프로그래밍 > 컴파일과정 | 익명 | 2025-09-03 | 조회수 68

# 컴파일 ## 개 **컴파일**(Compile)은 고급 프로그래밍 언어로 작성된 **소스 코드**(Source Code)를 컴퓨터가 직접 실행할 수 있는 **기계어**(Machine Code) 또는 중간 형태의 코드로 변환하는 과정을 의미합니다. 이 과정은 소프트웨어 개발의 핵심 단계 중 하나로, 프로그래머가 인간 친화적인 언어로 작성한 코드를 컴퓨터...

#컴파일 #컴파일러 #소스코드 #기계어 #AST

K-means

기술 > 데이터과학 > 클러스터링 | 익명 | 2025-09-03 | 조회수 79

K-means -means는 대적인 **비지도 학습**(Unsupervised Learning) 알고리즘 중 하나로, 주어진 데이터를 **K개의 클러스터**(군집)로 나누는 데 사용됩니다. 클러스터링은 데이터의 유사성을 기반으로 그룹을 형성하여 데이터의 구조를 이해하고 패턴을 발견하는 데 중요한 역할을 합니다. 특히 K-means는 간단하면서도 효율적인 ...

#K-means #비지도 학습 #클러스터링 #유클리드 거리 #실루엣 분석

Path Traversal

기술 > 보안 > 입력 검증 | 익명 | 2025-09-03 | 조회수 106

# Path Traversal 개요 **Path Traversal**(경 탐색)은 보 분야에서 중요한 취점 유형 중로, 공격자가 시스템의 파일 시스템 내에서 권한이 없는 디렉터리나 파일에 접근할 수 있도록 만드는 입력 검증 실패로 인해 발생하는 보안 위협입니다. 이 취약점은 주로 웹 애플리케이션에서 사용자 입력을 통해 파일 경로를 동적으로 결정할 때,...

#Path Traversal #입력 검증 #보안 취약점 #OWASP Top 10 #CWE-22

요약

기술 > 자연어처리 > 전처리 | 익명 | 2025-09-03 | 조회수 79

# 요약 ## 개요 자연어처리(Natural Language, NLP)에서 **요약ummarization)**은 긴 텍스트의 핵심 정보를 간결하고 이해하기 쉬 형태로 재구하는 기술을 의미. 이는 문서,스 기사,고서, 연구 논문 등 다양한 텍스트 자료의 정보를 효율적으로 전달하는 데 중요한 역할을 하며, 정보 폭증 시대에 사용자들이 빠르게 주요 내용을 파...

#요약 #추출 기반 요약 #생성 기반 요약 #TextRank #BERTSUM #BART #T5 #전처리 #자연어처리

GPT

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-02 | 조회수 83

# GPT ## 개요 **GPT**(Generative Pre-trained Transformer)는 오픈AI(OpenAI)에서발한 자연어 처리(NLP) 분야의 대표적인 언어 모델 시리즈로, 트랜스포머(Transformer) 아키텍처를 기반으로 한 생성형 사전 훈련 모델입니다. GPT는 대량의 텍스트 데이터를 이용해 사전 훈련된 후, 특정 작업에 맞게 ...

#GPT #트랜스포머 #대규모 언어 모델 #자연어 처리 #미세 조정 #프롬프트 기반 학습 #자기 주의 #ChatGPT #LLM #오픈AI

GPT-3

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2025-09-02 | 조회수 75

# GPT-3 ## 개요 **GPT-3Generative Pre-trained Transformer 3는 미국의 인공지 연구 기관인 **OpenAI**가 2020년 6월에 발표한 대규모 언어 모델arge Language Model, LLM)입니다. GPT-3은 자연어 처리(NLP) 분야에서 획기적인 성능을 보이며, 기존의 언어 모델들과는 차별화된 규모와...

#GPT-3 #대규모 언어 모델 #변환기 아키텍처 #few-shot 학습 #자연어 생성 #OpenAI #파라미터 규모 #텍스트 생성 #AI 모델 #중급

BERT

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-02 | 조회수 68

# BERT ##요 BERT(Bidirectional Encoder Represent from Transformers)는글(Google)이 018년에 발표한 자연어 처리(N) 분야의 획기적인 언어 모델이다.ERT는 이전의 단방향 언어 모들과 달리 **방향 맥락**(bidirectional context)을 학습함으로써 단어의 의미를 보다 정확하게 이해할...

#BERT #자연어처리 #트랜스포머 #MLM #파인튜닝

GPT

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2025-09-02 | 조회수 83

GPT ##요 GPT(Generative Pre-trained)는 오픈AI(OpenAI에서 개발한 **대규모 언어 모델**(Large Language Model, LLM) 시리즈로, 자연어를 생성하고 이해하는 데 특화된 딥러닝 기반의 인공지능 모델입니다. GPT는 **변환기**(Transformer) 아키텍처를 기반으로 하며, 방대한 양의 텍스트 데이터...

#GPT #대규모 언어 모델 #Transformer #자연어 처리 #OpenAI #사전 학습 #미세 조정 #few-shot learning #챗봇 #LLM

Lemmatization

기술 > 자연어 처리 > 전처리 | 익명 | 2025-09-02 | 조회수 87

# Lemmatization ## 개요 **Lemmatization**(표제어 추출)은 자연어 처리(Natural Language Processing, NLP)에서 중요한 전처리 기법 중 하나로, 단어를 그 언어적 원형(표제어, lemma)으로 환원하는 과정을 의미합니다. 예를 들어, 영어에서 "running"은 "run", "better"은 "good...

#Lemmatization #자연어 처리 #POS 태깅 #NLTK #spaCy

GPT-4

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2025-09-02 | 조회수 77

# GPT-4 ## 개요 GPT-4enetic Pre-trained Transformer 4)는 미국의 인공지능 연구 기업인 **OpenAI**가발한 **대모 언어 모델**(Large Language Model, LLM)의 네 번째 주요 버전으로,2023년 3월에 공개되었습니다. 이 모델은 자연어 처리, 생성, 이해 등 다양한 언어 과제에서 인간 수준에...

#GPT-4 #대규모 언어 모델 #멀티모달 AI #Transformer 아키텍처 #OpenAI

Speech-to-Text

기술 > 음성 인식 > 후처리 | 익명 | 2025-09-02 | 조회수 84

# Speech-to-Text 개요 **Speech-to-Text**(음성-텍스트 변환)는 인간의 음성을 디지털 오디오 신호로 입력받아 이를 기계가 이해하고 텍스트로환하는 기술 의미합니다. 이 기은 음성 인식(Speech Recognition)의 핵심 구성 요소로, 자연어 처리(NLP), 인공지능(AI), 머신러닝(ML) 기술을 결합하여 실시간 또는 ...

#Speech-to-Text #후처리 #음성 인식 #언어 모델 #NER

Bayesian Target Encoding

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-02 | 조회수 114

# Bayesian Target Encoding ## 개요 **베이지안 타겟 인코딩**(Bayesian Target Encoding)은 범주형 변수(categorical variable)를 수치형 변수로 변환하는 고급 인코딩 기법 중 하나로, 특히 머신러닝 모델의 성능 향상을 위해 사용된다. 이 기법은 단순한 타겟 인코딩(target encoding)의...

#베이지안 타겟 인코딩 #범주형 변수 인코딩 #과적합 방지 #교차 검증 #하이퍼파라미터 튜닝

자연어처리

기술 > 자연어 처리 > 기본 개념 | 익명 | 2025-09-02 | 조회수 74

# 자연어처리 ## 개요 자연어처리(Natural Language Processing, 이하 NLP) 컴퓨터가 인간이 일상적으로 사용하는 언어인 **자연어**(예: 한국어, 영어, 중국어 등)를 이해하고 생성할 수 있도록 **인공지능의 한 분야**입니다. 자연어는 문법적 구조가 유연하고 맥락에 따라 의미가 달라지는 특징을 가지며, 이로 인해 컴퓨터가 이...

#자연어처리 #NLP #형태소 분석 #BERT #초급

Embedding

기술 > 인공지능 > 임베딩 | 익명 | 2025-09-02 | 조회수 97

# Embedding ## 개요 **임베딩**(Embedding)은공지능, 특히 자연어 처리(NLP), 컴퓨터 비전, 추천 시스템 등 다양한 분야에서 핵심적인 기술로 사용되는 **고차원 데이터를 저차원의 밀집 벡터**(dense vector)로 변환하는 과정을 의미합니다. 이 기술은 원시 데이터(예: 단어, 문장, 이미지, 사용자 행동)의 의미적 또는 ...

#임베딩 #자연어 처리 #Word2Vec #GloVe #FastText #문장 임베딩 #추천 시스템

Word2Vec

기술 > 자연어처리 > 단어 임베딩 | 익명 | 2025-09-02 | 조회수 75

# Word2Vec ## 개요 **Word2Vec**은 자연 처리(NLP)야에서 널리 사용되는 **단어 임베딩**(word embedding) 기법 중 하나로, 단어를 고차원 벡터 공간에 실수 벡터로 표현하는 모델입니다. 이 기법 2013년 구글의 토마스 미코로프(Tomas Mikolov)와 그의 동료들이 개하였으며, 기존의 복잡하고 계산 비용이 높은 ...

#Word2Vec #단어 임베딩 #Skip-Gram #CBOW #NLP

Counterfactual Examples

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-02 | 조회수 84

# Counterfactual Examples ##요 **Counterfactual Examples반사실적 예시는 인공지(AI), 특히 머신러닝 모델의 **해석 가능성**(interpretability)과 **공정성**(fairness), **로버스트성**(robustness을 평가하는 데 중요한 개념이다. 이는 "만약 입력 데이터가 약간 달랐다면 모델...

#Counterfactual Examples #설명 가능한 AI #모델 평가 #DiCE #로버스트성 #공정성 #최적화 기반 방법

검색 결과