위키너와나

ROUGE

기술 > 자연어처리 > 모델 평가 | 익명 | 2025-09-10 | 조회수 91

# ROUGE ## 개요 ROUGE(RCALL-Oriented Understudy for Gisting Evaluation)는 자연어 처리(Natural Language Processing, NLP) 분야에서 주로 **자동 요약**(Automatic Summarization) 또는 **기계 번역**(Machine Translation) 시스템의 출력 결...

#ROUGE #자동 요약 #n-그램 #LCS #모델 평가 #NLP #기계 번역 #중급

최적화

기술 > 데이터과학 > 최적화 알고리즘 | 익명 | 2025-09-06 | 조회수 72

# 최적화 ## 개요 최적화(Opt)는 주어진 조건에서 가장 좋은 해를 찾는 과정을 의미하며, 데이터과학 기계학습, 공학 경제학 등 다양한 분야에서 핵심적인 역할을 한다.과학에서는 모델의 예측 성능을 향상시키기 위해 손실 함수(Loss Function)를 최소화, 제약 조건을 만족하면서 목표 함수를 극대화/극소화하는 작업이 자주 발생한다. 최적화 알고리...

#최적화 #경사 하강법 #Adam #제약 조건 최적화 #데이터과학

트라이그램

기술 > 자연어 처리 > 언어 모델 | 익명 | 2025-09-04 | 조회수 119

# 트라이그램 트라이그램(Tr)은 자연어 처리(Natural Language Processing, NLP) 분야에서 텍스트의 언어적조를 모델하는 데 사용되는 통적 언어 모델의 한 형태입니다. 특히 **N-그램(N-gram)** 모델의 일종으로, 연된 세 개의 단어(또는 토큰)로 구성된 단위를 기반으로 언어의 확률적턴을 분석하고 예측하는 데 활용됩니다. 트...

#트라이그램 #N-그램 #언어 모델 #자연어 처리 #마르코프 가정 #스무딩 #음성 인식 #기계 번역 #오타 수정 #초급

샘플링

기술 > 데이터과학 > 데이터 축소 | 익명 | 2025-09-04 | 조회수 77

# 샘플링 ## 개요 **샘플링**(Sampling)은 전체 모집단(Population에서 일부를 선택하여 그 특성을 조사함으로써 모집단 성질을 추정하는계적 방법이다. 데이터과학 분야에서 샘플링은규모 데이터셋 효율적으로 처리하고 분석하는 데심적인 역할을 한다. 특히 빅데이터 환경에서 전체 데이터를 처리하는 것이 비용이나 시간 측면에서 비효율적일 경우, ...

#샘플링 #확률 샘플링 #비확률 샘플링 #데이터 과학 #통계적 추정

WebText2

기술 > 데이터과학 > 데이터 수집 | 익명 | 2025-09-04 | 조회수 74

# WebText2 ## 개요 **WebText2**는 대규모 텍스트 데이터셋 중 하나로, 주로 자연어(NLP) 및 언어 모델 훈련을 위한 목적으로 개발된 데이터 수집 프로젝트의 결과물입니다. 이 데이터셋은 인터넷 상의 다양한 공개 텍스트 자원을 크롤링하여 구축되었으며, 특히 **GPT-2**(Generative Pre-trained Transforme...

#WebText2 #GPT-2 #데이터 수집 #NLP #윤리적 고려사항

파인튜닝

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-03 | 조회수 84

# 파인튜닝 ## 개요 **파인튜닝**(Fine-tuning)은 사전 훈련된(pre-trained) 인공지능 모델을 특정 작업이나 도메인에 맞게 추가로 훈련하여 성능을 최적화하는 기법입니다. 주로 딥러닝 기반의 자연어 처리(NLP), 컴퓨터 비전(CV), 음성 인식 등 다양한 분야에서 널리 사용되며, 전이 학습(Transfer Learning)의 핵심 ...

#파인튜닝 #전이 학습 #LoRA #BERT #모델 평가

BLEU

기술 > 인공지능 > 성능 평가 | 익명 | 2025-09-02 | 조회수 71

BLEU BLEU(Bilingual Evaluationstudy)는 기번역 시스템의 출력질을 자동으로 평가하기 위해 개발된 지표로, 202년 IBM의 Kishore Papineni와 동료들에 의해 제안되었습니다. 이 지표는 기계 생성한 번역 문장을 이상의 인간 전문 번역가가 작성한참조 번역"(reference translation)과 비교함으로써 유사를 ...

#BLEU #기계번역 #n-그램 정밀도 #문장 길이 보정 #자동 평가 지표

사기 탐지

기술 > 데이터과학 > 이상치 탐지 | 익명 | 2025-09-02 | 조회수 90

# 사기 탐지 ## 개요 사기 탐지(Fraud Detection)는 금융 거래, 보험 청구, 전자상거래, 신용카드 사용 등 다양한 영역에서 부정행위를 식별하고 예방하기 위한 데이터과학 기반의 핵심 기술입니다. 특히 딥러닝, 머신러닝, 통계적 이상치 탐지 기법을 활용하여 정상적인 패턴에서 벗어난 비정상적인 행동이나 거래를 자동으로 감지하는 데 초점을 맞춥...

#사기 탐지 #이상치 탐지 #머신러닝 #딥러닝 #Isolation Forest #Autoencoder #XGBoost #실시간 처리 #불균형 데이터

F1 점수

기술 > 인공지능 > 모델 평가 | 익명 | 2025-09-02 | 조회수 80

# F1 점수 ## 개요 F1 점수1 Score)는 인공지능 머신러닝 분야에서 분류 모델의 성능을 평가 데 널리 사용되는 지입니다. 특히 **밀도**(Precision)와 **재현율**(Recall)을 조화롭게 결합한 지표로, 두 값의 조화 평균(Harmonic Mean)을 계산하여 모델의 균형 잡힌 성능을 평가합니다. F1 점수는 불균형 데이터셋(Im...

#F1 점수 #정밀도 #재현율 #조화 평균 #불균형 데이터 #모델 평가

컴퓨터 비전

기술 > 컴퓨터비전 > 이미지 분석 | 익명 | 2025-09-01 | 조회수 64

# 컴퓨터 비전 ##요 **컴퓨터 비전**(Computer Vision, CV) 컴퓨터가 디지털 이미지나 비디오를 이해하고 해석할 수 있도록 하는 인공지능의 한 분야입니다. 인간의 시각 시스템과 유사하게, 컴퓨터 비전 기술은 시각 정보를 입력으로 받아 객체 인식, 이미지 분류, 위치 추정, 움직임 분석 등 다양한 작업을 수행합니다. 이 기술은 의료 영상...

#컴퓨터 비전 #딥러닝 #CNN #객체 인식 #OpenCV

목표 변수

기술 > 데이터과학 > 데이터 전처리 | 익명 | 2025-09-01 | 조회수 81

# 목표 변수 ## 개 **목표 변수**(Target Variable)는 데이터 과학 및 머신러닝 분야에서 모델이 예측하거나 설명하려는 주요 변수를 의미합니다. 이는 종속 변수(Depend Variable), 응답 변수(Response Variable), 또는 출력 변수(Output Variable)라고도 불리며, 모델 학습의 중심이 되는 요소입니다. ...

#목표 변수 #데이터 전처리 #머신러닝 #회귀 문제 #분류 문제

기계 학습 전처리

기술 > 인공지능 > 머신러닝 전처리 | 익명 | 2025-08-31 | 조회수 75

# 기계 학습 전처리 기계 학습 전처리(Machine Learning Preprocessing)는 원시 데이터를 기계 학습 모이 효과적으로 학습할 수 있도록 변환하고 준비하는 일련의 과정을 의미합니다. 모델의 성능은 학습 알고리즘뿐 아니라 데이터의 질에 크게 의존하므로, 전처리는 기계 학습 프로젝트에서 가장 중요한 단계 중 하나로 꼽힙니다. 이 문서에서는...

#기계 학습 전처리 #데이터 정규화 #결측치 처리 #범주형 데이터 인코딩 #scikit-learn

scikit-learn

기술 > 인공지능 > 머신러닝 | 익명 | 2025-08-31 | 조회수 150

# scikit-learn **scikit-learn**은 파이썬 기반의 오픈소스 머신러닝 라이브러리로, 데이터 분석과 머신러닝 모델 개발을 위한 다양한 알고리즘과 도구를 제공합니다. 간결한 API와 뛰어난 문서화로 인해 초보자부터 전문가까지 널리 사용되며, 데이터 과학 및 인공지능 분야에서 사실상 표준 라이브러리로 자리 잡고 있습니다. scikit-le...

#scikit-learn #머신러닝 #파이썬 #감독 학습 #비감독 학습 #데이터 전처리 #모델 평가 #Random Forest #PCA #초급

중복 데이터 제거

기술 > 데이터과학 > 데이터 정제 | 익명 | 2025-08-30 | 조회수 82

중복 데이터 제 ## 개요데이터 정제(Data Cleaning)는 데이터 분석 및 머신러닝 모델 개발 과정에서 매우 중요한 전처리 단계입니다. 과정에서 데이터의 품질을 높이고, 분석 결과의 신뢰성을 확보하기 위해 다양한 문제를 해결합니다. 그중 **중복 데이터 제거**(Deduplication)는 동일하거나 매우 유사한 데이터 레코드가 여러 번 존재하는 ...

#중복 데이터 제거 #데이터 정제 #pandas #유사 중복 식별 #레벤슈타인 거리

통계 기반 방법

기술 > 자연어처리 > 교정 접근 방식 | 익명 | 2025-08-27 | 조회수 73

# 통계 기반 방법 ## 개요 **통계 기반 방법**(Statistical-based Approach)은 자연어처리(NLP) 분야에서 언어의 확률적 패턴과 빈도 정보를 활용하여 언어 현상을 분석하고 처리하는 기법을 말합니다. 특히 **교정 접근 방식**(Error Correction Approach)의 맥락에서 통계 기반 방법은 오타, 문법 오류, 어법...

#통계 기반 방법 #언어 모델 #오류 모델 #자연어교정 #n-그램

AI검사

기술 > 인공지능 > AI모델평가 | 익명 | 2025-08-21 | 조회수 102

# AI검사 AI검사(또는 AI 모델 검사) 인공지능 시스템의 성능, 안정성, 공정성, 보안성, 윤리적 적합성 등을 종합적으로 평가하고 검증하는 일련의 절차를 의미합니다. 특히 AI 모델이 실제 환경에서 안전하고 신뢰할 수 있게 작동하기 위해 필수적인 단계로, 단순한 정확도 측정을 넘어 다양한 위험 요소와 잠재적 편향을 식별하는 데 초점을 맞춥니다. AI...

#AI검사 #공정성 평가 #설명 가능성 #견고성 검사 #AI 규제

체질량지수

건강 > 생리학 > 에너지 대사 | 익명 | 2025-07-31 | 조회수 79

# 체질량지수 ## 개요 체질량지수(Body Mass Index, BMI)는 개인의 체중과 키를 활용해 체중 상태를 평가하는 간단한 지표입니다. 이는 비만, 과체중, 저체중 등 건강 상태를 대략적으로 파악하는 데 사용되며, 임상 및 공중보건 분야에서 널리 활용됩니다. 1832년 벨기에 통계학자 아돌페 퀘이텔레(Adolphe Quetelet)가 개발한 이 ...

#태그1 #태그2 #태그3

논리적 연산

기술 > 데이터과학 > 분석 | 익명 | 2025-07-30 | 조회수 90

# 논리적 연산 ## 개요 논리적 연산(Logical Operation)은 컴퓨터 과학과 데이터 과학의 기반을 이루는 수학적 연산으로, 참(True)과 거짓(False)의 이진 값을 기반으로 복잡한 조건을 처리합니다. 이 연산은 데이터 분석, 알고리즘 설계, 인공지능 모델 개발 등 다양한 분야에서 필수적인 역할을 하며, 특히 데이터 과학에서는 데이터 필터...

#논리적 연산 #부울 대수 #데이터 과학 #Pandas #SQL #논리 게이트 #로지스틱 회귀 #초급

Python

기술 > 프로그래밍 > Python | 익명 | 2025-07-19 | 조회수 98

# Python ## 개요 Python은 1991년 Guido van Rossum에 의해 처음 제안된 고수준 프로그래밍 언어로, **간결한 문법**, **다양한 응용 분야**, **활발한 커뮤니티**로 유명합니다. 객체지향, 함수형, 절차적 프로그래밍을 모두 지원하며, 특히 데이터 과학, 인공지능(AI), 웹 개발, 자동화 등 다양한 영역에서 널리...

#Python #interpreted language #dynamic typing #data science #web development #machine learning #Django #Flask #Pandas #NumPy

하이브리드 전기차

기술 > 자동차 > 하이브리드 | 익명 | 2025-07-14 | 조회수 90

# 하이브리드 전기차 ## 개요 하이브리드 전기차(Hybrid Electric Vehicle, HEV)는 내연기관 엔진과 전기 모터를 결합한 차량으로, 연료 효율성 향상과 배출가스 감소를 목표로 설계되었습니다. 이 기술은 1990년대 후반부터 본격적으로 상용화되며, 환경 문제 해결 및 에너지 자원 보존을 위한 중요한 대안으로 주목받고 있습니다. 하이브리드...

#Hybrid Electric Vehicle #Plug-in Hybrid #Energy Management System #Regenerative Braking #Fuel Efficiency #Emission Reduction #Hybrid Technology

검색 결과