위키너와나

Structured Streaming

기술 > 데이터과학 > 데이터 처리 | 익명 | 2025-09-03 | 조회수 81

# Structured Streaming ## 개요 **Structured Streaming**은 아치 스파크(Apache Spark) 2.0 버전부터 도입된 고수준 스트리밍 처리 엔진으로, 실시간 데이터 스트림을 마치 정적 데이터를 다루는 것처럼 선언형 방식으로 처리할 수 있도록 설계되었습니다. 기존의 스파크 스트리밍(Spark Streaming)이 ...

#Structured Streaming #Apache Spark #실시간 데이터 처리 #DataFrame API #정확한 일회성 처리

What-If Tool

기술 > 인공지능 > 도구 | 익명 | 2025-09-03 | 조회수 113

What-If Tool ## 개요**What-If ToolWIT)은 구글(Google)이 개발한 시각적 분석 도구로, 머신러닝 모델의 동작을 직관적으로 탐색하고 분석할 수 있도록 설계된 인공지능(AI) 도구입니다 이 도구는 머신러닝 모의 예측 결과를 시각화하고, 다양한 입력 조건을 변경했을 때 모델의 출력이 어떻게 달라지는지 실시간으로 확인할 수 있게 해...

#What-If Tool #TensorFlow #공정성 분석 #모델 시각화 #AI 윤리

GPT

기술 > 자연어처리 > 언어 모델링 | 익명 | 2025-09-02 | 조회수 83

# GPT ## 개요 **GPT**(Generative Pre-trained Transformer)는 오픈AI(OpenAI)에서발한 자연어 처리(NLP) 분야의 대표적인 언어 모델 시리즈로, 트랜스포머(Transformer) 아키텍처를 기반으로 한 생성형 사전 훈련 모델입니다. GPT는 대량의 텍스트 데이터를 이용해 사전 훈련된 후, 특정 작업에 맞게 ...

#GPT #트랜스포머 #대규모 언어 모델 #자연어 처리 #미세 조정 #프롬프트 기반 학습 #자기 주의 #ChatGPT #LLM #오픈AI

FORTRAN

기술 > 프로그래밍 > 언어 | 익명 | 2025-09-02 | 조회수 79

# FORTRAN ##요 FORTRAN(FORmula TRANslation의 약자)은 과학 및 공학 계산을 위해 개발된 최초의 고급 프로그래밍 언어 중 하나로,1950년대 초 IBM에서 개발되었다.TRAN은 수치석, 물리 시레이션, 기 모델링, 유체 역학 등 계산 집약적인 분야에서 널리 사용되어 왔으며, 현재까지도 고성능 컴퓨팅(HPC) 분야에서 중요한...

#FORTRAN #고성능 컴퓨팅 #과학 계산 #배열 중심 프로그래밍 #객체 지향 프로그래밍

GPT-3

기술 > 인공지능 > 대규모 언어 모델 | 익명 | 2025-09-02 | 조회수 75

# GPT-3 ## 개요 **GPT-3Generative Pre-trained Transformer 3는 미국의 인공지 연구 기관인 **OpenAI**가 2020년 6월에 발표한 대규모 언어 모델arge Language Model, LLM)입니다. GPT-3은 자연어 처리(NLP) 분야에서 획기적인 성능을 보이며, 기존의 언어 모델들과는 차별화된 규모와...

#GPT-3 #대규모 언어 모델 #변환기 아키텍처 #few-shot 학습 #자연어 생성 #OpenAI #파라미터 규모 #텍스트 생성 #AI 모델 #중급

Lemmatization

기술 > 자연어 처리 > 전처리 | 익명 | 2025-09-02 | 조회수 87

# Lemmatization ## 개요 **Lemmatization**(표제어 추출)은 자연어 처리(Natural Language Processing, NLP)에서 중요한 전처리 기법 중 하나로, 단어를 그 언어적 원형(표제어, lemma)으로 환원하는 과정을 의미합니다. 예를 들어, 영어에서 "running"은 "run", "better"은 "good...

#Lemmatization #자연어 처리 #POS 태깅 #NLTK #spaCy

STT

기술 > 음성 인식 > 후처리 | 익명 | 2025-09-02 | 조회수 108

# STT 후처리 ## 개요 STT(음성식, Speech-toText)는 인간의 음성을 기계가 인식하여 텍스트로 변환하는 기술입니다. 이 과정에서 음성 신호는 전처리, 특징 추출, 음소 인식, 언어 모델 기반 디코딩 등을 거쳐 최종적으로 텍스트로 출력됩니다. 그러나 이러한 과정에서 발생할 수 있는 오류(예: 발음 유사 단어 오인, 배경 잡음으로 인한 인...

#STT 후처리 #언어 모델 재정렬 #텍스트 정규화 #오자 정정 #대규모 언어 모델

문법 교정

기술 > 자연어처리 > 문법 교정 | 익명 | 2025-09-02 | 조회수 51

# 문법 교정 ## 개요 문법 교정(Grammar Correction)은 자연어처리(NLP, Natural Language Processing) 분에서 중요한 기능 중 하나로, 사용자가 작성한 텍스트에서 문법 오류를 자동으로 탐지하고 이를 올바른 형태로 수정하는 과정을 의미합니다. 이 기술은 교육, 출판, 번역, 챗봇 등 다양한 분야에서 활용되며, 특히...

#문법 교정 #자연어처리 #딥러닝 #한국어 문법 #T5 모델

Apache Spark

기술 > 데이터과학 > 데이터 처리 | 익명 | 2025-09-02 | 조회수 81

# Apache Spark ## 개요 Apache Spark는 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크. 2009년 UC 버클리의 AMPLab에서 개발을 시작했으며, 2010년에 오픈소스로 공되고 203년 Apache Software Foundation 인큐베이션 프로젝트로 채택된 이후, 빅데이터 처리 분야에서 가장 널리 사용되는 도구...

#Apache Spark #빅데이터 처리 #RDD #PySpark #분산 컴퓨팅

목표 기반 인코딩

기술 > 데이터과학 > 데이터 인코딩 | 익명 | 2025-09-01 | 조회수 82

# 목표 기반 인코딩 목표 기반 인코딩(Target-based Encoding)은 범주형 변수(Categorical Variable)를 수치형 변수로 변환 데이터 인코딩법 중 하나로, 특히 지도 학습(Supervised Learning)에서 목표 변수(Target Variable)와의 관계를 활용하여 인코딩을하는 방법입니다. 이 방은 단순한 레이블 인코딩...

#목표 기반 인코딩 #범주형 변수 인코딩 #평균 인코딩 #데이터 누수 #과적합 방지

정규화

기술 > 자연어 처리 > 전처리 | 익명 | 2025-09-01 | 조회수 91

# 정규화 ## 개요 **정규화**(Normalization) 자연어 처리(Natural Language Processing, N)에서 텍스트 전처리의 핵심 단계 중 하나로, 다양한 형태의 텍스트를 일관된 형식으로 변환하여 분석의 정확도 효율성을 높이는 과정을 의미합니다. 원시 텍스트는 사용자 입력, 웹 크롤링, 문서 스캔 등 다양한 경로를 통해 수집되...

#정규화 #자연어 처리 #텍스트 전처리 #비표준어 정규화 #형태소 분석

Matplotlib

기술 > 데이터시각화 > 시각화 도구 | 익명 | 2025-09-01 | 조회수 213

# Matplotlib Matplotlib은 파이썬 기반의 강력하고 유연한 2D 그래프 및 데이터 시각화 라이브러리로, 과학 계산, 데이터 분석, 머신러닝 등 다양한 분야에서 널리 사용되고 있습니다. NumPy와 잘 통합되며, MATLAB과 유사한 인터페이스를 제공하여 사용자가 익숙하게 접근할 수 있습니다. 복잡한 데이터를 직관적으로 표현할 수 있도록 다...

#Matplotlib #데이터 시각화 #Python 라이브러리 #pyplot #고급 커스터마이징

다형성

기술 > 프로그래밍 > 객체지향프로그래밍 | 익명 | 2025-09-01 | 조회수 117

# 다형성 **다형성**(Polymorphism)은 객체지향프로그래밍(OOP, Object-Oriented Programming)의 핵심 개념 중 하나로, "여러 형태를 가질 수 있는 능력"을 의미합니다.는 동일한 인터페이스나 메서드를 통해 서로 다른 클래스의 객체가 각자의 방식으로 동작할 수 있도록 하는 프로그래밍 기법입니다. 다형성은 코드의 재사용성,...

#다형성 #객체지향프로그래밍 #메서드 오버로딩 #메서드 오버라이딩 #인터페이스

Matplotlib

기술 > 데이터과학 > 데이터 시각화 | 익명 | 2025-09-01 | 조회수 122

# Matplotlib ## 개요 **Matplotlib**은 파이썬ython) 기반의 강력 유연한 2D 데이터 시각화 라이브러리로, 과학 계산, 데이터 분석, 머신러닝 등 다양한야에서 널리되고 있습니다. 203년 존. 헌터( D. Hunter)에 개발된 이 라이브러리는 MATLAB과 유사한 인터페이스를 제공하여, 수치 데이터를 시각적으로 표현하는 데 ...

#Matplotlib #데이터 시각화 #파이썬 #pyplot #객체 지향 인터페이스 #3D 시각화 #서브플롯

Jupyter Notebook

기술 > 소프트웨어 > 개발환경 | 익명 | 2025-09-01 | 조회수 72

# Jupyter Notebook Jupyter Notebook은 데이터 과학, 머신러닝, 수치 해석, 교육 등 다양한 분야에서 널리 사용되는 **웹 기반의 인터랙티브 개발 환경**(Interactive Development Environment)입니다 사용자는 코드, 수식, 시각화, 텍스트 설명 등을 하나의 문서 안에 통합하여 작성할 수 있어, 연구 결...

#Jupyter Notebook #데이터 과학 #인터랙티브 개발 환경 #Python #노트북 문서

범주형 변수

기술 > 데이터과학 > 데이터 준비 | 익명 | 2025-09-01 | 조회수 66

# 범주형 변수 ## 개요 **범주형 변수**(Categorical Variable)는 데이터 과학과 통계학에서 중요한 데이터 유형 중 하나로, 특정 범주나 그룹에 속하는 값을 가지는 변수를 의미합니다. 이 변수는 정량적인 수치가 아닌 정성적인 속성을 표현하며, 데이터 분석, 머신러닝 모델링, 데이터 시각화 등 다양한 과정에서 핵심적인 역할을 합니다. ...

#범주형 변수 #명목형 변수 #순서형 변수 #원-핫 인코딩 #레이블 인코딩

하이브리드 인코딩

기술 > 데이터과학 > 인코딩 | 익명 | 2025-09-01 | 조회수 91

# 하이브리드 인딩 ## 개 **하이브드 인코딩Hybrid Encoding)은 과학 및 머신러닝 분야에서 범주형 변수(Categorical Variable)를 수치형 데이터로 변환하는 과정에서, 여러 인코딩 기법을 조합하여 사용하는 고급 전략입니다. 단일 인코딩 방식이 특정 상황에서 한계를 가질 수 있기 때문에, 데이터의 특성과 모델의 요구사항에 따라 ...

#하이브리드 인코딩 #범주형 변수 #타깃 인코딩 #피처 엔지니어링 #머신러닝

SciPy

기술 > 데이터과학 > 분석 | 익명 | 2025-08-31 | 조회수 127

# SciPy ## 개요 **SciPy**(Science Python)는 과학적 및 기술적 계산을 위한 파이썬 기반의 오픈소스 소프트웨어 생태계의 핵심 구성 요소 중 하나입니다 SciPy는 수치 계산, 최적화, 선형 대수, 적분, 보간, 신호 처리, 통계 분석 등 다양한 수학적 및 과학적 문제 해결을 위한 강력한 함수와 알고리즘을 제공합니다. SciPy...

#SciPy #수치해석 #데이터과학 #파이썬 #과학 계산

기계 학습 전처리

기술 > 인공지능 > 머신러닝 전처리 | 익명 | 2025-08-31 | 조회수 75

# 기계 학습 전처리 기계 학습 전처리(Machine Learning Preprocessing)는 원시 데이터를 기계 학습 모이 효과적으로 학습할 수 있도록 변환하고 준비하는 일련의 과정을 의미합니다. 모델의 성능은 학습 알고리즘뿐 아니라 데이터의 질에 크게 의존하므로, 전처리는 기계 학습 프로젝트에서 가장 중요한 단계 중 하나로 꼽힙니다. 이 문서에서는...

#기계 학습 전처리 #데이터 정규화 #결측치 처리 #범주형 데이터 인코딩 #scikit-learn

위키너와나

검색 결과

Structured Streaming

What-If Tool

GPT

FORTRAN

GPT-3

Lemmatization

STT

문법 교정

Apache Spark

목표 기반 인코딩

정규화

Matplotlib

다형성

Matplotlib

Jupyter Notebook

추천 시스템

범주형 변수

하이브리드 인코딩

SciPy

기계 학습 전처리