# Structured Streaming ## 개요 **Structured Streaming**은 아치 스파크(Apache Spark) 2.0 버전부터 도입된 고수준 스트리밍 처리 엔진으로, 실시간 데이터 스트림을 마치 정적 데이터를 다루는 것처럼 선언형 방식으로 처리할 수 있도록 설계되었습니다. 기존의 스파크 스트리밍(Spark Streaming)이 ...
검색 결과
"PP"에 대한 검색 결과 (총 885개)
# Convention over Configuration **Convention over Configuration**(컨벤션 오버)은 소프트웨어 개발, 특히 웹 개발 분야 널리 사용되는계 원칙 중 하나, 개발자가복적인 설정이나 구성을 최소화하고, 미리 정의된 "관례(convention)"를 따르도록 함으로써 개발 생산성을 극대화하는 철학입니다. 이 원칙은...
데이터 읽기 읽기는 프로그밍에서 파일 시스, 데이터베이, 네트워 스트림 등 다양한 소스로부터 정보를오는 과정을합니다. 이는 프로그램이 외부 데이터를 처리하고 분석하기 위한 첫 번째 단계로, 대부분의 소프트웨어 애플리이션에서 핵심적인 역할을 합니다. 본 문서에서는 파일 입출력의 맥락에서 데이터 읽기의 개념, 주요 방법, 프로그래밍 언어별 구현 방식, 그리...
# n-그램 모델## 개요 **n-그램 모델**(n-gram model)은 자연어 처리(Natural Language Processing NLP) 분에서 언어의 확률적 구조를 모링하기 위해 널리 사용되는 통계 기반 언어 모델이다. 이 모델은 주어진 단어 시퀀스에서 다음 단어가 등장할 확률을 이전의 *n-1*개 단어를 기반으로 예측하는 방식을 취한다. n-...
# Ruby Ruby는 일본의 프로그래머 유이지 마츠모토(Yukihiro "Matz" Matsumoto)가 1995년에 설계하고 개발한 고급 객체지향 프로그래밍 언어입니다. Ruby는 개발자의 생산성과 즐거움을 중시하는 철학을 바탕으로 설계되었으며, "프로그래머 행복(Developer Happiness)"을 핵심 가치로 삼고 있습니다. 문법이 직관적이고 ...
# Numerical Recipes ## 개 *Numerical*는 과학 및 공학 분야에서 수치해석 알고리즘을 실제 문제에 적용하기 위한 전문 서적 시리즈이자 소프트웨어 라이브러리의 총체를 의미한다. 1986년 최초로 출간된 이래로 물리학, 천문학, 공학, 생물정보학 등 다양한 분야의 연구자와 엔지니어들에게 널리 사용되어 왔으며, 특히 수치적 계산의 이...
# 예측 정확도 균형 ## 개요 **예측 정확도 균형**(Predictive Parity)은 인공지능I) 시스템, 특히 머신러닝 모델이 다양한 집단(예: 인종, 성별, 연령대 등)에 대해 동일한 수준의 예측 정확도를 유지하는 것을 의미합니다. 이 개념은 AI의 **공정성**(Fairness)을 평가하는 핵심 지표 중 하나로, 특정 집단이 다른 집단보다 ...
BLEU BLEU(Bilingual Evaluationstudy)는 기번역 시스템의 출력질을 자동으로 평가하기 위해 개발된 지표로, 202년 IBM의 Kishore Papineni와 동료들에 의해 제안되었습니다. 이 지표는 기계 생성한 번역 문장을 이상의 인간 전문 번역가가 작성한참조 번역"(reference translation)과 비교함으로써 유사를 ...
# R² ## 개요 **R²**(R-squared, 결정계수)는 통계학 및 기계학습에서 회귀 모델의 성능을가하는 대표 지표 중 하나입니다. R² 모델이 종속 변수(dependent variable)의 분산 중 얼마나 많은 부분을 설명할 수 있는지를 나타내는 값으로, 일반적으로 0에서 1 사이의 값을 가집니다. 이 값이 1에 가까울수록 모델이 데이터의 변...
AI검사 ## 개요 AI검사(인공능 검사, AI Model Inspection)는 인공지 모델의 성, 신뢰성,정성, 보성, 투명성 종합적으로 평가하고 분석 과정을 의미합니다 AI 기술이 금융, 의료 자율주행, 채용 등 민감한 분야에 광범위하게 적용면서, 모델 예상치 못한류를 일으키거나 편향된 결정을 내릴 경우 심각한 사회적, 윤리적 문제 초래할 수 있습...
# 문법적 설탕 ## 개요 **문법적 설탕**(Syntactic Sugar)은 프래밍 언어에서 기존의 기능을 더 편리하고 가독성 있게 표현하기 위해 추가된 문법적 요소를 의미합니다. 이 용어는 1964년 피터 랜딘(Peter Landin)이 도입했으며, 원래 존재하는 기능을 "달콤하게" 감싸는 표현 방식이라는 비유에서 유래했습니다. 문법적 설탕은 프로그...
# 파일 입출력 ## 개요 **파일 입출력**(File Input/Output,하 I/O)은 컴퓨터 프로그램이 저장 장치(예: 하드디스크, SSD)에 있는 파일을 읽거나 쓰는 과정을 의미합니다. 데이터리의 핵심 요소 중 하나, 사용자 데이터의 영구 저장, 프로그램 설정 유지, 로그 기록, 대량 데이터 처리 등 다양한 목적에 활용됩니다. 파일 입출력은 운...
# Word2Vec ## 개요 **Word2Vec**은 자연 처리(NLP)야에서 널리 사용되는 **단어 임베딩**(word embedding) 기법 중 하나로, 단어를 고차원 벡터 공간에 실수 벡터로 표현하는 모델입니다. 이 기법 2013년 구글의 토마스 미코로프(Tomas Mikolov)와 그의 동료들이 개하였으며, 기존의 복잡하고 계산 비용이 높은 ...
# Counterfactual Examples ##요 **Counterfactual Examples반사실적 예시는 인공지(AI), 특히 머신러닝 모델의 **해석 가능성**(interpretability)과 **공정성**(fairness), **로버스트성**(robustness을 평가하는 데 중요한 개념이다. 이는 "만약 입력 데이터가 약간 달랐다면 모델...
# 문법 교정 ## 개요 문법 교정(Grammar Correction)은 자연어처리(NLP, Natural Language Processing) 분에서 중요한 기능 중 하나로, 사용자가 작성한 텍스트에서 문법 오류를 자동으로 탐지하고 이를 올바른 형태로 수정하는 과정을 의미합니다. 이 기술은 교육, 출판, 번역, 챗봇 등 다양한 분야에서 활용되며, 특히...
# 경사하강법경사하강법(Graidentcent)은 기계습과 인공지능 분야에서 모델의 학습 과정에서 손실 함수(Loss Function)를 최소화하기 위해 널리 사용되는 **최적화 알고리즘**이다. 이 알고리즘은 주어진 함수의 기울기(경사)를 계산하여, 그 기울기가 가장 가파르게 내려가는 방향으로 매 반복마다 모델의 매개변수를 조정함으로써 최솟값을 찾아가는 ...
# private 필드 ## 개 `private` 필드는 객체향프로그래밍(Object-Oriented Programming, OOP)에서의 멤버 변수(필드)에 접근 제어를 적용하는 중요한 개념 중 하나입니다. `private`으로 선언된 필드는 해당 클래스 내부에서만 접근이 가능하며, 외부 클래스나 객체에서는 직접 접근할 수 없습니다. 이는 **캡슐화*...
# 함수 ## 개요 **함수**(function)는 수학에서 매우 핵심적인 개념 중 하나로, 두 집합 사이의 특정한 관계를 설명하는 도구이다. 간단히 말해, 함수는 **입력값**(독립변수) 하나에 대해 **정확히 하나의 출력값**(종속변수)을 대응시키는 규칙이다. 함수는 수학 전반은 물론 물리학, 공학, 컴퓨터 과학, 경제학 등 다양한 분야에서 모델링과...
# MLP ## 개요 **MLP**(Multi-Layer Perptron, 다층 퍼셉트론)은 인공신경망(Artificial Neural Network, ANN)의 가장 기본적이고 널리 사용되는 형태 중 하나입니다 단일 퍼셉트론은 선형적으로 분리 가능한 문제만 해결할 수 있지만, MLP는 여러 개의 은닉층(Hidden Layers)을 포함함으로써 **비선...
# OUI ## 개요 OUI (Organizationally Unique Identifier)는트워크 장치 **물리적 주소**( 주소)에서 3바이트24비트를 차지하는 고유 식자입니다. IEEE(전기전자기술자협회)에서 관리하며, 각 네트워크 인터페이스 카드(NIC) 제조업체에 고유하게 할당되어, 전 세계적으로 중복되지 않도록 보장합니다. OUI는 MAC ...