# XSum ## 개요 **XSum**은 자연어처리(NLP) 분야에서 특히 **문서 요약**(text summarization) 연구에 널리 사용되는 영어 기반의 대규모 요약 데이터셋입니다. 이 데이터셋은 BBC 뉴스 기사를 원본 텍스트로, 기사의 핵심 내용을 담은 매우 짧은 요약문을 정답(label)으로 구성하고 있으며, **추출형 요약**(extra...
검색 결과
"ABS"에 대한 검색 결과 (총 156개)
# DeepSpeech ## 개요 **DeepSpeech**는 머신러닝 기반의 오픈소스 **음성 인식**(Speech-to-Text) 엔진으로, 원래 구글의 연구팀에서 개발한 **딥러닝 음성 인식 기술**(Deep Speech)을 기반으로 하며, 현재는 **Mozilla Foundation**에서 주도적으로 개발 및 유지보수 중인 프로젝트이다. Deep...
# 어텐션 메커니즘 ## 개요 **어텐션 메커니즘**(Attention Mechanism)은 인공지능, 특히 딥러닝 기반의 자연어 처리(NLP), 컴퓨터 비전, 음성 인식 등 다양한 분야에서 핵심적인 역할을 하는 신경망 구성 요소입니다. 이 메커니즘은 모델이 입력 데이터의 특정 부분에 더 집중(attention)하도록 유도함으로써, 전체 정보를 균등하게...
# 번역 시스템 ## 개요 **번역 시스템**(Translation System)은 한 언어로 표현된 텍스트를 다른 언어로 자동으로 변환하는 기술 및 시스템을 의미합니다. 특히 **기계 번역**(Machine Translation, MT) 분 핵심 기술로, 자연어 처리(NLP)의 중요한 응용 사례 중 하나입니다. 번역 시스템은 문서 번역, 웹사이트 현지...
# DEXA 스캔 ## 개요 DEXA 스캔(Dual-Energy X-ray Absorptiometry, 이중 에너지 X선 흡수계측법)은 인체의 골밀도(뼈의 무기질 밀도)를 정밀하게 측정하는 데 사용되는 비침습적 의료 영상 기술입니다. 주로 골다공증의 진단과 골절 위험 평가에 활용되며, 체지방률과 근육량 등 신체 조성 분석에도 널리 사용됩니다. DEXA는...
# 재활용 소재 ## 개요 재활용 소재(Recycled Material)는 사용 후 폐기된 자원을 수집, 분류, 정제, 가공하여 새로운 제품 제조에 다시 사용할 수 있도록 만든 자원을 말한다. 재료공학의 관점에서 재활용 소재는 자원 고갈 방지, 에너지 절약, 환경 오염 감소라는 세 가지 핵심 목표를 달성하기 위한 중요한 기술적 요소로 간주된다. 특히 플...
# 비용 함수 ## 개요 비용 함수(Cost Function), 손실 함수(Loss Function는 머신러닝 및 데이터과학에서 모델의 예측 성능을 정적으로 평가하는 데 사용되는 핵심 개념이다. 이 함수는 모이 실제 데이터를 기반으로 예측한 값과 실제 관측값 사이의 차이, 즉 '오차'를 수치화하여 모델이 얼마나 잘못 예측하고 있는지를 나타낸다. 비용 함...
# 중간 코드 생성 ## 개요 **중간 코드 생성**( Code Generation)은 컴파일러의 핵심 단계 중 하나, 소스 코드 고수준 언어에서 하드웨어에 독립적인 **중간 표현**(Intermediate Representation,)으로 변환 과정입니다. 이 단계는 컴파일러의 **프론트엔드**(소스 언어 파싱)와 **백엔드**(기계어 생성)를 연결하...
# GAS **GAS**(GNU Assembler)는 GNU 프로트의 공식 어셈블로, 주로닉스 계열 운영제와 리눅스 환경에서 사용되는 저수준 프래밍 도구입니다. C, C 어셈블리 언어 등 작성된 소스 코드가 컴파일된 후 생성 어셈블리 코드를 기계어로환하는 역할을 수행합니다. GAS는 GNU Binutils 패키지의 핵심 구성 요소 중 하나이며, GCC(G...
# AST (추상 구문 트리) ## 개요 **AST**(Abstract Syntax Tree, 추상 구문 트리)는 컴퓨터 과학, 특히프로그래밍 언어 처리**(Programming Language Processing)와 **컴파일러 설계** 분야 핵심적인 데이터 구조입니다. AST는 소스 코드의 문법적 구조를 **계층적이고 구조화된 트리 형태**로 표현하...
# 데이터 필터링 ##요 데이터 필터링 Filtering)은 데이터 과학 및 분석 과정에서 핵심적인 단계 중 하나로, 원시 데이터(raw data)에서 분 목적에 부적합하거나 불필요한 데이터를 제거하거나 선택하여 유의미한 정보만 추출하는 작업. 이 과정은 데이터 품질을 향상고, 분석의확도와 효율성을 높이며, 모델 학습 시 노이즈(noise)를 줄이는 데...
# 부동소수점 연산 부동소수점 연산(Floating-point arithmetic)은 컴퓨터에서 실수를 표현하고 계산하기 위해 사용하는 수치 계산 방식이다. 이 방은 매우 크거나 매우 작은 수를 효율적으로 다룰 수 있도록 설계되어 있으며, 과학 계산, 공학 시뮬레이션, 그래픽 처리, 인공지능 등 다양한 분야에서 핵심적인 역할을 한다. 본 문서에서는 부동소...
# 트랜스포머 아처 ## 개요 **트스포머**(Transformer) 아처는 자연어(NLP) 분야 혁명적인 변화를끌어낸 딥러닝 모델 구조로, 2017년 구글 딥마인드 연구진이 발표한 논문 *"Attention is All You Need"*에서 처음 소개되었습니다. 기존의 순적 처리 방식(RNN LSTM 등)에 의존하던 자연어 모델들과 달리, 트랜스포머...
# 계층적 소프맥스 ## 개요 **층적 소프맥스**(Hierarchicalmax)는 자연처리(NLP) 대용량 어휘(vocabulary)을룰 때 발생하는산 비용 문제를 해결하기 위해 제된 기술입니다 특히 언어 모델, 단어 임베딩(예: Word2Vec), 기계 번역 등에서 출력층의 소프트맥스 계산이 단어 사전의 크기에 비례하여 매우 비효율적이라는 문제가 있...
# 기계 번역 기계역(Machine Translation, MT은 컴퓨터가 하나 자연어(소스어)로 작성된 텍스트를 다른 자연어(타겟 언어)로 자동으로 변환 자연어 처리(N Language Processing, NLP) 기술의 한 분야입니다. 이 기술은 국제 커뮤니케이션, 문서 번역, 웹 콘텐츠 지역화, 실시간 통역 등 다양한 분야에서 핵심적인 역할을 하며...
LightFM ##요 **LightFM**은 스타업 및 연구자들이 효율 추천 시스을 구축할 수 돕는 오픈소 파이썬 라이브러리입니다. 이 라이브러리는 **합 추천 시스템**(Hy Recommender System)을 구하는 데 특화 있으며, 사용자와템의 **메타데이터**(예: 사용자 프로필, 아이템 카테고리 등)를 활용하여 개인화된 추천을 제공합니다. L...
# WordPiece ## 개요 **WordPiece**는 자연어 처리(Natural Language Processing NLP)에서 널리되는 서브워드(Subword) 토크이제이션(Subword Tokenization) 기법 중 하나로, 특히BERT**(Bidirectional Representations from Transformers와 같은 트랜스머...
# BART ##요 **BART**(Bidirectional and Autogressive Transformer)는 자연어처리LP) 분야에서 널리되는 **사전 훈련된 언어 모델** 중 하나로, 2019년 페이스 AI 리서치(Facebook AI Research FAIR)에서 제안. BART는 기존의 BERT와 GPT의 장점을 결합한 하이브리드 구조를 특...
# 프롬프트 기반 추 ## 개요**프롬프트반 추론**(-based Reasoning) 인공지능, 대규모 언 모델(Large Language Models,LM)의 성능을 평가하고 향상시키기 위한 핵심적인 방법론 중 하나입니다 이 기법은 모델이 주어진(프롬프트)을 바으로 논리적 사고, 추론, 해결 능력을 발휘하도록 유도하는 방식으로, 전통적인 지도 학습 방식...
# 임베딩 계층## 개요 **임베 계층**(Embedding Layer)은 인공지능, 특히 자연어(NLP)와천 시스템 등에서 범주형 데이터를 고차원 실수 벡터로 변환하는 핵심적인 신경망 구성 요소입니다.로 단어, 토큰, 사용자 ID, 상품 카테고리와 같은 이산적(discrete)이고 정수로 표현되는 입력값을 밀집된(dense) 실수 벡터 형태로 매핑하여,...