# 오버샘플링 ## 개요 오버샘플(Over-sampling은 기계 학습 데이터 과학 분야에서불균형 데이터(imbalanced data)** 문제를 해결하기 위해 사용되는 데이터 전 기법 중 하나. 불균형란 특정 클래스의 샘플 수가 다른에 비해 현히 적은 경우를 말하며, 이는 분류 모델의 성능에정적인 영향 미칠 수 있습니다. 예를, 질병 진 데이터에서 건...
검색 결과
"ISI"에 대한 검색 결과 (총 281개)
# AlexNet ## 개요 **AlexNet**은 인공지능, 특히 **컴퓨터비전**(Computer Vision) 분야에서 혁명적인 영향을 미친 심층 신경망Deep Neural Network)** 모이다. 212년에 알스 크리제브스키Alex Krizhev)**, 이오리츠케버**(Ilya Sutskever)**, 그리고 제프리 힌튼**(Geoffrey ...
# ROC 곡선 ## 개요 ROC 곡선(Receiver Operatingistic Curve, 수기 운영 특성 곡선)은 이진류 모델의 성능을각적으로 평가하고 비교하는 데 사용되는 중요한 도입니다. ROC 곡선은 다양한 분류 임계값(threshold)에 **민감도**(감지율, 재현율)와 **위양성율**(거짓 양성 비율)을 비교하여 모델의 판별 능력을 분석...
# TN ## 개요 **TN**(True Negative, 참 음성)은 통계학 및 기계학습에서 분류 모델의 성능을 평가하는 데 사용되는 **혼동 행렬**(Confusion Matrix)의 네 가지 기본 요소 중 하나입니다. TN은 모델이 '음성 클래스(Negative class)'로 올바르게 예측한 사례의 수를 나타냅니다. 즉, 실제 정답이 음성(Neg...
FP **FP**(False Positive, 위양성)는 데이터, 특히 머신러닝과 통계 분석에서 중요한 개념 중 하나로, **모델이 실제로는 부정 클래스**(Negative) **인 사례를 잘못되어 양성 클래스**(Positive) **로 예측한 경우**를 의미합니다. 혼동 행렬(Confusion Matrix)에서 FP는 모델의 오분류 오류를 나타내는 네...
# 예측 정확도 평가 예측 정확도가는 데이터과학에서 머신러닝 모델이나 통계 모델의 성능을 판단하는 핵심 과정이다. 모델이 학습된 후, 새로운 데이터에 대해 얼마나 정확하게 예측하는지를 평가함으로써 모델의 신뢰성과 실용성을 판단할 수 있다. 특히 분류, 회귀, 시계열 예측 등 다양한 예측 과제마다 적절한 평가 지표가 다르므로, 과제의 특성에 맞는 정확도 평...
# 클러스터링 ## 개요 클러스터(Clustering)은 머신러의 대표적인 **비지도 학습**(Unsupervised Learning) 기 중 하나로, 데이터 간의 유사성을 기반으로 데이터를룹화하는 과정을 말합니다. 이 기법은전에 레이블이 주어지지 않은 데이터셋에 적용되며, 데이터의 숨겨진 구조나 패턴을 발견하는 데 유용합니다. 클러스터링은 고객 세분화...
# 특징 추출 ## 개요 **특징 추출**(Feature)은 컴퓨터비전(Computer) 분야에서 이미지나 영상 데이터로부터 의미 있는 정보를 추출하여, 후속 작업(예: 객체 인, 분류, 매칭 등)에 활용할 수 있도록 변환하는 핵심 과정입니다. 원시 이미지 데이터는 픽셀 단위의 밀집된 숫자 배열로 구성되어 있으며, 이를 그대로 분석하는 것은 계산 비용이...
AST 변환기## 개요 변환기(AST)는 **추상 구문 트리**(Abstract Syntax Tree, AST)를 입력으로 받아 이를 구조적으로 분석하고, 목적에 맞게 수정하거나 형태의 AST로 변하는 도구 또는로그램을 의미합니다. AST는스 코드를 구문적으로 분석한 후 생성되는 트리 형태의 데이터 구조로, 컴파일러나 인터프리터가 코드를 해석하고 최적화...
# num_leaves `num_leaves`는 그래디언트 부스팅 머신 러닝 알고리즘 중 하나인 **LightGBM**(Light Gradient Boosting Machine)에서 중요한 하이퍼파라터로, 각각의 결정 트리(decision tree) 가질 수 있는 **최대 잎 노드 수**(maximum number of leaf nodes)를 지정합니다....
# D+ ## 개요 **D+**(Data Plus)는자공학 분야에서 데이터 전송 인터페이스를 구성하는 핵심 신호 라인 중 하나로, 주로 **USB**(Universal Serial Bus) 인터페이스에서 사용된다. USB는 디지털 장치 간의 데이터 통신과 전력 공급을 동시에 가능하게 하는 직렬 버스 표준이며, D+ 신호 라인은 이 통신의 양방향 데이터 ...
# LightGBM GBM은 마이크로소프트에서 개발한성능의 경량 그래디언트 부스팅 프레임워크로, 대규모 데이터셋을 빠르고 효율적으로 처리할 수 있도록 설계된 지도 학습 알고리즘. 특히 분류, 회귀, 순위 예 등의 머신러 태스크에서 뛰어난 성능을 보이며, XGBoost, CatBoost와 함께 대표적인 그래디언트 부스팅 트리(Gradient Boosting...
# 노이즈 증 ## 개요 노이즈 증폭(Noise Amplification)은 영상 처리 과정에서 원본 이미지에 포함된 잡음(noise)이 처리 알고리즘에 의해 강화되거나 과도하게 확대되어 나타나는 현상이다.는 주로 이미지의 선명도를 개선하기 위한 **샤프닝**(sharpening), **대비 조정**(contrast enhancement), 또는 **고...
# Time-of-Flight ## 개요 **Time-of-FlightToF, 비행시간)는체와 센서 사이의 거리를 측정하기 위한 기술로, 빛이나 음파와 같은 신호가 발사되어 물체에 반된 후 수신 때까지의 **비행 시간**(Time of Flight)을 측정함으로써 거리를 계산하는 원리를 사용합니다. 특히 **컴퓨터비전**(Computer Vision) ...
# 결함 검출 ## 개요 결함 검출(Def Detection)은 산업 생산정에서 제품이나 자재에 존재하는 물리적, 구조적 또는 기능적 이상을 식하는 핵심적인 품질 관리 활동입니다. 이는 제조업 전반에서 제품의 신뢰성, 안전성, 일관성을 보장하기 위한 필수 절차로, 자동차, 반도체, 항공우주, 금속 가공, 전자기기 등 다양한 산업 분야에서 활용됩니다. 결...
# 3D 재성 ## 개요 **3D 재구성**(3D Reconstruction)은 2차원(2D)상 또는 영상 시퀀스로부터 물체나 장면의 3차원 구조 복원하는 기술로, 컴퓨터 비전, 의료 영상, 로봇 공학, 증강 현실(AR), 가상 현실(VR), 자율주행 등 다양한 분야에서 핵심적인 역할을 수행한다. 이 기술은 단일 카메라, 스테레오 카메라, 또는 다중 뷰...
# 의사결정 기록화 개요 **의사결정 기록화**(Decision)는 조직 내에서 중요한 결정이 어떻게, 왜, 누구에 의해 이루어졌는지를 체계적으로 기록하고 보관하는 프로세스를 의미. 특히 협업 환경에서 의사결정의 투명성과 책임성을 확보하고, 향후 참고 자료로 활용할 수 있도록 하는 데 핵심적인 역할을 합니다. 기술 분야에서는 소프트웨어 개발, 시스템 ...
# SHA-1 -1( Secure Hash Algorithm 1은 데이터의 무결성을 검증, 디지털 서명, 인증서, 암호화 프로토콜 등 다양한 보안 응용 분야에서 사용되는 **암호학적 해시 함수**입니다. 1995년 국립표준기술연구소(NIST)와 국가안국(NSA)에 의해 개발된 SHA-1은 입력된 임의 길이의 데이터를 고정된 160비트(20바이트) 길이의 ...
# MD5 ## 개요 MD5(Message-Digest Algorithm )는 199년 로널드븐(Ronald Rivest에 의해 개발된 암호화 해시 함수로, 임의 길이의 입력 데이터를 고정된 128트(16바이트) 길이의 해시 값(다제스트)으로 변환하는리즘입니다.5는 주로 데이터 무결성 검사, 체크섬 생성, 비밀번호 저장 등에 사용되어 왔으며, 과거에는 ...
# FRRouting ## 개요 **FRRouting**(일반적으로 **FRR**로 알려짐은 고성능의 오픈소스 **라우팅 소프트웨 스위트**, 다양한 라우팅 프로토콜을 지원하며 리눅스 기반 시스템에서 실행되는 라우터 또는 라우팅 기능을 가진 네트워크 장비에 사용됩니다. FRR은 기업, 서비스 제공업체, 클라우드 인프라 및 SDN(소프트웨어 정의 네트워킹...