# 문서 임베딩 ##요 **문서 임딩**(Document Embedding)은어 처리(NLP 및 인공지능야에서 텍스트를 수치적 벡터 형태로 변환하는 기술 중로, 전체 문서 고차원 실수 벡터로하는 방법을 의미합니다 이 벡터는 문서의 의미적, 문적 특징을 포착하며, 유사도 계산, 문서 분류, 클러스터링, 검색 시스템 등 다양한 응용 분야에서 핵심적인 역할을...
검색 결과
"군집화"에 대한 검색 결과 (총 26개)
# 학습 데이터 ## 개요 **학습 데이터**(Training Data)는 기계학습(Machine Learning) 모델이 특정 과제를 수행할 수 있도록 훈련시키기 위해 사용되는 데이터 세트를 의미합니다. 이 데이터는 모델이 입력과 출력 간의 관계를 학습하고, 새로운 데이터에 대해 예측 또는 분류를 수행할 수 있는 능력을 습득하는 데 핵심적인 역할을 합...
# 의료 분석 ## 개요 의료 분석은 인공지능(AI) 기술 중 머신러닝(ML)을 활용하여 의료 데이터를 처리하고 해석하는 과정입니다. 이는 질병 진단, 치료 계획 수립, 예후 예측 등 다양한 의료 영역에서 혁신적인 변화를 가져왔습니다. 머신러닝은 대량의 의료 데이터(예: 환자 기록, 영상 자료, 유전자 정보)를 분석하여 숨겨진 패턴을 발견하고, 의사결정을...
# DBSCAN ## 개요/소개 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 데이터 포인트의 밀도를 기반으로 군집을 형성하는 비모수적 클러스터링 알고리즘입니다. 1996년 Martin Ester 등이 제안한 알고리즘으로, K-means와 같은 전통적인 클러스터링 방법과 달리 *...
# K-평균 ## 개요 K-평균(K-Means)은 데이터를 **군집화(Clustering)**하는 대표적인 비지도학습(unsupervised learning) 알고리즘입니다. 주어진 데이터 포인트를 사전에 정의된 **K개의 군집**으로 분류하여, 각 군집 내 데이터 간 유사도를 최대화하고, 다른 군집과의 차이를 최소화하는 방식으로 작동합니다. 이 ...
# 계층적 분류 (Hierarchical Clustering) ## 개요/소개 계층적 분류(Hierarchical Clustering)는 데이터 포인트 간의 유사도를 기반으로 계층 구조를 형성하여 클러스터를 생성하는 비단순 군집화 방법이다. 이 기법은 **계층적 구조**(Dendrogram)로 시각화되며, 데이터의 자연적인 계층 구조를 탐지하는 데 유용하...