검색 결과

검색어를 입력하세요.

카테고리:

Vision Transformer

기술 > 인공지능 > 신경망 모델 | 익명 | 2025-09-11 | 조회수 74

# Vision Transformer ## 개요 **Vision Transformer**(ViT)는 전통적으로 이미지 인 작업에서 지배적인 위치를 차지해온합성곱 신망**(CNN)과는 다른 접근 방식을 제시한 획기적인 인공지능 모델이다. 2020년 Research 팀이 발표한 논문 *"An Image is Worth 16x16 Words: Transfor...

#Vision Transformer #Transformer 아키텍처 #이미지 패치화 #멀티헤드 어텐션 #ImageNet

CLIP

기술 > 인공지능 > 멀티모달 모델 | 익명 | 2025-09-11 | 조회수 81

# CLIP: 컨텍스트 기반 다중 모달 모델 ## 개요 **CLIPContrastive Language–Image Pre-training)은 OpenAI에서 2021에 발표한 **티모달 인공지능 모델**로, 이미지와 텍스트 간의 관계를 학습하여 시각적 정보와 언어 정보를 동시에 이해하는 능력을 갖춘 대표적인 모델입니다. CLIP은 전통적인 컴퓨터 비전 ...

#CLIP #멀티모달 모델 #대조 학습 #Zero-Shot 전이 #Vision Transformer