arxiv2021

Paper Review

LocalViT: Analyzing Locality in Vision Transformers (arxiv2021)

안녕하세요. Transformer에서 사용하는 FFN이 최근 depth-wise separable convolution을 추가해서 많이 사용하고 있습니다. 오늘은 이를 처음으로 제시한 LocalViT에 대해서 소개하도록 하겠습니다. LocalViT: Analyzing Locality in Vision TransformersThe aim of this paper is to study the influence of locality mechanisms in vision transformers. Transformers originated from machine translation and are particularly good at modelling long-range dependencies within a..

Johns Hohns
'arxiv2021' 태그의 글 목록