YoungBeeninNeuralworksAn Image is Worth 16x16 Words: Transformers for Image Recognition at ScaleNLP에서는 사실상 표준이 되어버린 Transformer. 이 NLP Transformer 아키텍처를 최대한 비슷하게 Vision에 적용한 Vision Transformer(ViT) 모델에 대해 알아봅시다.Feb 25, 2021Feb 25, 2021