DETR: Objektgenkendelse med Transformere

Oliver Gyldenberg Hjermitslev
Computer Vision Corner
1 min readMar 19, 2021
Photo by Jonathan Hanna on Unsplash

Facebook har for nyligt udviklet DETR, et objektgenkendelsesnetværk baseret på en deep learning algoritme kendt som “transformer”. DETR, som står for DEtection TRansformer, er et skridt i den rigtige retning, idet det reducerer mængden af domænekendskab, udvikleren skal have. Det simplificerer resultaterne og beregningsprocessen, og præsenterer et stærkt resultat i både hastighed og præcision.

Der er dog et problem med dette værktøj; modellen er både dyr og langsom at træne, og deres open-source kode er ikke beregnet til brug med ens eget dataset. Derfor har vi udviklet en version af DETR, der nemt kan finpudses på ens eget dataset. Det betyder, at den store mængde træning, Facebook selv har udført, ikke er spildt, og samtidig kan vi kan specialisere modellen til at finde præcis den slags objekter i billeder, vi kunne være interesserede i.

Du kan læse mere om DETR og vores kode her: https://towardsdatascience.com/training-detr-on-your-own-dataset-bcee0be05522. Der er desuden links til vores kode og en guide til at finpudse netværket.

--

--

Oliver Gyldenberg Hjermitslev
Computer Vision Corner

Visual Computing Specialist at the Alexandra Institute, Denmark. I work with computer vision, computer graphics, and deep learning.