Robust objektgenkendelse uden manuel dataannotering

Oliver Gyldenberg Hjermitslev
Computer Vision Corner
2 min readNov 24, 2020
Visuel demonstration af objektgenkendelsesalgoritmen i aktion. Kilde

For at bruge Deep Learning og neurale netværk skal man være i besiddelse af tusindvis af velannoterede datapunkter — ofte, i vores tilfælde, billeder. Vi har udviklet en motor til at generere annoteret billeddata til objektgenkendelsesproblemer som vist ovenfor. Med denne form for syntetiske data kan man slippe for besværet med manuelt at indikere områder og klasser i ens data, og komme hurtigt i gang med at træne sit netværk.

Eksempler på genererede billeder af en boremaskine

Vores program kræver kun en 3D-model for hvert objekt, man er interesseret i automatisk at detektere i billeder. Herefter genereres tusindvis af datapunkter med varierende farver, størrelser, baggrunde, og tilfældigt støj. På denne måde bliver det neurale netværk enormt robust, og kan genkende selv svære objekter i meget rodede billeder.

Programmet, samt træningen og implementeringen af det neurale netværk, er beskrevet yderligere i denne blogpost. Her diskuterer jeg også bagsiden af medaljen vedrørende syntetisk data, og hvordan man overkommer eventuelle problemer. Syntetisk data åbner op for en enorm mængde muligheder for træning af neurale netværk. I dette tilfælde skabte det et helt datasæt til objektgenkendelse, som ikke før eksisterede, og det på en brøkdel af tiden det ville have taget at manuelt annotere et lignende diverst datasæt.

Har du spørgsmål eller forslag til motoren? Deltag gerne i diskussionen, eller henvend dig til mig på oliver.gyldenberg@alexandra.dk

--

--

Oliver Gyldenberg Hjermitslev
Computer Vision Corner

Visual Computing Specialist at the Alexandra Institute, Denmark. I work with computer vision, computer graphics, and deep learning.