คัมภีร์ YOLO LPR Object Detection (สอน Custom Model , ใช้ dataset ของตัวเองมาเทรน ชิวๆ part1 เตรียม data)

4 min readNov 26, 2019

--

มาถึงก็ขอเกริ่นก่อนนิดนึง บทความนี้เขียนขึ้นมาสำหรับมือใหม่ที่ต้องการจะ custom model เป็นของตัวเองในการใช้ YOLO Object Detection เด้อ ใครที่เทพแล้วก็ข้ามไปซะ เพราะที่จะทำต่อไปนี้คือ basic ? ชิวๆ ย้ำว่าชิวเด้อ (เดี๋ยวจะอธิบายแบบระเอียดเท่าที่จะทำได้นะ — เลต สะ โก๋วว)

ทำความเข้าใจ?

A . อี YOLO ที่เขาพูดๆกันมันไว้ใช้ทำอะไรกันเหรอ?

ตอบ หลักๆมันมีประโยชน์ไว้ใช้จำแนกประเภทสิ่งของ (classification) หรือ Object Detection นั่นแแหละ คือมันจะสนใจแต่ object ที่เราต้องการ

เนี่ย จำแนกประเภทสิ่งของแบบ จ๊าบ ว้าว ดูมีความเป็น ai

คือที่จะพาทำวันนี้ก็คือ จะพา Train data ที่เป็นชนิดรูปภาพมา Train ให้มันสามารถแยกประเภทวัตถุได้โดยที่เป็น dataset ของเรา

โดย dataset ครั้งนี้ผมจะใช้ dataset ที่เป็นรูปรถยนต์ หรือยานพาหนะที่เป็นพวก 4 ล้อ

ความต้องการ

ตอนนี้ เราต้องการให้โปรแกรม มันแยกประเภทได้ว่า รูปที่เรา input เข้ามามันมีรถอยู่ในรูปหรือไม่ ถ้ามี ให้มันหาตำแหน่งของป้ายทะเบียน แล้วก็ให้มันตีกรอบ หรือ crop วัตถุที่เป็นป้ายทะเบียนรถ หรือยานพาหนะไป save เพื่อเอาไปใช้อย่างอื่นต่อไป…

ตัวอย่างเด้อ

…เริ่มเลยดีกว่า… เอ้า ปาย ปาย ปาย ปาย ปาย ปาย 555

เริ่มจากเตรียม dataset ที่เรามี ไหนดูซิ..

แว้ป…โฟลเดอร์นี้มีประมาณ 1500 image (คือยิ่งเยอะยิ่งดีแหละ)

2. เราต้องสร้าง label image ซึ่งในที่นี้จะใช้เป็น .txt

label image มันคืออะไร? ทำไมต้องมี? ทำไมต้องใช้ ?

อธิบายแปป

การทำ label imageเนี่ย มันคือการกำหนดตำแหน่งของ object ที่เราต้องการเว้ย ซึ่งใน ไฟล์ .txt จะเก็บตำแหน่งที่เรากำหนดไว้ตามนี้

นี่คือตำแหน่งของ object ที่เราต้องการ ที่มันอยู่ในภาพ

ค่าแรก category number มันคือ class ของ object เริ่มต้นจาก 0 ถ้าเรามี 5 object ในภาพเช่น คน หมา แมว… ก็ 0,1,2 ไปเรื่อยๆ ในที่นี้เรามี class เดียวก็ 0 วนๆไปครับ

ค่าที่สอง bounding box left X คือ ตำแหน่งเริ่มต้นแกน X ของ object

ค่าที่สาม bounding box top X คือ ตำแหน่งเริ่มต้นแกน X ของ object ที่อยู่ขวาล่าง

ค่าที่สี่ bounding box top Y คือ ตำแหน่งเริ่มต้นแกน Y ของ object ที่อยู่ขวาล่าง

พอเราได้ไอ้ตำแหน่ง 2 จุดนี้ เราจะได้ค่า กว้าง x ยาว มาเอง (ขี้เกียจพิมแล้วไปหาเองเด้อ 55)

วิธีการทำ label image นะ

https://github.com/tzutalin/labelImg วาร์ปไปตามนี้เลย อันนี้เหมือนเป็น tool ที่เอาไว้ทำ label โดยล้วนๆ แตกไฟล์เสร็จรันทำตาม เอ้อ ต้องลง PyQt5 ด้วยเด้อ เพราะมันต้องเรียกใช้หน้า interface หรือ gui ที่เป็น PyQt

พอ labelเสร็จ ตามรูปก็จะได้ชื่อไฟล์ตามรูปที่ label ไว้

3. จะเห็นว่าตอนนี้เรามีไฟล์อยู่ 2 ชนิดแล้ว คือ .jpg กับ .txt

**จะได้ label ที่บอกตำแหน่งป้ายทะเบียน กับ image แบบนี้**

4. YOLO step

ไป clone project มาซะ https://github.com/AlexeyAB/darknet พูดง่ายๆก็ไป download นั่นแหละ โหลดมาเพื่อจะใช้เป็นตัวช่วยในการ Learn

เสร็จทีนี้สร้าง path ตามนี้ เพราะผมเอาไว้ในนี้

D:\GOD_YOLOV3_1\darknet-master\build\darknet\x64\data\obj

ซึ่งในโฟลเดอร์ obj เนี่ยผมจะเก็บไฟล์ภาพ และ .txt ที่เรา label ไว้

5. เตรียมไฟล์ config

สร้างไฟล์ obj.names และ obj.data เก็บไว้ในโฟลเดอร์ data นะ

5.1 ) สร้างไฟล์ obj.names ทำหน้าที่คอบบอกชื่อ class

5.2 ) สร้างไฟล์ obj.data

classes = 1 หมายความว่า เรามีคลาสเดียว นั่นคือคลาสป้ายทะเบียนนั่นเอง

train = จะบอก path ที่เชื่อมไปตอน train ข้อมูลของเรา

valid = จะบอก path ที่เชื่อมไปตอน test ข้อมูลของเรา

names = คอยบอกชื่อ object ไม่มีอะไร

backup = ตอนที่เรา train เสร็จ มันจะเก็บไฟล์ weights ไว้ใน path นี้ (ที่เราต้องการก็คือไอ้ไฟล์ weights นี่แหละ)

5.3 ) ต่อมาเราต้องมีไฟล์ train.txt และ test.txt เพื่อบอกที่อยู่ของ image data และ image label

import os
path=’data/obj/’
imgList=os.listdir(‘images’)
print(imgList)
textFile=open(‘train.txt’,’w’)
for img in imgList:
imgPath=path+ img +’\n’
textFile.write(imgPath)

ข้างบนคือ code generate path train และ test