ลง Docker ง่ายๆสำหรับ Data Scientist ใน 5 นาที
มาเริ่มต้นรู้จัก Docker สำหรับ Data Scienctist กันเถอะ !!
(** สำหรับ Mac **)
เห็นหน้าตาน่ารักแบบนี้ แต่ละตัวร้ายกาจไม่เบาเลยนะ !!
เนื้อหาบทความนี้ เราจะมาทำความรู้จัก Docker สำหรับ Data Scientist กัน โดยจะอธิบายไปทีละขั้น และได้เข้าใจจากศูนย์เลย เพราะว่าบอยด์เองก็เริ่มต้นจากศูนย์เลยอยากอธิบายเรื่องยากๆให้เข้าใจง่ายๆครับ
สิ่งที่จะต้องเตรียมติดตั้งก่อนเริ่มคือ
- Anaconda and Jupyter notebook
>> Link Download <<
เลือก Version Python 3.6 ได้เลยครับ
2. Docker Community edition
>> Link Download <<
หลังเข้า link เลื่อนหน้าจอลงมาแล้วทำการเลือกโหลด Mac OS ได้เลย
หลังลงเสร็จเรียบร้อยแล้วเราก็มาลองทดสอบดูในเครื่องผ่านภาษา BASH กัน เริ่มจากการเปิดโปรแกรม “Terminal” ขึ้นมา
- ตรวจสอบ Anaconda
<< เครื่องหมาย $ ไม่ต้องพิมพ์นะครับแค่ให้รู้ว่าคำสั่งเรามันต่อจากเครื่องหมาย $ >>$ pwd
พิมพ์ pwd หรือ (Print work directory)เพื่อตรวจสอบว่าตอนนี้เรากำลังอยู่ที่ directory ตรงไหนจากนั้นลองพิมพ์$ ls
หรือ list เพื่อดูว่ามีไฟลล์ หรือ folder อะไรบ้างเอ่ย
ผลลัพธ์จาก $ pwd
ผลลัพธ์จาก $ ls
ถ้าเราเห็นชื่อ Folder “anaconda3” ก็แสดงว่าลงเรียบร้อยครับ
2. ตรวจสอบ Docker CE (community edition)
- ทำการคลิกตัวปลาวาฬแล้วทำการ open
- จะเห็นการทำงานของเจ้าปลาวาฬอยู่ด้านบนขวาของคอมส์
เขียนว่า “Docker is running” ก็เป็นอันเสร็จ
ต่อมาทำการสมัคร Docker Hub เพื่อทำการดึง Image ไฟล์มาลงไว้ในเครื่องกัน
<< Link สมัคร Docker Hub >>
หลังจากสมัครเรียบร้อยเราสามารถค้นหา Image เพื่อมาติดตั้งใช้งานใน Docker เราได้ครับ
Image คืออะไร ??
Image คือตัวไฟลล์ต้นฉบับเพื่อไว้ทำการติดตั้งใน Docker ของเราครับ ถ้าเปรียบง่ายๆก็เหมือนกับตัวติดตั้งโปรแกรมนั่นเอง แต่ไม่ใช่เสียทีเดียวนะ =]
ทำการดึง image ลงมาที่เครื่องเรา
image ที่จะใช้กันชื่อ “jupyter/datascience-notebook”
วิธีการดึงลงมาที่เครื่องเรา
ทำโดยเปิด Terminal ขึ้นมาครับ
ทำการพิมพ์
$ docker ps
เพื่อตรวจสอบว่ามีโปรแกรมรันอยู่ไหมเอ่ย$ docker images
เพื่อตรวจสอบว่าเรามี image อะไรที่เครื่องบ้าง
ในตอนนี้เราจะยังไม่พบสิ่งใด เพราะยังไม่เคยรัน และดึงมาใช้งานนั่นเองครับ
ต่อมาทำการดึง image มารันโปรแกรมกัน
ทำการพิมพ์$ docker pull jupyter/datascience-notebookเพื่อทำการดึง image jupyter/datascience-notebook มาไว้ที่เครื่อง$ docker run -it --rm -p 8888:8888 jupyter/datascience-notebook-it คือการสั่ง interactive terminal
--rm ทำการลบที่รันเก่าทิ้งก่อน
-p คือการสร้าง port เชื่อมกันระหว่าง port ใน local:docker
- จะได้หน้าตาแบบนี้
หลังจากรันจะมี URL ออกมาให้เรานำไปใช้ในการเข้า Jupyter Notebook นั่นเอง
- หากเข้ามาก็จะได้หน้าตาแบบนี้
เย้ๆ ทำได้แล้ว มาลองรันคำสั่งทดสอบกันดีกว่า XD
ทำการคลิก new >> เลือก python3 เพื่อสร้าง Sheet มาใช้ในการรันคำสั่ง
ลองพิมพ์
print("Hello World")
แล้วทำการคลิก shift + enter เพื่อรันคำสั่ง
เสร็จแล้วครับสำหรับการใช้งาน Jupyter Notebook เพื่อใช้งานใน Docker เพราะมันสำคัญมากๆเลยในการทำงานระดับ production เพื่อร่วมกับทีม developer อื่นๆ เพราะในความเป็นจริง code เรานั้นต้องถูก deploy ไปใช้งานร่วมกับ service อื่นๆนั่นเองครับ ไม่ได้ทำการรันเฉพาะบนเครื่องเราเท่านั้น =]
ขอบพระคุณทุกท่านที่ติดตามครับ
More Share, More Fun
ติดตามเนื้อหาเพิ่มเติมได้ที่
Facebook Fanpage: https://www.facebook.com/bigdatarpg