ลง Docker ง่ายๆสำหรับ Data Scientist ใน 5 นาที

Boyd BigData RPG
Big Data Engineering
3 min readApr 25, 2018

มาเริ่มต้นรู้จัก Docker สำหรับ Data Scienctist กันเถอะ !!
(** สำหรับ Mac **)

เห็นหน้าตาน่ารักแบบนี้ แต่ละตัวร้ายกาจไม่เบาเลยนะ !!

เนื้อหาบทความนี้ เราจะมาทำความรู้จัก Docker สำหรับ Data Scientist กัน โดยจะอธิบายไปทีละขั้น และได้เข้าใจจากศูนย์เลย เพราะว่าบอยด์เองก็เริ่มต้นจากศูนย์เลยอยากอธิบายเรื่องยากๆให้เข้าใจง่ายๆครับ

สิ่งที่จะต้องเตรียมติดตั้งก่อนเริ่มคือ

  1. Anaconda and Jupyter notebook
    >> Link Download <<

เลือก Version Python 3.6 ได้เลยครับ

2. Docker Community edition
>> Link Download <<

หลังเข้า link เลื่อนหน้าจอลงมาแล้วทำการเลือกโหลด Mac OS ได้เลย

หลังลงเสร็จเรียบร้อยแล้วเราก็มาลองทดสอบดูในเครื่องผ่านภาษา BASH กัน เริ่มจากการเปิดโปรแกรม “Terminal” ขึ้นมา

  1. ตรวจสอบ Anaconda
<< เครื่องหมาย $ ไม่ต้องพิมพ์นะครับแค่ให้รู้ว่าคำสั่งเรามันต่อจากเครื่องหมาย $ >>$ pwd
พิมพ์ pwd หรือ (Print work directory)เพื่อตรวจสอบว่าตอนนี้เรากำลังอยู่ที่ directory ตรงไหน
จากนั้นลองพิมพ์$ ls
หรือ list เพื่อดูว่ามีไฟลล์ หรือ folder อะไรบ้างเอ่ย

ผลลัพธ์จาก $ pwd

ผลลัพธ์จาก $ ls

ถ้าเราเห็นชื่อ Folder “anaconda3” ก็แสดงว่าลงเรียบร้อยครับ

2. ตรวจสอบ Docker CE (community edition)

  • ทำการคลิกตัวปลาวาฬแล้วทำการ open
  • จะเห็นการทำงานของเจ้าปลาวาฬอยู่ด้านบนขวาของคอมส์
    เขียนว่า “Docker is running” ก็เป็นอันเสร็จ

ต่อมาทำการสมัคร Docker Hub เพื่อทำการดึง Image ไฟล์มาลงไว้ในเครื่องกัน

<< Link สมัคร Docker Hub >>

หลังจากสมัครเรียบร้อยเราสามารถค้นหา Image เพื่อมาติดตั้งใช้งานใน Docker เราได้ครับ

Image คืออะไร ??

Image คือตัวไฟลล์ต้นฉบับเพื่อไว้ทำการติดตั้งใน Docker ของเราครับ ถ้าเปรียบง่ายๆก็เหมือนกับตัวติดตั้งโปรแกรมนั่นเอง แต่ไม่ใช่เสียทีเดียวนะ =]

ทำการดึง image ลงมาที่เครื่องเรา

image ที่จะใช้กันชื่อ “jupyter/datascience-notebook”

วิธีการดึงลงมาที่เครื่องเรา

ทำโดยเปิด Terminal ขึ้นมาครับ

ทำการพิมพ์
$ docker ps
เพื่อตรวจสอบว่ามีโปรแกรมรันอยู่ไหมเอ่ย
$ docker images
เพื่อตรวจสอบว่าเรามี image อะไรที่เครื่องบ้าง

ในตอนนี้เราจะยังไม่พบสิ่งใด เพราะยังไม่เคยรัน และดึงมาใช้งานนั่นเองครับ

ต่อมาทำการดึง image มารันโปรแกรมกัน

ทำการพิมพ์$ docker pull jupyter/datascience-notebookเพื่อทำการดึง image jupyter/datascience-notebook มาไว้ที่เครื่อง$ docker run -it --rm -p 8888:8888 jupyter/datascience-notebook-it คือการสั่ง interactive terminal
--rm ทำการลบที่รันเก่าทิ้งก่อน
-p คือการสร้าง port เชื่อมกันระหว่าง port ใน local:docker
  • จะได้หน้าตาแบบนี้

หลังจากรันจะมี URL ออกมาให้เรานำไปใช้ในการเข้า Jupyter Notebook นั่นเอง

  • หากเข้ามาก็จะได้หน้าตาแบบนี้

เย้ๆ ทำได้แล้ว มาลองรันคำสั่งทดสอบกันดีกว่า XD

ทำการคลิก new >> เลือก python3 เพื่อสร้าง Sheet มาใช้ในการรันคำสั่ง

ลองพิมพ์

print("Hello World")
แล้วทำการคลิก shift + enter เพื่อรันคำสั่ง

เสร็จแล้วครับสำหรับการใช้งาน Jupyter Notebook เพื่อใช้งานใน Docker เพราะมันสำคัญมากๆเลยในการทำงานระดับ production เพื่อร่วมกับทีม developer อื่นๆ เพราะในความเป็นจริง code เรานั้นต้องถูก deploy ไปใช้งานร่วมกับ service อื่นๆนั่นเองครับ ไม่ได้ทำการรันเฉพาะบนเครื่องเราเท่านั้น =]

ขอบพระคุณทุกท่านที่ติดตามครับ

More Share, More Fun

ติดตามเนื้อหาเพิ่มเติมได้ที่

Facebook Fanpage: https://www.facebook.com/bigdatarpg

--

--

Boyd BigData RPG
Big Data Engineering

Lead Data Scientist | Digital Marketer | Biotechnologist | Vlogger | @BigDataRPG | BS Biot30 KU69 | BD03 DPU