Introducing New BigQuery Editions
Data Warehouse อันดับ 1 จาก Google กับตัวเลือกใหม่ที่หลากหลายขึ้น จะเลือกให้ถูกกับการใช้งาน หรือเลือกให้ราคาถูกลงก็ทำได้ มีตัวเลือกมากขึ้น การทำงานกับข้อมูลก็สนุกขึ้นไปอีก
BigQuery — Data Warehouse ของ Google Cloud
BigQuery ขึ้นชื่อทั้งเรื่องความแรงในการประมวลผลข้อมูลขนาดใหญ่ (หลักหลายร้อย petabytes) และเรื่องการใช้งานที่ง่ายและหลากหลาย โดยข้อมูลชุดเดียว สามารถทำ Ad hoc query, สร้าง Dashboard, วิเคราะห์ Pivot table หรือ Geospatial analytics รวมทั้งการทำ Machine Learning ทั้งหมดสามารถทำบน BigQuery ได้โดยตรง ไม่ต้องย้ายข้อมูลออกไปยัง services ต่างๆ ทำให้ BigQuery ทั้งใช้งานง่าย เพิ่มมูลค่าของข้อมูล และยังช่วยลดปัญหาข้อมูลซ้ำซ้อน ที่เป็นปัญหาที่หลายคนต้องปวดหัวกับ Data platform แบบอื่นๆ ที่จำเป็นต้องย้ายข้อมูลเข้าๆออกๆ แทบทุกครั้งที่จะนำข้อมูลไปใช้ในลักษณะงานที่แตกต่างกัน
The New BigQuery Editions
วันนี้กับตัวเลือกใหม่ในการคิดราคาแบบ Editions ที่สามารถเลือกให้ตรงกับลักษณะการใช้งาน จะเลือกแบบเริ่มต้นเพื่อราคาที่ถูกกว่า หรือจะเลือกผสมกันหลาย Editions ก็สามารถทำได้
ทุก Editions มาพร้อม (1) Compute capacity autoscaling คิดราคาตามจำนวนวินาทีที่ใช้งานจริง (เริ่มต้น 1 นาที) สามารถเปิดปิดเองอัตโนมัติแบบ real-time และ (2) Compressed storage ที่ช่วยประหยัดค่าจัดเก็บข้อมูลเพิ่มขึ้นไปอีก
เพื่อความเข้าใจที่ถูกต้องของ BigQuery editions ขอปูพื้นการคิดราคาคราวๆ ของ BigQuery กันก่อน
1. ราคาดี เข้าใจง่าย
เป็นที่ยอมรับกันว่า BigQuery มีราคาที่ย่อมเยา รวมทั้งวิธีการคิดที่เข้าใจง่าย 4 ข้อ
- ค่าจัดเก็บข้อมูล ไม่กี่ร้อยบาทต่อ Terabyte ต่อเดือน
- เก็บไว้ไม่เปลี่ยนแปลงเกิน 90 วัน ลดครึ่งราคา
- เก็บไว้เฉยๆไม่ประมวลผล ก็ไม่ต้องเสียค่าใช้จ่ายอะไรเพิ่ม
- ประมวลผลก็จะคิดราคาตามการใช้จริง ที่เรียกว่า On-demand ซึ่งจะคำนวณตาม Bytes scanned และมี Cache ช่วยให้ไม่ต้องจ่ายเพิ่มหาก query ซ้ำเดิมภายใน 24 ชั่วโมง
2. Flat-rate ควบคุมราคาได้ไม่ยาก
ลูกค้าหลายรายพอเริ่มใช้ BigQuery แบบ On-demand เยอะขึ้น จำนวน Bytes scanned อาจเริ่มมีความผันผวน และควบคุมค่าใช้จ่ายยากขึ้น เนื่องจากในหลายธุรกิจมีความไม่แน่นอนของขนาดข้อมูลในแต่ละวัน กรณีนี้ทาง Google Cloud ก็มีทางเลือกการคิดราคาแบบ Flat-rate คือคิดค่าประมวลผลเป็นรายเดือน ตามขนาด BigQuery Slots (หน่วยประมวลผล คล้ายๆ จำนวน CPU) เพื่อให้การควบคุมค่าใช้จ่ายง่ายขึ้น สามารถตั้งงบล่วงหน้าได้ และในหลายๆกรณี (เช่น data pipeline ขนาดใหญ่) การคิดราคาแบบ Flat-rate ยังทำให้ลดค่าใช้จ่ายลงได้อีกด้วย
3. Flex slots เปิดปิดได้ ไม่ต้องจ่ายเต็มเดือน
ลูกค้าบางรายอยากจ่ายแบบ Flat-rate แต่ไม่ต้องการจ่ายเต็มทั้งเดือน เมื่อไม่กี่ปีมานี้ ทาง Google Cloud ได้เพิ่มอีกทางเลือกแบบ Flex slots คือเหมือน Flat-rate ที่คิดอัตราต่อชั่วโมง แต่ไม่ต้องจ่ายเต็มเดือน โดยจ่ายตามการใช้จริงจาก 1 นาทีแรกที่เปิด และทุกๆวินาทีต่อไปจนกว่าจะปิด ลูกค้าหลายแห่งก็เลือกใช้ตัวเลือกนี้ เพื่อให้ได้ทั้งความเร็วที่ต้องการ และได้ทั้งความสะดวกในการควบคุมงบ แต่วิธีนี้จะนิยมกันเฉพาะในกลุ่มที่ค่อนข้างเชี่ยวชาญในการใช้งาน BigQuery เพราะการเปิดปิด แม้จะสามารถทำผ่าน Console ได้ แต่ส่วนใหญ่มักจะ Automate ผ่าน API call มากกว่า รวมทั้งความยุ่งยาก ที่จะต้องกำหนดจำนวน Slots ที่ต้องการเปิดในแต่ละครั้งด้วย
The New BigQuery Editions
จากเสียงเรียกร้องของลูกค้า BigQuery ที่อยากให้คิดราคาตามการใช้งานจริงแบบ On-demand แต่สามารถควบคุมค่าใช้จ่ายได้แบบ Flat-rate โดยไม่ต้องมีความยุ่งยากในการเปิดปิด หรือต้องกำหนดจำนวน Slots แบบ Flex slots ล่าสุดทาง Google Cloud ได้ประกาศทางเลือกในการคิดราคาค่าประมวลผลข้อมูลแบบใหม่ ในชื่อ BigQuery editions ที่มาใน 3 ระดับฟีเจอร์ ที่มีราคาที่แตกต่างกัน
- Standard จะตัดมาพร้อมฟีเจอร์ที่ใช้กันแพร่หลายที่สุด กับราคาที่ถูกกว่า เหมาะสำหรับ การเริ่มใช้งาน หรืออยู่ในช่วง Development
- Enterprise มาพร้อมฟีเจอร์ที่ครบถ้วน เช่น BigQuery ML, BI Engine, รวมทั้งฟีเจอร์เกี่ยวกับ Security และ Governance เหมาะสำหรับ Production Workload
- Enterprise Plus เหนือกว่าด้วยฟีเจอร์ขั้นสูง เช่น CMEK (การจัดการ Encryption Key ด้วยตนเอง) หรือ Assured Workload ที่มีไว้สำหรับ Regulatory Compliance เช่น FedRAMP, ITAR
Editions รวมข้อดีจากทุกตัวเลือกเดิม เพิ่มเติมคือ Autoscaling
ทั้ง 3 Editions จะคิดค่าใช้จ่ายเป็น Slot hours คุมงบได้เหมือน Flat-rate โดยจะเริ่มคิดจากนาทีแรก และเพิ่มทุกๆวินาทีต่อมา เหมือน Flex slots โดยไม่ต้องเปิดปิดเอง แต่ปล่อยให้ Autoscaling ปรับจำนวน Slots ขึ้นลงตามการใช้งานจริงแบบ real-time โดยอัตโนมัติ ถ้ากำหนดค่าต่ำสุดเป็นศูนย์ ก็จะเหมือน On-demand คือไม่มีค่าประมวลผล ถ้าไม่ได้ใช้งาน
ใช้แทนแบบเดิม แต่ควบคุมง่ายกว่าเดิม
เพื่อลดความยุ่งยาก ตัวเลือกแบบ Editions นี้จะมาแทนที่ ทั้ง Flex slots และ Flat-rate เนื่องจาก BigQuery Editions สามารถใช้ Autoscaling มาเปิดปิด slots คล้าย Flex slots (แต่เปิดปิดอัตโนมัติ) หรือจะปรับค่า min กับ max slots ให้เท่ากัน ซึ่งจะเหมือนกับ Flat-rate คือ เปิดตลอดไม่มี Autoscaling
ส่วนค่า min slots ยังมีตัวเลือกเพิ่มเติมแบบ 1 ปี commitment กับส่วนลด 20% หรือ แบบ 3 ปีกับส่วนลด 40% (ค่า max จะสามารถตั้งได้ทุก Editions แต่ค่า min และ commitment saving จะต้องเป็น Enterprise ขึ้นไปเท่านั้น)
ผสมเองได้ตามความต้องการ
สำหรับลูกค้าที่คุ้นเคยกับ Google Cloud อาจจะทราบอยู่แล้วว่า สามารถบริหารจัดการ Services ต่างๆผ่านการสร้าง Project เพื่อใช้เป็นขอบเขตในการจัดการ สำหรับ BigQuery ก็เช่นกัน เราสามารถสร้าง Project A สำหรับการจัดเก็บข้อมูล ส่วน Project B จะเลือก Standard Edition สำหรับ Development และสร้างอีก Project C เพื่อเลือก Enterprise Edition สำหรับงาน Production ซึ่งการสร้าง Project นี้ไม่มีค่าใช้จ่ายเพิ่มเติม จึงสามารถออกแบบการผสม Editions ได้ตามความต้องการ
ตัวเลือกง่ายๆครบๆแบบเดิมยังมีอยู่
ในส่วนการคิดค่าประมวลผลแบบ On-Demand จะยังมีให้เลือกอยู่เหมือนเดิม แต่เพื่อให้สอดคล้องกับ Editions ที่มีทั้งแบบราคาถูกลงสำหรับการใช้เฉพาะฟีเจอร์ยอดนิยมใน Standard หรือแบบครบถ้วนที่มีราคาสูงขึ้นใน Enterprise ดังนั้นรูปแบบ On-Demand ที่จะยังคงมีฟีเจอร์ครบทั้งหมด จึงถือว่าเป็นทางเลือกที่ premium จึงมีการปรับราคา On-Demand เพิ่มขึ้นให้เหมาะสม และสอดคล้องกันเมื่อเทียบกับการจ่ายแบบ Editions สำหรับรายละเอียดเพิ่มเติม พร้อมราคาใหม่ทั้งหมด สามารถตรวจสอบได้ที่ https://cloud.google.com/bigquery/pricing
เริ่มเปลี่ยนเมื่อไหร่
ตัวเลือกแบบ Editions จะมีให้เลือกใช้ตั้งแต่วันที่ 29 มีนาคม 2023 ผ่าน BigQuery เมนู Capacity management ส่วนคนที่ใช้ Flat-rate และ Flex slots จะใช้ได้จนถึงวันที่ 5 กรกฎาคม 2023 เพื่อให้มีเวลาเพียงพอ ในการพิจารณาปรับเปลี่ยนให้เป็น Editions ตามความเหมาะสม หลังจากวันที่ 5 จะไม่สามารถเลือกใช้ Flat-rate และ Flex slots ได้อีก รวมทั้งระบบจะทำการโอนย้าย Flat-rate และ Flex slots มาเป็น Enterprise Edition โดยอัตโนมัติ เพื่อคงความสามารถให้ใกล้เคียงกับรูปแบบเดิมให้มากที่สุด
The New Compressed Storage
สำหรับค่าจัดเก็บข้อมูล แม้จะมีราคาที่ต่ำอยู่แล้ว ทาง Google Cloud ได้ออกฟีเจอร์ Compressed Storage ที่ทำให้สามารถลดขนาดการจัดเก็บข้อมูล (ตั้งแต่ 50–70% ขึ้นอยู่กับลักษณะข้อมูล) แต่ไม่มีผลกระทบกับ performance เมื่อเทียบกับการจัดเก็บแบบเดิม ฟีเจอร์ใหม่นี้ทำให้เพิ่มโอกาสในการลดค่าใช้จ่ายจากการจัดเก็บข้อมูลไปในตัว ฟีเจอร์ Compressed Storage นี้จะเริ่มให้ทดลองใช้ (Preview) วันเดียวกันกับที่มีประกาศ BigQuery Editions ซึ่งถือว่าเป็นข่าวดีมากๆ สำหรับองค์กรที่มีข้อมูลขนาดใหญ่ ที่จะมีทางเลือกที่จะประหยัดค่าใช้จ่ายเพิ่มขึ้นอีก