Google Dives into the Ethereum Blockchain with its Big Data Analytics Platform
เมื่ออากู๋อยากวิเคราะห์ Blockchain ของ Ethereum

BigQuery, คลังข้อมูลแบบ Cloud ของ Google ที่มีขนาดเพตะไบต์ (เท่ากับ 2 ยกกำลัง 50 ไบต์หรือประมาณ 1 ล้านGB) ได้ประกาศทำการวิเคราะห์ Smart Contract โดยใช้ dataset และข้อมูลประวัติศาสตร์ของ Ethereum ทั้ง ETL Project บน GitHub รวมถึง source code ได้ถูกสกัดจาก Blockchain และนำข้อมูลเข้าสู่ BigQuery
การเข้าถึงข้อมูล Blockchain
ข้อมูลของ Ethereum blockchain สามารถเข้าถึงได้บน Google Cloud ในขณะที่ Software ของ Ethereum มี APIs สำหรับฟังก์ชั่นที่สามารถเข้าถึงได้แบบสุ่ม เช่น การตรวจสอบยอดของกระเป๋าเงินออนไลน์ เป็นต้น ซึ่ง Endpoints ของ API ไม่สามารถเข้าถึงข้อมูลบน Blockchain ได้โดยง่าย
ในขณะที่ Endpoints ของ API ไม่สามารถดูข้อมูลโดยสรุปได้ OLAP ของ BigQuery มีฟีทเจอร์ที่สามารถทำการวิเคราะห์ดังกล่าวได้ โดยบล็อกของกูเกิ้ลได้แสดงจำนวนธุรกรรมและค่าใช้จ่ายในการโอนของ Ether ในปีนี้ การสนับสนุนแสดงภาพจากข้อมูล (Data Visualization) ดังกล่าวกลายเป็นวาระสำคัญของการอัพเกรดสถาปัตยกรรมของ Ethereum

Google Cloud สามารถทำงานประสานกับคอมพิวเตอร์ใน blockchain ของ Ethereum ที่มีการติดตั้ง Parity ซึ่งเป็น client ของ Ethereum สำหรับการสร้างแอพ Google Cloud สามารถสกัดข้อมูลรายวันจากบัญชีของ Ethereum blockchain เช่น การโอน และการแบ่งส่วนข้อมูลที่เก็บไว้ เพื่อให้สามารถค้นหาได้อย่างมีประสิทธิภาพด้วย BigQuery
นอกจากนี้ Python library ของ BigQuery อนุญาตให้ clients สามารถดึงตารางข้อมูลใน Kernels แพล็ตฟอร์มฟรีสำหรับการเขียนโปรแกรมใน Browser บนแพล็ตฟอร์มด้านวิทยาการข้อมูล Kaggle
การวิเคราะห์ Smart Contract
Google BigQuery สามารถเรียกใช้ฟังก์ชั่นในการวิเคราะห์ smart contract และ จำนวนครั้งของธุรกรรม BigQuery สามารถค้นตารางสัญญาและเว็ตข้อมูลธุรกรรมเพื่อค้นหา smart contracts ที่มีการใช้งานมากที่สุด โดยตารางด้านล่างได้แสดงสัญญา 10 ประเภทของ Ethereum ERC-721 ที่มีจำนวนธุรกรรมมากที่สุด

Smart contract ที่ได้รับความนิยมสูงสุดคือ ERC-21 smart contract ของเกม CryptoKitties โดย logs ของ สัญญา source code ผู้ใช้งานสามารถใช้ค้นหา event วันเกิดของ Ethereum blockchain ได้
หากใครต้องการค้นหาเกมที่คล้ายกับ CryptoKitties ก็สามารถวัดสิ่งนี้โดยการพัฒนา Jaccard ซึ่งคล้ายกับค่า coefficient ทางสถิติที่ใช้ในการเปรียบเทียบความเหมือนหรือต่างของตัวอย่างโดยใช้ JavaScript UDF.
10 โทเค็นที่ได้รับความนิยมสูงสุดเรียงตามขนาดของธุรกรรม
เราสามารถวัดการโอนโทเค็นแบบรายวันและสร้างภาพของข้อมูลในช่วงเวลานั้นๆ ได้ ดังรูป

การสร้างภาพจากข้อมูลอื่นๆ
เราสามารถใช้โคงสร้างข้อมูลแบบกราฟโดยตรงเพื่อทำให้เห็นภาพเชิงลึกของข้อมูลนั้น ซึ่งรวมถึงการโอนเงินระหว่างหลายๆ ที่อยู่ของกระเป๋าเงินด้วย เช่น 40,000 ธุรกรรมแรกที่ มีคู่ค้าอย่างน้อย 2 คน ในบล็อกของกูเกิ้ลให้ตัวอย่างไว้ เป็นรูปที่สร้างจากซอฟท์แวร์การแสดงภาพของข้อมูล Gephi ซึ่งจุดและสีในรูปแสดงถึงกลุ่มของที่อยู่ของกระเป๋าเงินที่มีการโอนเงินกันระหว่างกันอยู่บ่อยๆ โดยใช้อัลกอริทึม Modularity ในการคำนวณและสร้างรูปนี้

Source code ของ smart contract จำนวนมากเปิดให้ใช้ได้ฟรี ซึ่งทำให้ผู้ใช้งาน Google สามารถค้นหาสัญญาตามฟังก์ชั่นด้วยชื่อได้ แม้แต่ฟังก์ชั่นที่ไม่มีแหล่งที่มา หรือฟังก์ชั่นคล้ายๆ กัน
