การ execute query ของ hive

ผมไม่แน่ใจข้างในของ Hive ว่าทำงานอย่างไรนะครับ พี่ @Nengchakun หรือ @yothinix อาจจะสามารถช่วยเสริมส่วนตรงนี้ได้

ผมขอตอบแบบ Practice การ Query ข้อมูลโดยทั่วไปแทนนะครับผม ตรงนี้ใช้ได้กับทุก ๆ Data Warehouse เลยคือ ให้เรา Filter ตารางใหญ่ ๆ ให้เหลือน้อย ๆ ก่อน แล้วค่อยเอามาทำ Aggregation ต่อ ซึ่งแน่นอนว่าส่วน Computation จะเร็วกว่า เพราะว่าคำนวณจากข้อมูลที่น้อยกว่าครับผม

บทความในนี้อาจจะมีประโยชน์ครับ สรุปบทความ Optimize your bigquery performance ของ Sagar Tiwari