ได้ไปอ่านโพสต์นี้มา
แอบไปช่วยตอบมาด้วย แล้วอยากเอามาแชร์ที่นี่ด้วย ผมตอบไปประมาณนี้
ถ้ามี budget ที่เอื้ออำนวยนะครับ ผมจะเลือกใช้ dbt Cloud พราะว่า
- dbt Cloud แทรกตัวเข้าไปกับ analytics workflow ของเราได้อย่างแนบเนียน คือทุกอย่างสามารถทำบนนั้นได้เลย ไม่ว่าจะเป็นการ query หรือสร้าง model ที่เชื่อมต่อกับ data warehouse ปลายทาง ถ้าใช้ dbt CLI เนี่ย เราต้อง switch ไปๆ มาๆ ระหว่าง CLI กับ data warehouse ปลายทาง เพื่อดูผลลัพธ์ ซึ่งตรงนี้ก็อาจจะทำให้สุดท้ายแล้ว ทีมไม่ใช้ dbt เลยจะง่ายกว่า
- บน dbt Cloud เนี่ย เราสามารถตั้ง schedule ให้กับคำสั่งพวก
dbt test
หรือdbt snapshot
ได้เลย ไม่ต้องใช้เครื่องมือตัวอื่น ถ้าใช้ dbt CLI เราจำเป็นต้องเอาเครื่องมือตัวอื่นมาช่วย เช่น Cron, Airflow หรือ Jenkins อะไรแบบนี้ - เรื่อง document ก็ด้วย ถ้าใช้ dbt CLI เราต้องไปโฮสต์ตัว doc เอง แต่ถ้าใช้ dbt Cloud โฮสต์ให้เราแล้ว เราสามารถเข้าถึง doc ได้เลย
ตรงนี้จริงๆ ก็ขึ้นอยู่กับบริบทในทีมด้วยนะครับ ถ้าเป็นทีมที่ดูแลทุกอย่างเอง มีพลังในการสร้างของต่างๆ dbt CLI อาจจะตอบโจทย์มากกว่า