ทำไมเวลาสร้าง Data Pipeline ควรโหลดข้อมูลมาเก็บลง Storage หรือ Data Lake ก่อน?

เพราะแบบนี้…

  1. เราสามารถแชร์ให้กับคนอื่น หรือระบบอื่นมาหยิบข้อมูลไปใช้งานได้
  2. ทำให้ Data Pipeline ของเรามีความ Reproducible ได้

ตามไปอ่านบทความเต็มๆ ได้ที่นี่เลยจ้า :point_down:

1 Like