เริ่มต้นศึกษา Data Engineering ควรเริ่มที่เครื่องมือ หรือ Tools ตัวไหนดี?


Photo by Barn Images on Unsplash

พอเจอคำถามแบบนี้ ผมเชื่อว่าหลาย ๆ คนจะตอบกลับไปประมาณว่า “อย่าไปสนใจเรื่องเครื่องมือมาก ให้ทำความเข้าใจกับพื้นฐาน หรือ Fundamentals” ซึ่งประโยคนี้ไม่ได้ผิดอะไรเลย เป็นคำแนะนำที่ถูกต้องที่สุด

อย่างไรก็ดี คำตอบแบบนี้จะแฝงไปด้วย Factor ต่าง ๆ นานา โดยเฉพาะพื้นฐาน และประสบการณ์ของคนที่ตอบ เพราะว่าเค้าได้ผ่านการลงมือทำงานมาจริงแล้ว เรียนรู้แล้วว่าจะนำความรู้ที่ได้นั้นไปประยุกต์ใช้ในงานอย่างไร ซึ่งอาจจะทำให้ผู้ฟังเริ่มต้นไม่ถูกอยู่ดีว่าจะเริ่มที่ไหน

ผมเลยอยากจะแชร์ และเสริมจากประโยคที่กล่าวมาข้างต้นเพิ่มเติมครับ โดยเฉพาะคนที่เรียนรู้ด้วยตัวเองนะ (คิดว่าไม่นับคนที่ไปลงคอร์ส หรือ Bootcamp เพราะว่าเค้าจะสอนทั้งพื้นฐาน และการใช้งานเครื่องมืออยู่แล้ว) ว่าก่อนที่เราจะเข้าใจพื้นฐานหรือ Fundamentals ของศาสตร์ Data Engineering นั้น ให้ลองเลือกเครื่องมือมาสักตัวที่คิดว่าเริ่มต้นใช้งานได้ง่ายมาก่อน ลองเล่น ลองใช้ ทำความเข้าใจ และค่อยเริ่มทำความเข้าใจพื้นฐานต่าง ๆ ในเรื่องนั้น ๆ และพอใช้เครื่องมือนั้นพอเป็นแล้ว ค่อยลองขยับไปใช้เครื่องมือที่คล้าย ๆ กันดู ทำแบบนี้วนไปครับ

ยกตัวอย่างเช่น ถ้าเราอยากรู้จัก Data Pipeline ก็อาจจะเริ่มที่ Airflow และทำความเข้าใจพื้นฐานต่าง ๆ ของการสร้าง Data Pipeline ที่ดีจาก Airflow และพอเริ่มเข้าใจก็อาจจะลองเปลี่ยนไปเล่น Dagster อะไรแบบนี้เป็นต้น

ผมเรียกการเรียนรู้แบบนี้ว่าเป็นแบบ “Top-Down Approach” ครับ เคยเขียนบทความเกี่ยวกับการเรียนรู้แบบนี้ในเรื่อง Machine Learning ไว้ที่บทความด้านล่างนี้ :point_down:t2: ตามไปอ่านกันได้ครับ อิอิ

ทำไมถึง Top-Down? คำตอบง่าย ๆ เลยครับ เพราะว่ามัน “สนุก” กว่าแบบ Bottom-Up เยอะ อะไรที่เราเรียนรู้แล้วสนุก มันจะไปได้ไกล และยั่งยืนกว่าก็เท่านั้นเอง

ปล. จริง ๆ การเรียนรู้แบบนี้ ผมคิดว่าเป็นแนวเดียวกับ Shu Ha Ri ด้วยเช่นเดียวกัน แค่ผมอยากเสริมไปว่าเราเรียนรู้ Fundamentals จากการใช้งานเครื่องมือ :blush:

3 Likes