เรื่องคอร์สผมแนะนำ Data Engineering Zoomcamp ครับ เรียนฟรี เป็นภาษาอังกฤษ ค่อย ๆ เรียนได้เรื่อย ๆ ครับผม แล้วก็ครบเครื่องมาก แล้วก็พวกเครื่องมือต่าง ๆ ในคอร์สนี้ บริษัทส่วนใหญ่ก็ใช้กันครับ เช่น Airflow หรือ Kafka
ส่วนเรื่องภาษา ผมอยากให้เริ่มที่ Python ก่อน จะเริ่มต้นได้ง่ายสุด แล้วก็มีเครื่องมือให้ใช้งานเยอะมากสุดแล้วครับผม
เพิ่มเติมเรื่อง Framework นี่ลองดูจาก Related Topics ด้านล่างดูนะครับ จะมีบทความต่าง ๆ ซึ่งแต่ละที่ทำงานจะใช้ไม่ค่อยเหมือนกันเท่าไหร่
ถ้ามีความรู้ด้าน Machine Learning สามารถต่อยอดได้เยอะเลยครับ เช่น MLOps และอื่น ๆ อีกเยอะ เพราะเราจะทำงานด้านข้อมูลได้แทบจะ End-to-End เลย