สวัสดีครับ ต้องขอเกริ่นก่อนว่าเป็นครั้งแรกที่สอบถามคำถามในลักษณะนี้ ถ้ามีข้อผิดพลาดต้องขออภัยมา ณ ที่นี้ด้วยครับ แล้วอาจจะต้องบอกก่อนว่าประสบการณ์ในสายงาน Data Engineering นั้นผมน้อยมาก จึงไม่มีประสบการณ์ในองค์กรที่มีทีม Data Engineer ที่เป็นมาตรฐานครับ โดยมีความรู้แค่พื้นฐานในการเรียนมา แต่บางอย่างรู้แค่ผิวเผินไม่เคยมีประสบการณ์ในการใช้งานจริงเท่าไหร่นัก
ตัวผมทำงานในองค์กรแห่งนึงที่ไม่มีทรัพยากรในการสรรหาบุคลากรที่มีทักษะในระดับที่ชำนาญในด้าน Data Engineering มานัก และขับเคลื่อนด้วยฝ่ายวิเคราะห์ข้อมูลโดยส่วนใหญ่ ระบบงานปัจจุบันค่อนข้างจัดทำมาเพื่อแก้ปัญหาเฉพาะหน้าเป็นส่วนมาก จึงเกิดข้อสงสัยที่จะนำมาสอบถามขอคำปรึกษาจากผู้มีประสบการณ์ใน Community นี้ครับ
โดยคำถามจะแยกเป็นหลายส่วนที่อยากจะขอความคิดเห็นครับ ได้แก่
- Data Tech Stack ที่เลือกใช้นั้นควรจะเป็นลักษณะแบบใดถึงจะเหมาะสมครับ (Opensource , Cloud Service , Hybrid)
- Data Orchestrator ควรที่จะเป็น Code Base (Dagster , Airflow) หรือ GUI (อาทิเช่น SSIS) แบบไหนจะดีกว่าในระยะยาวเผื่อที่จะต้องขยายทีม Data Engineer
- Data Engineering Team ควรที่จะมีตำแหน่งอะไรบ้างย่อยภายในทีม (Lead , Infrastructure , Operational Service) หรือจริง ๆ แล้วไม่ต้องแบ่งทีมเลยครับ
- Data Storage ที่เลือกใช้เราควรที่จะเลือกอย่างไรให้เหมาะสมในแต่ล่ะ Layer ครับ จำเป็นหรือไม่ที่จะต้องเป็นเทคโนโลยีใหม่ (Data Warehouse , Data Lakehouse) หรือควรเลือกตามความชำนาญของ IT Department ที่องค์กรตัวเองสังกัดดี ซึ่งน่าจะเป็น Database แบบ OLTP ซะส่วนใหญ่
- Data Dictionary ควรที่จะฝังลงไปใน ชื่อ Table เลยเพื่อให้สะดวก , ควรทำเอกสารแยกออกมา หรือ เลือกใช้ platform ด้านดังกล่าวไปเลยดีกว่า (เช่น Data Hub)
- การทำให้เป็นไปตาม PDPA / Security Audit เราควรที่จะต้อง Masked Data , Encryption Data หรือไม่ก่อนที่จะมาถึง Data Storage ที่ Data Engineering Team มีสิทธิ์เข้าถึง แล้วปกติหน่วยงานไหนในองค์กรจะเป็นคนดูแลในการทำส่วนนี้ครับ
- ในฐานะที่เรียกได้ว่าเป็น Data Engineer ใหม่ก็ว่าได้ รบกวนแนะนำทักษะที่ผมควรจะเรียนเพิ่มเติม และควรที่จะเรียนรู้ได้หรือไม่ครับ
ทั้งนี้ถ้าคำถามที่ผมถามมีส่วนไหนที่ผมใช้คำพูดผิด หรือเข้าใจผิดในการอธิบาย สามารถแจ้งและบอกได้เลยนะครับ เพราะผมเองก็ยังไม่เข้าใจงานด้านนี้อย่างเต็มที่ครับ
ขอขอบคุณทุก ๆ ท่านที่เข้ามาร่วมแสดงความคิดเห็นล่วงหน้าครับ