เอามาจาก
ดูเป็นที่ยึดเหนี่ยวจิตใจได้ดี อิอิ เค้าต่อยอดมาจาก Google’s Site Reliability Engineering (SRE) principles มี 7 ข้อด้วยกัน
- Embracing risk - เค้าบอกว่าถ้าอยากได้แบบ perfect เลยคือ ไม่มีข้อมูล… จะได้ไม่เสี่ยง ฮ่า ๆ ดังนั้นตรงนี้ต้องจัดการวางแผนกันให้ดี ๆ
- Set standards - กำหนดมาตรฐานกันไว้ นิยาม และกำหนดการทำงานร่วมกันระหว่างทีมกันให้ชัดเจน
- Reduce toil - ลดพวกงานที่ทำซ้ำ ๆ ต่าง ๆ และ overhead ที่เกิดขึ้น จะได้มี human errors น้อย ๆ
- Monitor everything - มันยากมากที่จะดูแลทั้งข้อมูล และ infrastructure ให้ครอบคลุมได้ ดังนั้นเราควรที่จะ monitor ทุกสิ่งอย่าง
- Use automation - ทำ automation ให้ได้มากที่สุด เพราะจะช่วยลดความผิดพลาด
- Control releases - ตอนที่มีการแก้ไข ปรับปรุงอะไรก็แล้วแต่ ควรจะมีกระบวนการในการตรวจทาน ตรวจสอบ ก่อนที่จะ release ออกไปเสมอ
- Maintain simplicity - เนื่องจากการทำพวก reliability เป็นเรื่องที่ซับซ้อนอยู่แล้ว การที่เราพยายามทำให้ง่ายเข้าไว้ สามารถแก้ไข ปรับเปลี่ยนได้ง่าย ก็จะช่วยให้เรามีแพลตฟอร์มที่ reliable มากขึ้นด้วย
ประมาณนี้ครับ 7 ข้อในการทำ Data Reliability Engineering (DRE) ส่วนลิ้งค์ด้านล่างนี้เป็นแบบเวอร์ชั่นอธิบาย 7 principles แบบละเอียด
https://www.bigeye.com/blog/seven-principle-reliable-data-pipelines