วันนี้ accomplish ไปอีก 1 เรื่อง คืออ่านหนังสือ data mesh (ตามรูปด้านล่าง) ให้จบภายใน 1 เดือน เริ่มต้นจากต้นเดือน ก.ค. มาจนถึงวันนี้ 30 ก.ค.
ขอเอามาเขียนบรรยายสั้น ๆ เก็บไว้เพื่อมีใครกำลังอ่านเล่มนี้อยู่หรืออยากจะอ่าน เรามาแลกเปลี่ยนความคิดเห็นกันนะ
3 ประโยคเกี่ยวกับหนังสือ
- เป็นคัมภีร์สำหรับองค์กรที่อยากจะ transform ตัวเองจาก centralized data platform ไปเป็นแบบ decentralized เพื่อที่จะได้ scale และตอบสนองต่อการเปลี่ยนแปลงทางธุรกิจได้เร็วขึ้น
- เห็นภาพของ Data Mesh ชัดมากขึ้น และตอบคำถามหลาย ๆ คำถามได้ในเรื่องการ implement เข้าไปในองค์กร
- เป็นหนังสือที่ไม่สามารถที่จะอ่านรอบเดียวแล้วสามารถเข้าใจได้ ต้องอ่านหลายรอบ และเค่อย ๆ ซึมซับ ประกอบกับลองคิดตามกับสิ่งที่เป็นอยู่ในองค์กรของตัวเอง
ความประทับใจ
ตอนแรกคิดว่าจะเป็นหนังสือที่ abstract จนแบบว่าจะเอาไปใช้งานจริงไม่ได้ พอได้เริ่มอ่านไปเรื่อย ๆ แล้วต้องบอกว่าเล่มนี้ค่อนข้างจะ practical ที่เปิดโอกาสให้เราได้คิดตาม และเห็นภาพที่ชัดเจนมาก (ในระดับหนึ่ง) ที่เราจะนำไป implement ตาม
และเป็นหนังสือที่พออ่านไป เจอประโยคถูกใจ ทำให้ตระหนักรู้อะไรไปได้หลาย ๆ อย่างเลยทีเดียว เช่น
- เราจะไปเอาข้อมูลของแต่ละ domain มารวมกัน เราก็ต้องเข้าใจข้อมูลของทุก domain เลยทีเดียว ซึ่งตรงนี้เป็น bottleneck จะดีกว่ามากเลยถ้าเราให้ข้อมูลอยู่กับ domain นั้น ๆ และ governance เองเลย เพราะเค้าเข้าใจดีที่สุดแล้ว
- จะไม่มี intelligent transformation ระหว่าง domain อีกต่อไป หรือที่ตอนนี้เราเรียกกันว่า data pipeline นั่นแหละ ซึ่ง transformation จะเกิดขึ้นภายใน domain นั้น ๆ และแชร์ข้อมูลออกมาให้กับ domain อื่น
- เรื่อง policy as code ที่ทำเป็น sidecar กับ data product แต่ละตัว ทำให้เราสามารถ scale เรื่อง data governance ออกไปได้
- เรื่อง change data capture (CDC) เค้าบอกว่าเป็น least desirable way เพราะว่ามัน expose internal implementation ของ database transaction มากเกินไป และมันไม่ได้เกี่ยวกับ business domain
- และอื่น ๆ อีก
บทที่ชอบที่สุดคือ บทที่ 15 Strategy and Execution เพราะเป็นบทที่เราสามารถเอาไปทำ assessment ดูว่าเราพร้อมที่จะทำ data mesh แล้วหรือยัง แล้วถ้าจะทำต้องเตรียมอะไรประมาณไหนบ้าง
ใครควรอ่าน?
หลัก ๆ เลยที่ผมอยากแนะนำให้อ่านคือระดับ C-level ระดับ manager และกลุ่ม data analysts/scientists อ่านแค่ 2 parts แรกน่าจะโอเคให้เห็นภาพว่าถ้าองค์กรจะ transform ให้ scale ได้มากขึ้นจากเดิม พวกเค้าต้องปรับตัวและมีส่วนช่วยตรงไหนบ้าง แต่ถ้าอ่านทั้ง 5 parts เลยก็ยิ่งดีนะ 3 parts หลังจะค่อนข้างลงรายละเอียดเยอะหน่อย
สำหรับกลุ่มพวกสายงาน software/data engineers และ architects นี่อยากให้อ่านทั้งเล่มเลย (มี 5 parts)
สรุป~ เป็นหนังสือที่ดีมากครับ ควรมีติดบ้านกันไว้สักเล่ม ก็ถ้าสนใจ ไปกดเล่มจริงกันได้ที่ Data Mesh: Delivering Data-Driven Value at Scale