Caution: Data Science Projects Can Turn into the Emperor's New Clothes

โดย Shweta Katre

เค้าบอกว่า challenge ใหญ่เลยของการทำโปรเจค data science ในทีมเลยคือการที่ทำให้ stakeholder เห็น progress ที่วัดผลได้ เพื่อให้ stakeholder มั่นใจว่าสิ่งที่เค้าลงทุนไปยังคงเดินหน้าต่อไปได้

เวลาส่วนใหญ่ 80% จะเป็นการทำพวก data collection/selection/preparation/exploratory อะไรพวกนี้ตามรูปด้านล่างนี้เลย จะเห็นได้ว่ามี overheads ที่ใหญ่มาก

ดังนั้นเค้าก็เลยให้คำแนะนำประมาณนี้

  1. Understand the sell-first approach - คือให้เราสื่อสารไปในแง่ที่บอกว่า stakeholder จะได้อะไรจากโปรเจคบ้าง และให้เราส่งมอบเป็นแบบ iterations แทนที่จะเป็น big-bang เพื่อให้ stakeholder ยังคงเห็นภาพ และยังคงได้รับสิ่งที่เค้าต้องการอยู่
  2. Give a “face” to the project - คือให้เรามีของที่จับต้องได้ และเป็นตัวที่ให้ stakeholder เห็นภาพว่ามีอะไรเกิดขึ้นแล้วบ้างในโปรเจคนี้ เราอาจจะมี user interface (UI) ให้ หรือมี interactive dashboard ให้เค้าเล่น และเพื่อสื่อสาร progress ของงานที่เราทำ
  3. Ensure environment readiness - เรื่องของ development environment ก็สำคัญ มันควรที่จะช่วยให้เราพัฒนาของออกได้เร็ว ช่วยให้เรานำข้อมูลมาวิเคราะห์ได้เร็วด้วย
  4. Catalog scripts - เวลาที่เราเขียนสคริปต่าง ๆ เช่น ดาวน์โหลดข้อมูล หรือเตรียมข้อมูล เราก็ต้อง tag สคริปพวกนี้ให้ดี ๆ เพื่อให้นำกลับมาใช้งานใหม่ได้ง่าย

สุดท้ายถึงแม้ว่าโปรเจคของเราจะได้ผลลัพธ์ออกมาเป็น AI ที่ดีมาก หรือออกมาเป็น failure ก็ตาม การที่เรามี steps ต่าง ๆ ที่กล่าวมาข้างต้น ก็ยังคงช่วยทำให้ stakeholder ไม่สิ้นศรัทธาในงาน หรือในโปรเจคที่เราทำ

1 Like

อย่าลืม deliver small wins เป็นระยะๆ เขาจะได้ไม่คิดว่าเราเทเขา :joy: