เมื่อไม่นานมานี้เห็นไฟล์ฟอร์แมตใหม่ที่ชื่อย่อว่า TOON
สำหรับ LLM แล้ว ไฟล์ JSON จะมี token ที่เวิ่นเว้อไปหน่อย ส่วน YAML ใช้ token ที่น้อยกว่า JSON แล้วก็เป็น human-readable ดี แต่เค้าก็บอกว่า TOON เนี่ยใช้น้อยกว่าอีก!
ดูแล้วน่าสนใจดีนะ ส่วนตัวคิดว่า YAML จะดู human-readable เยอะสุด แต่ถ้ามองในมุม LLM ก็คงเป็น TOON แหละน่าจะดีสุด ใครที่กำลังสร้าง AI Systems อยู่ลองเอาไปเล่นดูนะครับ
ปล. ถ้าเรื่องการรับส่งข้อมูลระหว่าง Systems หรือทำ Data pipelines ก็แนะนำให้ใช้พวก binary file อย่างพวก Parquet ดีกว่านะ เพราะมันมี data type อยู่ด้วย
