ใช้ Pandas อ่าน CSV ที่มีชื่อจังหวัดน่าน "nan" แล้วได้ NaN!

ตอนเย็นนั่งดูโค้ดกับน้อง @pynsuphasueb แล้วงง ๆ ว่าทำไมโหลดข้อมูลเข้า BigQuery แล้วได้ค่า null ตรงชื่อจังหวัดน่าน… (ภาษาอังกฤษใช้คำว่า nan)

ไปเจอว่า Pandas ตอนมันอ่านค่า “nan” ขึ้นมา โดย default มันโหลดเข้ามาเป็น NaN ซะงั้น ถึงแม้จะเซต dtype ตอนอ่านไฟล์ว่าเป็น string ก็ยังได้ NaN นะ :joy: อ่ะ วิธีแก้ก็ตามด้านล่างนี้เลย

ใส่ keep_default_na=False ไว้ตอนอ่านไฟล์

2 Likes

จะกรี๊ดกว่าตอนแปลง pandas dataframe เป็น spark dataframe

แล้วขุ่นพรี่ติด NaN มาให้ด้วย!!! spark ใช้ None ปกติไง แต่ pandas เขาใข้ NaN

เจอกับดักวันละอัน ชีวิตแจ่มใส่ :sun_with_face:

1 Like