การใช้ Deep Learning วิเคราะห์รีวิวคะแนนต่ำภาษาไทยของแอปบน Google Play Store
เนื้อหาบทความหลัก
บทคัดย่อ
การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อพัฒนาโมเดล Deep Learning สำหรับจำแนกประเภทปัญหาจากรีวิวภาษาไทยคะแนนต่ำ (1-3 ดาว) บน Google Play Store ซึ่งเป็นแหล่งข้อมูลสำคัญที่สะท้อนปัญหาการใช้งานแอปพลิเคชันจากผู้ใช้จริง รีวิวดังกล่าวมีลักษณะเป็นข้อความอิสระและมีปริมาณมาก ส่งผลให้การวิเคราะห์ด้วยมนุษย์ทำได้ยากและไม่มีประสิทธิภาพ งานวิจัยนี้กำหนดปัญหาเป็นการจำแนกหลายคลาส (Multi-class Classification) จำนวน 4 ประเภท ได้แก่ login, payment, performance และ other โดยใช้ชุดข้อมูลที่ติดป้ายกำกับจำนวน 1,998 รีวิว และทำการปรับจูนโมเดล XLM-RoBERTa ด้วยเทคนิค Fine-tuning ภายใต้ฟังก์ชัน Cross-Entropy Loss และตัวปรับพารามิเตอร์ AdamW ผลการทดลองบนชุดข้อมูลทดสอบจำนวน 400 รีวิว พบว่าโมเดลมีค่า Accuracy เท่ากับ 0.71 และมีค่า Macro F1-score เท่ากับ 0.73 โดยคลาส payment มีประสิทธิภาพการจำแนกสูงที่สุด ขณะที่คลาส other มีความทับซ้อนกับคลาสอื่นบางส่วน นอกจากนี้ ยังได้พัฒนาระบบต้นแบบในรูปแบบเว็บแอปพลิเคชันเพื่อดึงรีวิว วิเคราะห์ประเภทปัญหา และแสดงผลผ่านแดชบอร์ดเพื่อสนับสนุนการตัดสินใจ ผลการวิจัยแสดงให้เห็นว่าเทคนิค Transformer สามารถประยุกต์ใช้กับการวิเคราะห์รีวิวภาษาไทย และช่วยแปลงข้อมูลข้อความที่ไม่มีโครงสร้างให้เป็นข้อมูลเชิงโครงสร้างได้อย่างมีประสิทธิภาพ