การตรวจจับการล้มแบบหลายบุคคลโดยใช้ข้อมูลโครงกระดูกจากมีเดียไปป์ร่วมกับการเรียนรู้เชิงลึก
เนื้อหาบทความหลัก
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาระบบตรวจจับการล้มแบบหลายบุคคลโดยใช้ข้อมูล
โครงกระดูกที่สกัดจากมีเดียไปป์และประเมินประสิทธิภาพของโมเดลด้วยการเรียนรู้เชิงลึก ได้แก่ CNN, LSTM และ CNN-LSTM ระบบสามารถรองรับการตรวจจับหลายบุคคลภายในเฟรมเดียว โดยใช้ข้อมูลพิกัดสามมิติของจุดข้อต่อที่สำคัญ 13 จุด สำหรับจำแนกท่าทางจำนวน 5 ท่า ได้แก่ ยืน, ล้มคว่ำหน้า, ล้มหงายหลัง, ล้มตะแคงซ้าย และล้มตะแคงขวา ในการทดลอง ได้ทำการเปรียบเทียบประสิทธิภาพของโมเดลภายใต้ความยาวลำดับข้อมูลที่แตกต่างกัน คือ 10 เฟรม และ 16 เฟรม เพื่อประเมินประสิทธิภาพของความยาวลำดับข้อมูลต่อความแม่นยำในการจำแนกท่าทางการล้ม ผลการทดลองพบว่าโมเดล CNN-LSTM ให้ประสิทธิภาพดีที่สุด โดยเฉพาะเมื่อใช้ความยาวลำดับข้อมูลจำนวน 16 เฟรม เนื่องจากโมเดลสามารถเรียนรู้รูปแบบการเคลื่อนไหวและความสัมพันธ์เชิงเวลาของท่าทางได้อย่างมีประสิทธิภาพมากขึ้น ส่งผลให้สามารถจำแนกท่าทางได้อย่างแม่นยำด้วยค่าความถูกต้องร้อยละ 98 และสามารถลดความผิดพลาดระหว่างท่าทางการล้มที่มีลักษณะใกล้เคียงกัน แสดงให้เห็นว่าการใช้ข้อมูลโครงกระดูกร่วมกับโมเดลที่เรียนรู้ความสัมพันธ์เชิงเวลาเป็นแนวทางที่เหมาะสมสำหรับการพัฒนาระบบตรวจจับการล้ม และสามารถนำไปประยุกต์ใช้ในระบบเฝ้าระวังและแจ้งเตือนการล้มแบบเรียลไทม์ได้อย่างมีประสิทธิภาพ