การศึกษาวิธีการตรวจจับการยกมือโดยเฟรมเวิร์กมีเดียไปป์และแบบจำลองการเรียนรู้เชิงลึกแบบซีเอ็นเอ็น
เนื้อหาบทความหลัก
บทคัดย่อ
บทความวิจัยนี้มีวัตถุประสงค์ 1) เพื่อพัฒนาขั้นตอนวิธีการตรวจจับการยกมือด้วยเฟรมเวิร์กมีเดียไปป์และแบบจำลองการเรียนรู้เชิงลึกแบบซีเอ็นเอ็น และ 2) เพื่อประเมินประสิทธิภาพของขั้นตอนวิธีการที่ได้พัฒนา
ขั้นตอนพัฒนาวิธีการตรวจจับการยกมือที่ตำแหน่งมืออยู่เหนือศีรษะประกอบด้วย 1) การใช้ภาพอินพุตที่มีการยกมือและไม่ยกมือจำนวน 70 ภาพ 2) ภาพอินพุตจะถูกประมวลผลด้วยเฟรมเวิร์กมีเดียไปป์เพื่อระบุตำแหน่งมือที่ยกและตำแหน่งใบหน้าของผู้ยกมือ 3) ภาพที่ระบุตำแหน่งมือและใบหน้าจะถูกฝึกสอนและทดลองด้วยแบบจำลองการเรียนรู้เชิงลึกแบบซีเอ็นเอ็นเพื่อทำนายการยกมือที่อยู่เหนือศีรษะและ 4) ระบุผลการทำนายของการยกมือเหนือศีรษะ การพัฒนาวิธีการที่นำเสนอใช้ภาษาไพธอน คลังชุดคำสั่งเฟรมเวิร์กมีเดียไปป์ คลังชุดคำสั่งโอเพนซีวี และคลังชุดคำสั่ง TensorFlow
ผลการวิจัยพบว่า 1) วิธีการที่ได้พัฒนาใช้เฟรมเวิร์กมีเดียไปป์สำหรับทำการประมวลผลก่อนและใช้แบบจำลองการเรียนรู้เชิงลึกแบบ CNN สำหรับการทำนายการตรวจจับการยกมือที่มีโครงสร้างเลเยอร์ซ่อนแบบ dense layer 2 เลเยอร์ (64 และ 32 หน่วย พร้อมฟังก์ชันกระตุ้น ReLU) และเอาท์พุตเลเยอร์ 1 หน่วยพร้อมฟังก์ชันกระตุ้น Sigmoid 2) ผลการประเมินได้ประสิทธิภาพความแม่นยำในการตรวจจับการยกมือเหนือศีรษะร้อยละ 96.20