490 likes | 744 Views
A Study of Road Accident in Thailand using Association Rules of Data Mining Technique. การศึกษาอุบัติเหตุจราจรทางถนนในประเทศไทย โดยใช้กฎการหาความสัมพันธ์ของ Data mining.
E N D
A Study of Road Accident in Thailand using Association Rules of Data Mining Technique การศึกษาอุบัติเหตุจราจรทางถนนในประเทศไทย โดยใช้กฎการหาความสัมพันธ์ของ Data mining นางสาวพิณรัตน์ นุชโพธิ์ ภาควิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะครุศาสตร์อุตสาหกรรมและเทคโนโลยี ที่ปรึกษาวิทยานิพนธ์ รศ.อดิศักดิ์ พงษ์พูลผลศักดิ์ภาควิชาสถิติประยุกต์ คณะวิทยาศาสตร์มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
การศึกษาอุบัติเหตุจราจรทางถนนการศึกษาอุบัติเหตุจราจรทางถนน องค์ประกอบของการจราจรทางถนน 1. องค์ประกอบด้านคน 2. องค์ประกอบด้านยานพาหนะ 3. องค์ประกอบด้านถนน 4. องค์ประกอบด้านสิ่งแวดล้อม
องค์ประกอบด้านคน • เพศ • อายุ • ประสบการณ์การขับขี่ • การเกิดอุบัติเหตุที่ผ่านมา • การดื่มเครื่องดื่มที่มีส่วนผสมของแอลกอฮอล์ • ความสามารถในการมองเห็น • ฯลฯ
องค์ประกอบด้านยานพาหนะองค์ประกอบด้านยานพาหนะ • สภาพเครื่องยนต์ • สภาพระบบไฟฟ้าส่องสว่างและไฟสัญญาณ • สภาพของยางรถยนต์ • ระบบห้ามล้อ • เกียร์ • ระบบควบคุมทิศทางรถ • ฯลฯ
องค์ประกอบด้านถนน • ลักษณะถนนจุดที่เกิดเหตุ • ประเภทผิวจราจร • ความพอเพียงของอุปกรณ์ควบคุมจราจร • ไฟส่องสว่างตามถนนเพียงพอต่อการมองเห็น • ฯลฯ
องค์ประกอบด้านสิ่งแวดล้อมองค์ประกอบด้านสิ่งแวดล้อม • ฝน • หมอกปกคลุม • ต้นไม้บดบัง • แสงอาทิตย์ส่องตา • ฯลฯ
การแบ่งระดับความรุนแรงของอุบัติเหตุการแบ่งระดับความรุนแรงของอุบัติเหตุ • ระดับความรุนแรง Fatality (F) คือ การเกิดอุบัติเหตุที่มีผู้เสียชีวิตขณะนั้น หรือเสียชีวิต ภายใน 30 วันหลังการเกิดอุบัติเหตุ • ระดับความรุนแรง Severe (A) คือ การเกิดอุบัติเหตุที่มีผู้ได้รับบาดเจ็บสาหัส เช่น การเสียเลือดมาก หรือกระดูกหักมากกว่าหนึ่งแห่ง หรือสมองได้รับการกระทบกระเทือนหรือได้รับบาดเจ็บเป็นแผลฉกรรจ์ หรืออวัยวะของร่างกายฉีกขาดถึงขั้นพิการ
การแบ่งระดับความรุนแรงของอุบัติเหตุการแบ่งระดับความรุนแรงของอุบัติเหตุ • ระดับความรุนแรง Moderate (B) คือ การเกิดอุบัติเหตุที่มีบุคคลได้รับบาดเจ็บปานกลาง เช่น กระดูกหักหนึ่งแห่ง และได้รับบาดเจ็บเป็นแผลแต่ไม่รุนแรงมากนัก รักษาตัวไม่เกินหนึ่งสัปดาห์ก็สามารถกลับไปรักษาตัวที่บ้านได้ เป็นต้น
การแบ่งระดับความรุนแรงของอุบัติเหตุการแบ่งระดับความรุนแรงของอุบัติเหตุ • ระดับความรุนแรง Minor (C) คือ การเกิดอุบัติเหตุที่มีบุคคลได้รับบาดเจ็บเล็กน้อย เช่น ศีรษะแตกแต่สมองไม่ได้รับการกระทบกระเทือน หรือได้รับบาดเจ็บเป็นแผลเพียงเล็กน้อยเมื่อได้รับการรักษาก็สามารถกลับบ้านได้ หรือมีการร้องขอความช่วยเหลือด้วยความตกใจหรือการเสียสติไปชั่วขณะ
การแบ่งระดับความรุนแรงของอุบัติเหตุการแบ่งระดับความรุนแรงของอุบัติเหตุ • ระดับความรุนแรง Property Damage Only (PDO)คือ การเกิดอุบัติเหตุที่มีแต่ทรัพย์สินเสียหายเพียงอย่างเดียว
คำจำกัดความ • Probability • ค่าความสัมพันธ์ • โอกาสที่จะมีเหตุการณ์จะเกิดขึ้น • Minimum Probability • โอกาสที่น้อยที่สุดที่เหตุการณ์จะเกิด • Minsupt (Minimum Support) • MinConfd (Minimum Confidence) • Threshold
เทคนิคต่าง ๆ ของ Data Mining • Classification & Prediction • Database clustering หรือ Segmentation • Deviation Detection • Link Analysis • Association Rule Discovery
Association Rule Discovery การค้นหาความสัมพันธ์ของข้อมูลจากข้อมูลขนาดใหญ่ที่มีอยู่ เพื่อนำไป ใช้ในการวิเคราะห์ หรือทำนายปรากฏการณ์ต่าง ๆ โดยจะทำการหาความสัมพันธ์ทั้งหมดในทรานแซคชันทุกตัวของเซลข้อมูลที่กำหนดไว้ กฎความสัมพันธ์ที่หาได้ทั้งหมด จะต้องมีความมั่นใจน้อยที่สุดที่กำหนดไว้ เทคนิคนี้จะใช้อย่างแพร่หลายในการวิเคราะห์การซื้อขายสินค้า
วิธีการค้นหากฎความสัมพันธ์ (Discovery of Association Rule) • การหาเซตไอเท็มที่มีค่าสนับสนุนมากกกว่าค่าสนับสนุนน้อยสุดที่กำหนดให้ เรียกเซตนี้ว่า เซตไอเท็มปรากฏบ่อย (frequent itemset) • การนำเซตไอเท็มเหล่านี้มาสร้างเป็นกฎความสัมพันธ์
ตัวอย่างการหาเซตไอเท็มปรากฏบ่อยตัวอย่างการหาเซตไอเท็มปรากฏบ่อย
การวิเคราะห์ความสัมพันธ์การวิเคราะห์ความสัมพันธ์ จากตัวอย่าง ระบบของ Data Mining หรือเหมืองข้อมูล อาจจะหากฏความสัมพันธ์กันได้เช่น เพศ (X, ชาย)^ เส้นทาง (X, ทางโค้ง) Support= 67% , เชื่อมั่น = 75 %) ในขณะที่ X เป็นตัวแปรแทน อุบัติเหตุ โดยสนใจเฉพาะ เพศชาย ซึ่งคิดเป็น 67 % ของอุบัติเหตุทั้งหมด เชื่อมั่นว่า 75 % ของเพศชาย จะประสบอุบัติเหตุในทางโค้ง
67 % 75 % การวิเคราะห์ความสัมพันธ์
วิเคราะห์ลักษณะทั่วไปและปัจจัยที่มีความเกี่ยวข้องกับการเกิดอุบัติเหตุจราจรทางถนนวิเคราะห์ลักษณะทั่วไปและปัจจัยที่มีความเกี่ยวข้องกับการเกิดอุบัติเหตุจราจรทางถนน • ศึกษาโดยใช้เทคนิคกฎการหาความสัมพันธ์ (Association Rules) • กำหนดค่า Minimum Probability • จะได้ความสัมพันธ์ของข้อมูลทั้งหมด ซึ่งมีค่าของโอกาสที่จะเกิดอุบัติเหตุ
ทดลองหาค่า Minimum Probability ที่เหมาะสม • ทำการเปรียบเทียบผลลัพธ์ที่เกิดขึ้นกับค่าเป้าหมายที่กำหนด หากผลลัพธ์ที่ได้อยู่ในขอบเขตที่สามารถยอมรับได้ก็จะสิ้นสุด • ถ้ายังไม่สามารถยอมรับได้ ให้ทำการปรับค่า Minimum Probability เพื่อให้ได้ผลลัพธ์ที่ยอมรับได้
กำหนดค่า Minimum Probability ของระดับความรุนแรง
การเลือกความสัมพันธ์และกำหนดค่าMinimum Probability
เลือกปัจจัยที่ต้องการหาความสัมพันธ์เลือกปัจจัยที่ต้องการหาความสัมพันธ์
กำหนดค่าMinimum Probabilityเท่ากับ 0.1
ผลที่ได้จากการคำนวณ โดยกำหนดค่า Minimum Probability เท่ากับ 0.1
ปัจจัยที่มีผลต่อระดับความรุนแรงของ อุบัติเหตุจราจรทางถนน • จากการศึกษาปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน จะใช้ระดับความรุนแรงเพื่อเป็นตัวแทนของข้อมูลทั้งหมด
ตัวอย่างตารางแสดงความสัมพันธ์กันของปัจจัยระดับความรุนแรงและเพศ และโอกาสที่จะเกิดอุบัติเหตุ ค่าเฉลี่ย ค่าความแปรปรวน และค่าคลาดเคลื่อนมาตรฐาน
กราฟแสดงตัวอย่างของปัจจัยระดับความรุนแรงและเพศ และโอกาสที่เกิดอุบัติเหตุ
ปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนนปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน ตัวอย่าง
ปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนนปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน • การหาความสัมพันธ์จะพบว่า สถานภาพของผู้ขับขี่ มีความสัมพันธ์ต่อระดับความรุนแรงในระดับ Severe (A) ซึ่งมีความสัมพันธ์หรือมีโอกาสเกิดอุบัติเหตุ เท่ากับ 0.2271 • แสดงว่า ผู้ขับขี่ มีโอกาสเกิดอุบัติเหตุ ที่มีการได้รับบาดเจ็บสาหัส เช่น การเสียเลือด หรือกระดูกหักมากกว่าหนึ่งแห่ง เป็นต้น
ปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนนปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน • รองลงมาคือระดับความรุนแรง Minor (C) มีความสัมพันธ์หรือมีโอกาสเกิดอุบัติเหตุ เท่ากับ 0.2085 • แสดงว่า ผู้ขับขี่ มีโอกาสเกิดอุบัติเหตุที่จะได้รับบาดเจ็บเล็กน้อย เช่น ศีรษะแตกแต่สมองไม่ไดรับการกระทบกระเทือน หรือเป็นแผลเพียงเล็กน้อย
ปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนนปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน • สุดท้ายคือ ระดับความรุนแรง Moderate (B) เท่ากับ 0.1691 • แสดงว่า ผู้ขับขี่ มีโอกาสเกิดอุบัติเหตุที่ได้รับบาดเจ็บปานกลาง เช่นกระดูกหักหนึ่งแท่ง และได้รับบาดเจ็บเป็นแผลแต่ไม่รุนแรงมากนัก เป็นต้น
ปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนนปัจจัยที่มีผลต่อระดับความรุนแรงของอุบัติเหตุจราจรทางถนน • สถานภาพของผู้ขับขี่มีผลต่อการเกิดอุบัติเหตุใน 3ระดับ • ส่วนระดับความรุนแรงอื่น ๆ และสถานภาพอื่น ๆ ที่ไม่ปรากฎในตารางไม่มีความสัมพันธ์กัน และมีโอกาสเกิดอุบัติเหตุหรือมีโอกาสเกิดอุบัติเหตุน้อยมาก
ตัวอย่างกราฟแสดงโอกาสที่จะเกิดอุบัติเหตุตัวอย่างกราฟแสดงโอกาสที่จะเกิดอุบัติเหตุ
การเปรียบเทียบการวิเคราะห์ด้วย Path Analysis กับการใช้เทคนิค Association Rules Path Analysis • เป็นการวิเคราะห์ความสัมพันธ์เชิงสาเหตุสามารถวิเคราะห์ได้ละเอียดถึง ความสัมพันธ์ทางตรง ความสัมพันธ์ทางอ้อม และความสัมพันธ์ทางหลอกได้
Path Analysis • เป็นการวิเคราะห์ทางสถิติที่อาศัยการประยุกต์วิธีการวิเคราะห์แบบถดถอย (Multiple Regression) มาหาค่าความสัมพันธ์ระหว่างตัวแปรอิสระ (Independent Variable: XI) หลาย ๆ ตัว กับตัวแปรตาม (Dependent Variable: Y) ในการวิเคราะห์ด้วยวิธีนี้จะต้องมีการสร้างแบบจำลองปัจจัยขึ้นเสียก่อน โดยการสร้างแบบจำลองจะต้องอยู่บนพื้นฐานของข้อสมมุติฐานของการศึกษา
การเปรียบเทียบการวิเคราะห์ด้วย Path Analysis กับการใช้เทคนิค Association Rules Association Rules • เป็นการค้นหาความสัมพันธ์ของข้อมูลจากข้อมูลขนาดใหญ่ที่มีอยู่ เพื่อนำไป ใช้ในการวิเคราะห์ หรือทำนายปรากฏการณ์ต่าง ๆซึ่งผลการวิเคราะห์ที่ได้จะเป็นคำตอบของปัญหา • ในการศึกษาข้อมูลการเกิดอุบัติเหตุการจราจรทางถนน โดยใช้เทคนิค Association Rules เนื่องจากในการเกิดอุบัติเหตุแต่ละครั้งจะมีปัจจัยต่าง ๆ มากมายที่เกี่ยวข้องกับการเกิดอุบัติเหตุ ไม่ใช่เพียงปัจจัยใดปัจจัยหนึ่งเท่านั้น
การเปรียบเทียบการวิเคราะห์ด้วย Path Analysis กับการใช้เทคนิค Association Rules
การประยุกต์ใช้งาน การเพิ่มข้อมูลอุบัติเหตุ
การประยุกต์ใช้งาน การวิเคราะห์