ภาพรวมระบบวิเคราะห์ข้อมูล (Overview)

สรุปคุณภาพข้อมูล ความโปร่งใสของ pipeline และหลักฐานตามเกณฑ์ประเมิน

แถวก่อนทำความสะอาด
1,000
แถวหลังทำความสะอาด
995
Business-key Duplicate ก่อน
0.00%
Business-key Duplicate หลัง
0.00%
เวลาการทำงานของ Pipeline (Workflow Timeline) รวม 0.309 วินาที
# ขั้นตอน เวลา (วินาที) เสร็จเมื่อ
1 Step 1: Ingest Raw Data 0.009 2026-02-16T13:42:02
2 Step 2: Capture Schema & Baseline Metadata 0.01 2026-02-16T13:42:02
3 Step 3: Data Quality Checks (Before) 0.031 2026-02-16T13:42:02
4 Step 4: Cleaning & Standardization 0.08 2026-02-16T13:42:02
5 Step 5: Data Quality Checks (After) 0.034 2026-02-16T13:42:02
6 Step 6: EDA & Insight Extraction 0.039 2026-02-16T13:42:02
7 Step 7: Build What-So What-Now What 0.005 2026-02-16T13:42:02
8 Step 8: Prepare Dashboard Data 0.016 2026-02-16T13:42:02
9 Step 9: Build Data Dictionary 0.013 2026-02-16T13:42:02
10 Step 10: Create Sample Data (1,000 rows) 0.035 2026-02-16T13:42:02
11 Step 11: Export Artifacts 0.025 2026-02-16T13:42:02
Rubric Coverage
หัวข้อเกณฑ์ วิธีที่ระบบรองรับ ไฟล์หลักฐาน
3.5.1 การเตรียมข้อมูลและคุณภาพข้อมูล ระบบตรวจสอบความครบถ้วนชนิดข้อมูล ค่าว่าง ข้อมูลซ้ำ โดเมนค่า และ outlier ก่อน-หลัง พร้อมบันทึกผลเชิงสถิติทุกขั้นตอน รายงานคุณภาพก่อน
รายงานคุณภาพหลัง
รายงาน cleaning
Workflow
3.5.2 การสำรวจข้อมูล (EDA) ระบบคำนวณสถิติเบื้องต้น การกระจาย ความสัมพันธ์ แนวโน้มรายเดือน และรูปแบบ missing/outlier เพื่อสกัด insight ที่นำไปใช้ได้จริง EDA Summary
Dashboard Data
Dashboard
3.5.3 การสื่อสารข้อมูล หน้าแดชบอร์ดและ overview ใช้กราฟ/ตารางตามชนิดข้อมูล พร้อมคำอธิบาย What-So What-Now What และตัวเลขอ้างอิงจากแหล่งเดียวกัน Insight 5 ประเด็น
Overview
Dashboard
3.5.4 การใช้งาน (Usability) ออกแบบหน้าเป็นลำดับ Overview -> Workflow -> Dashboard -> Dictionary -> Downloads พร้อมตัวกรอง ปุ่มรัน pipeline และสถานะแจ้งผล Workflow Page
Dashboard Page
Downloads Page
3.5.5 การติดตั้งและใช้งานจริง มีคู่มือใช้งาน คำสั่งรัน dependency เวอร์ชัน และชุดข้อมูลตัวอย่าง 1,000 แถวสำหรับทดสอบเร็ว README
requirements
sample_data_1000
3.5.6 ประสิทธิภาพ (Performance) บันทึกเวลาทำงาน pipeline รายขั้นตอนและเวลารวม เพื่อใช้เทียบรอบการปรับปรุงและยืนยันความเสถียร Performance Metrics
Pipeline Meta
Workflow Timeline

What -> So What -> Now What (5 ประเด็นจากผลล่าสุด)

ดาวน์โหลด Insight JSON
1. ข้อมูลสะอาดขึ้นและน่าเชื่อถือขึ้น

What (เกิดอะไรขึ้น): ข้อมูลซ้ำลดจาก 0.00% เหลือ 0.00% (ลดลง 0.00 จุดเปอร์เซ็นต์) ตัดรายการซ้ำออก 0 แถว เหลือข้อมูลใช้งาน 995 แถว

So What (สำคัญอย่างไร): ตัวเลขในรายงานไม่ถูกนับซ้ำ ทำให้คณะกรรมการเชื่อถือผลวิเคราะห์ได้มากขึ้น

Now What (ควรทำอะไรต่อ): กำหนดกติกาว่าอัตราข้อมูลซ้ำต้องต่ำกว่า 0.50% ทุกครั้งก่อนสรุปผลนำเสนอ

Source: 03_quality_before.json, 03_quality_after.json, 03_cleaning_report.json, cleaned_data.csv, /workflow

2. ยังมีเคสที่ไปถึงโรงพยาบาลช้า

What (เกิดอะไรขึ้น): เวลามัธยฐานจากจุดเกิดเหตุถึงโรงพยาบาล = 42.0 นาที, กลุ่มเคส 5% ที่ช้าที่สุดใช้เวลาประมาณ 203.5 นาที และมีเคสเกิน 60 นาที 33.27%

So What (สำคัญอย่างไร): เคสที่ช้าเกิน 1 ชั่วโมงมีโอกาสอาการหนักขึ้น และเพิ่มภาระงานห้องฉุกเฉิน

Now What (ควรทำอะไรต่อ): ตั้งเป้ารอบถัดไปให้สัดส่วนเคสเกิน 60 นาทีลดลงอย่างน้อย 5 จุดเปอร์เซ็นต์

Source: 04_eda_summary.json, dashboard_data.json, cleaned_data.csv, /dashboard

3. เคสกระจุกอยู่ในบางจังหวัด

What (เกิดอะไรขึ้น): จังหวัดที่พบเคสมากที่สุดคือ ชลบุรี = 48 เคส (4.82%) และ 3 จังหวัดแรกคิดเป็น 12.86% ของข้อมูลทั้งหมด

So What (สำคัญอย่างไร): ถ้าลงทรัพยากรให้ถูกจังหวัด จะลดเคสได้เร็วกว่าเฉลี่ยกระจายทุกพื้นที่เท่ากัน

Now What (ควรทำอะไรต่อ): จัดทีมเชิงรุกใน 3 จังหวัดแรก และติดตามจำนวนเคสรายเดือนเป็น KPI หลัก

Source: dashboard_data.json, 04_eda_summary.json, cleaned_data.csv, /dashboard

4. มีกลุ่มอายุที่ควรโฟกัสชัดเจน

What (เกิดอะไรขึ้น): กลุ่มอายุ 25-44 ปี มีมากที่สุด 302 เคส (30.35% ของเคสที่ระบุอายุ) และผู้บาดเจ็บเพศชายคิดเป็น 60.70%

So What (สำคัญอย่างไร): การรณรงค์แบบเจาะกลุ่มอายุนี้จะคุ้มค่ากว่าการสื่อสารแบบกว้าง

Now What (ควรทำอะไรต่อ): เริ่มมาตรการเฉพาะกลุ่มอายุที่สูงสุด และตั้งเป้าลดเคสกลุ่มนี้อย่างน้อย 10% ในรอบถัดไป

Source: 04_eda_summary.json, dashboard_data.json, cleaned_data.csv, /dashboard

5. ข้อมูลสารเสพติดต้องติดตามคุณภาพเพิ่ม

What (เกิดอะไรขึ้น): เคสที่บันทึกว่าเกี่ยวข้องสารเสพติด (drugs=1) = 0.00% ของข้อมูลที่มีค่า; องค์ประกอบสำคัญ: kratom 0.00%, cannabis 0.00%

So What (สำคัญอย่างไร): ตัวเลขต่ำมากผิดสังเกต อาจหมายถึงปัญหาการบันทึกข้อมูล ไม่ใช่ความเสี่ยงจริงที่ต่ำ

Now What (ควรทำอะไรต่อ): ตรวจคุณภาพการบันทึกฟิลด์ drugs/kratom/cannabis รายเดือน และตั้งเป้าความครบถ้วนข้อมูล >= 95%

Source: 04_eda_summary.json, dashboard_data.json, cleaned_data.csv, /dashboard