พยากรณ์ฝุ่น PM2.5 ด้วยเทคโนโลยีล้ำสมัย! แพลตฟอร์มวิเคราะห์ข้อมูลใหม่ช่วยคาดการณ์พื้นที่เสี่ยงมลพิษทางอากาศอย่างแม่นยำ พร้อมเครื่องมือสนับสนุนการจัดการปัญหาเพื่ออากาศบริสุทธิ์ของทุกคน
“มลพิษทางอากาศ” โดยเฉพาะฝุ่น PM2.5 ที่ประกอบด้วย ฝุ่นละออง เชื้อโรค หรือสารมลพิษอื่นๆ ซึ่งเป็นสารแขวนลอยในอากาศที่มีขนาดเล็กจนไม่สามารถถูกดักจับโดยขนจมูกได้ มีลักษณะเป็นของแข็งหรือของเหลวที่ฟุ้งกระจายในบรรยากาศ อนุภาคเหล่านี้สามารถมองเห็นได้ในลักษณะคล้ายหมอกหรือควัน โดยส่วนใหญ่ ฝุ่น PM2.5 เกิดจากการเผาไหม้ที่ไม่สมบูรณ์ เช่น การเผาไหม้จากเครื่องยนต์ดีเซล โรงงานอุตสาหกรรม การเผาไหม้ในที่โล่งจากการเกษตร รวมถึงไอเสียจากรถยนต์ ฝุ่น ควันดำ และภัยธรรมชาติอย่างไฟป่าและภูเขาไฟระเบิด
ผลกระทบจากฝุ่น PM2.5 มีความรุนแรงต่อสุขภาพ เช่น การระคายเคืองต่อดวงตาและจมูก การเกิดริ้วรอย จุดด่างดำ และความเหี่ยวย่นของผิวพรรณในระยะยาว นอกจากนี้ PM2.5 ยังสามารถเข้าสู่ร่างกายผ่านระบบทางเดินหายใจและกระจายไปยังอวัยวะภายใน ส่งผลให้มีความเสี่ยงต่อการเกิดโรคต่างๆ เช่น โรคมะเร็งปอด โรคหลอดเลือดหัวใจ และโรคหอบหืด
ในประเทศไทยการประเมินคุณภาพอากาศใช้ดัชนีคุณภาพอากาศ (Air Quality Index : AQI) ตามเกณฑ์ขององค์การอนามัยโลก (WHO) ปริมาณของ PM2.5 กำหนดไว้ที่ 25 ไมโครกรัมต่อลูกบาศก์เมตร สำหรับค่าเฉลี่ย 24 ชั่วโมง และ 10 ไมโครกรัมต่อลูกบาศก์เมตรสำหรับค่าเฉลี่ยต่อปี ในขณะที่ประเทศไทยกำหนดค่ามาตรฐานที่ 37.5 ไมโครกรัมต่อลูกบาศก์เมตร สำหรับค่าเฉลี่ย 24 ชั่วโมง และ 25 ไมโครกรัมต่อลูกบาศก์เมตรสำหรับค่าเฉลี่ยต่อปี จะเห็่นได้ว่าเรากำหนดค่ามาตรฐานที่สูงกว่า WHO แต่สภาพความเป็นจริง หลายพื้นที่ของไทยก็สูงกว่ามาตรฐานที่ไทยกำหนด
จากร่างพระราชบัญญัติอากาศสะอาดเพื่อประชาชน กำหนดให้หน่วยงานของรัฐจัด่ทำเครื่องมือและกลไกในการบริหารจัดการเพื่ออากาศสะอาดของประเทศ ซึ่งเครื่องมือและกลไกในการบริหารจัดการนี้มีหลายหน่วยงานเป็นเจ้าภาพกำกับดูแล แต่เครื่องมือและกลไกในข้อ 7 ระบบเฝ้าระวังและแจ้งเตือนคุณภาพอากาศ รวมทั้งะระบบเฝ้าระวังและแจ้งเตือนผลกระทบจากมลพิษทางอากาศต่อสุขภาพ ยังไม่ถูกพัฒนาขึ้น
ดังนั้น เพื่อเป็นการรองรับมาตรการดังกล่าวและร่วมแก้ปัญหามลพิษทางอากาศ กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.) โดย ศูนย์เชี่ยวชาญนวัตกรรมหุ่นยนต์และเครื่องจักรกลอัตโนมัติ (ศนย.) สถาบันวิจัยวิทยาศาสตร์และเทคโนโลยีแห่งประเทศไทย (วว.) ร่วมกับ กรมควบคุมมลพิษ (คพ.) และ บริษัท ไทย แอดวานซ์ อินโนเวชั่น จำกัด ภายใต้งบประมาณสนับสนุนจาก สำนักงานการวิจัยแห่งชาติ (วช.) จึงได้ดำเนิน โครงการพัฒนาต้นแบบแพลตฟอร์มวิเคราะห์ข้อมูลเพื่อการพยากรณ์สำหรับการบริหารจัดการปัญหาฝุ่น PM2.5 ซึ่งเป็นแพลตฟอร์มพื้นฐานที่รองรับการทำงานดังกล่าว
โดยแนวทางการพัฒนาของโครงการนี้ เกี่ยวข้องกับการวิเคราะห์ข้อมูลสำหรับคาดการณ์พื้นที่เสี่ยงต่อการเกิดมลพิษทางอากาศในเขตภูมิศาสตร์อากาศ (airshed) ผ่านการประยุกต์ใช้ข้อมูลลักษณะของภูมิประเทศ (topography) และอุตุนิยมวิทยา (meteorology) โดยเฉพาะเรื่องของอุณหภูมิผกผัน (temperature inversion) สำหรับประโยชน์ของการคาดการณ์พื้นที่เสี่ยงต่อการเกิดมลพิษอากาศ คือ หน่วยงานรัฐสามารถออกประกาศให้โรงงานอุตสาหกรรมหรือเกษตรกร ซึ่งจำเป็นต้องเผาวัสดุการเกษตร เลือกวันชิงเผา ในวันที่จะไม่ก่อให้เกิดฝุ่นพิษกระจุกตัวอยู่กับที่ในวันที่ไม่มีลม รวมทั้งการแจ้งเตือนให้เฝ้าระวังอย่างทันท่วงที
โครงการพัฒนาต้นแบบแพลตฟอร์มวิเคราะห์ข้อมูล
เพื่อการพยากรณ์สำหรับการบริหารจัดการปัญหาฝุ่น PM2.5
โครงการพัฒนาต้นแบบแพลตฟอร์มวิเคราะห์ข้อมูลเพื่อการพยากรณ์สำหรับการจัดการปัญหาฝุ่น PM2.5 มีขั้นตอนสำคัญหลายส่วนที่เชื่อมโยงกัน ได้แก่ การเก็บข้อมูล การวิเคราะห์ข้อมูล การประมวลผล การวิเคราะห์ผล การใช้งาน และการสรุป/ประเมินผล โดยมีรายละเอียดดังนี้:
การเก็บรวบรวมข้อมูล
โครงการเริ่มต้นด้วยการเก็บข้อมูลเกี่ยวกับสภาพอากาศจากระบบที่เรียกว่า remote sensing ซึ่งใช้เทคโนโลยีตรวจวัดจากระยะไกล เช่น ดาวเทียมหรือเซ็นเซอร์ เพื่อวิเคราะห์ชั้นบรรยากาศด้านบน (upper air) ข้อมูลที่ได้รวมถึงปัจจัยต่างๆ เช่น
– ปัจจัยอุตุนิยมวิทยา: ข้อมูลที่เกี่ยวข้องกับสภาพอากาศ เช่น อุณหภูมิ ความชื้น ความเร็วลม
– การใช้ประโยชน์ที่ดิน: ข้อมูลเกี่ยวกับลักษณะพื้นที่ เช่น ป่า เมือง หรือพื้นที่เกษตรกรรม
จากนั้นข้อมูลทั้งหมดจะถูกจัดเรียงและจัดทำคำอธิบายที่เรียกว่า metadata ซึ่งเปรียบเสมือน “สารบัญ” อธิบายเนื้อหาของข้อมูล รวมถึงสร้างระบบจัดเก็บข้อมูลที่เรียกว่า data lake ซึ่งเป็นพื้นที่ที่เก็บข้อมูลขนาดใหญ่ในรูปแบบดิบ
การวิเคราะห์ข้อมูลเบื้องต้น (Exploratory Data Analysis: EDA)
ในขั้นตอนนี้ นักวิจัยจะนำข้อมูลที่รวบรวมได้มาวิเคราะห์เพื่อหาลักษณะที่สำคัญ โดยใช้วิธีการศึกษาและตรวจสอบข้อมูลเพื่อทำความเข้าใจแนวโน้ม รูปแบบ และปัจจัยที่เกี่ยวข้องกับฝุ่น PM2.5
การทบทวนวรรณกรรมที่เกี่ยวข้อง
นักวิจัยจะศึกษาผลงานวิจัยหรือข้อมูลที่เคยมีมาเพื่อหาแนวทางในการตรวจสอบและวิเคราะห์ข้อมูล วิธีนี้ช่วยให้การดำเนินการมีพื้นฐานจากความรู้ที่ผ่านการทดสอบมาแล้ว
การจัดทำข้อมูลสำหรับการวิเคราะห์
หลังจากรวบรวมและศึกษาข้อมูลเรียบร้อยแล้ว ข้อมูลเหล่านี้จะถูกนำมาประมวลผลและปรับให้เหมาะสมกับการใช้งานในขั้นตอนต่อไป เช่น การประเมินพื้นที่ที่มีความเสี่ยงต่อการเกิดมลพิษทางอากาศ
โดยภาพรวม โครงการนี้มีเป้าหมายในการใช้ข้อมูลทางวิทยาศาสตร์เพื่อคาดการณ์และจัดการพื้นที่เสี่ยงต่อมลพิษทางอากาศ ซึ่งจะช่วยให้หน่วยงานที่เกี่ยวข้องสามารถแก้ไขปัญหาฝุ่น PM2.5 ได้อย่างมีประสิทธิภาพ
ขั้นตอนการประมวลผลข้อมูล
ในขั้นตอนการประมวลผลข้อมูล นักวิจัยได้ทดลองคาดการณ์พื้นที่ที่มีความเสี่ยงต่อการเกิดมลพิษทางอากาศ โดยใช้เทคโนโลยี การเรียนรู้ของเครื่อง (Machine Learning) และ การเรียนรู้เชิงลึก (Deep Learning) ซึ่งเป็นเทคโนโลยีที่ช่วยให้คอมพิวเตอร์สามารถเรียนรู้และคาดการณ์ได้จากข้อมูลจำนวนมาก
การฝึกสอนแบบจำลองและการปรับค่า
ข้อมูลที่เก็บรวบรวมถูกนำมา “ฝึกสอน” ให้ระบบเข้าใจรูปแบบและความสัมพันธ์ระหว่างตัวแปร เช่น สภาพอากาศ ความสูงของพื้นที่ และปริมาณฝุ่น
นักวิจัยปรับแต่งค่าที่เรียกว่า Hyperparameter ซึ่งเปรียบเหมือนการตั้งค่าของแบบจำลองเพื่อให้ผลลัพธ์ที่ได้มีความแม่นยำที่สุด
การทดสอบผลคาดการณ์
เมื่อแบบจำลองพร้อมแล้ว นักวิจัยนำไปทดสอบผลลัพธ์โดยใช้ข้อมูลจากแหล่งที่เชื่อถือได้ เช่น ข้อมูลการวัดคุณภาพอากาศจากสถานีตรวจวัดจริง
นอกจากนี้ ยังใช้ความรู้จากผู้เชี่ยวชาญของกรมควบคุมมลพิษในการช่วยแบ่งเขตพื้นที่และตรวจสอบความถูกต้องของแบบจำลอง
การแสดงผลและเผยแพร่ข้อมูล
ผลลัพธ์ของการวิเคราะห์จะถูกนำมาแสดงในรูปแบบ Dashboard ซึ่งเป็นแผงควบคุมที่เข้าใจง่ายและช่วยให้เห็นภาพรวมของพื้นที่เสี่ยงต่อมลพิษ
จากนั้นข้อมูลและระบบดังกล่าวจะถูกเผยแพร่ โดยมีการฝึกอบรมหน่วยงานในพื้นที่เป้าหมายให้สามารถใช้งานระบบนี้ได้อย่างมีประสิทธิภาพ
กระบวนการนี้ช่วยให้การจัดการมลพิษทางอากาศมีความแม่นยำและประสิทธิภาพยิ่งขึ้น หน่วยงานที่เกี่ยวข้องสามารถนำข้อมูลไปใช้วางแผนและแก้ไขปัญหาได้อย่างเหมาะสม
ปัจจัยที่สำคัญในการประเมินเขตภูมิศาสตร์อากาศ
ในการพัฒนาแพลตฟอร์มฯ คณะนักวิจัยจาก วว. กรมควบคุมมลพิษ (คพ.) และ บริษัท ไทย แอดวานซ์ อินโนเวชั่น จำกัด ได้สร้างแบบจำลองประเมินเขตภูมิศาสตร์อากาศ โดยใช้ข้อมูล upper air และ ข้อมูลฝุ่น PM2.5 จากชุดข้อมูล CAMS บนสมมติฐานที่ว่า ปัจจัยด้านอุตุนิยมวิทยา ปรากฎการณ์อุณหภูมิผกผัน หรือ temperature inversion เป็นปัจจัยที่สำคัญในการประเมินเขตภูมิศาสตร์อากาศ ดังนั้นข้อมูล upper air จึงถูกนำมาใช้เพื่อคำนวณหาจำนวนครั้งที่เกิดปรากฎการณ์อุณหภูมิผกผัน และความสูงที่เกิดปรากฎการณ์อุณหภูมิผกผันในแต่ละพื้นที่ โดยคณะนักวิจัยได้ดำเนินการวิเคราะห์ข้อมูลที่จำเป็น (EDA) เพื่อดำเนินการหาข้อมูลคุณลักษณะที่เหมาะสมกับการประมาณการณ์เขตภูมิศาสตร์อากาศ โดยได้ข้อสรุป ดังนี้
- ความสูงเหนือระดับน้ำทะเลที่สูงที่สุดในประเทศไทยอยู่ที่ 2,500 เมตรเหนือระดับน้ำทะเล
- แรงดันอากาศพื้นผิวที่ต่ำที่สุดในประเทศไทยอยู่ที่ประมาณ 860 เฮกโตปาสคาล (hPa)
- ความสูงของชั้นบรรยากาศโทรโพสเฟียร์ (Troposphere) อยู่ที่ไม่เกิน 10 กิโลเมตร
- ช่วงเวลาที่เกิดอุณหภูมิผกผันบ่อย คือช่วงเวลาพยากรณ์รอบ 1:00 นาฬิกา (1800 UTC+0) และ 7:00 นาฬิกา (0000 UTC+0) ในตอนเช้า
- ช่วงเวลาที่ฝุ่น PM2.5 มีปริมาณมาก คือ ช่วงเวลา 7:00 นาฬิกา (0000 UTC+0) ถึง 13:00 นาฬิกา (0600 UTC+0)
ปรับความถี่ของชุดข้อมูล (resample)
จากข้อมูลรายวันให้เป็นข้อมูลรายเดือน
เนื่องจากชุดข้อมูลที่นำเข้ามาพัฒนาแบบจำลองมีลักษณะเป็นข้อมูลเชิงพื้นที่และเชิงเวลา ซึ่งมีความผันผวนโดยธรรมชาติของปรากฏการณ์ทางอุตุนิยมวิทยา ข้อมูลจำนวนครั้งที่เกิดปรากฎการณ์อุณหภูมิผกผัน ความสูงที่เกิดปรากฎการณ์อุณหภูมิผกผัน และฝุ่น PM2.5 จึงได้ถูกนำมาปรับความถี่ของชุดข้อมูล (resample) จากข้อมูลรายวันให้เป็นข้อมูลรายเดือน ก่อนนำไปประเมินเขตภูมิศาสตร์อากาศด้วยการเรียนรู้ของเครื่องเทคนิค K-mean clustering
ยกตัวอย่างข้อมูลในเดือนมกราคม ปี พ.ศ. 2564 – 2565 ดัง ภาพที่ 1 แสดงตัวอย่างข้อมูลเฉลี่ยจำนวนครั้งที่เกิดอุณหภูมิผกผัน ภาพที่ 2 แสดงตัวอย่างข้อมูลความสูงจากระดับน้ำทะเลเฉลี่ยเมื่อเกิดอุณหภูมิผกผัน ภาพที่ 3 แสดงตัวอย่างข้อมูลค่าเฉลี่ยฝุ่น PM2.5 จากชุดข้อมูล CAMS Global atmospheric composition forecasts และ ภาพที่ 4 แสดงตัวอย่างการประเมินเขตภูมิศาสตร์อากาศ
จากการใช้ข้อมูล upper air เช่น อุณหภูมิผิว (surface temperature) ความเร็วลม (wind speed) และทิศทางลม (wind direction) จากระบบ remote sensing โดยใช้เทคนิค GNSS-RO แล้วนำข้อมูลเหล่านี้มาเปรียบเทียบกับข้อมูลบอลลูนอากาศพบว่า รูปแบบข้อมูลมีความสอดคล้องกัน นอกจากนี้ยังได้ทำการเปรียบเทียบกับสถานีวัดอากาศภาคพื้นดิน ซึ่งแม้ข้อมูลบางอย่างมีความแตกต่างเนื่องจากวิธีการวัดที่ต่างกัน แต่รูปแบบข้อมูลสอดคล้องกัน และจากการใช้ข้อมูลอุณหภูมิเพื่อวิเคราะห์ระดับความสูงที่เกิดปรากฏการณ์อุณหภูมิผกผัน (temperature inversion) โดยใช้ข้อมูลจากศูนย์โอโซนและรังสี พบว่าอุณหภูมิที่ระดับความสูงต่ำกว่า 1 กิโลเมตรมีแนวโน้มที่หลากหลาย แต่ที่สูงกว่า 1 กิโลเมตรมักมีแนวโน้มไปในทิศทางเดียวกัน
ดังนั้นข้อมูล upper air จึงถูกนำไปใช้ในแบบจำลองพยากรณ์อากาศเชิงตัวเลข (Numerical Weather Prediction : NWP) เพื่อประเมินเขตภูมิศาสตร์อากาศ โดยข้อมูลสำคัญที่ใช้ในแบบจำลอง เช่น ความสูงของชั้นโทรโพสเฟียร์ในประเทศไทยอยู่ที่ไม่เกิน 10 กิโลเมตร และช่วงเวลาที่เกิดอุณหภูมิผกผันบ่อยคือช่วงเช้าตรู่ โดยข้อมูลเหล่านี้ถูกนำมาปรับเป็นข้อมูลรายเดือนแล้วใช้เทคนิค K-mean clustering ในการประเมินเขตภูมิศาสตร์อากาศ และพัฒนาแบบจำลองการพยากรณ์