การตรวจสอบข้อมูลทางอุทกวิทยา Hydrologic Data Inspection
1.บทนำ อุทกวิทยาเป็นวิชาที่ว่าด้วยน้ำบนโลก ซึ่งกล่าวถึงการเกิด การเคลื่อนที่ การหมุนเวียนและการแผ่กระจายของน้ำบนดินและยังรวมถึงคุณสมบัติทางกายภาพและเคมีของน้ำ ปฏิกิริยาของน้ำกับสิ่งแวดล้อมซึ่งรวมถึงความสัมพันธ์กับสิ่งมีชีวิตทั้งหมด ขอบเขตของอุทกวิทยาคือทุกขั้นตอนในวงจรอุทกวิทยาของน้ำที่อยู่บนแผ่นดิน
ปัญหา 3 ประการในวิชาอุทกวิทยา การวัด การบันทึก และการเผยแพร่ข้อมูลขั้นพื้นฐานของอุทกวิทยา การนำข้อมูลดังกล่าวมาวิเคราะห์และพัฒนาขึ้นเป็นทฤษฎี การนำผลจากการวิเคราะห์หรือทฤษฎีไปใช้ประโยชน์
2.ข้อมูลอุทกวิทยา(Hydrologic Data) 2.1 ประเภทของข้อมูลอุทกวิทยา 1.ข้อมูลในอดีต(Historical data) 2.ข้อมูลในสนาม(field data) 3.ข้อมูลจากการทดลองในห้องปฏิบัติการ(laboratory experimental) 4.ข้อมูลความสัมพันธ์ระหว่างตัวแปรสุ่ม(random variables relation data)
แหล่งข้อมูลทั้ง 4 ประเภทจะมีความหมายค่าของข้อมูลอยู่ 3 ลักษณะ ดังนี้ 2.2 คุณภาพของข้อมูล แหล่งข้อมูลทั้ง 4 ประเภทจะมีความหมายค่าของข้อมูลอยู่ 3 ลักษณะ ดังนี้ 1. ค่าที่แท้จริง(true value) 2. ค่าที่บริสุทธิ์(virgin value) 3. ค่าที่รวบรวมได้(observed value)
2.3 ข้อผิดพลาดหรือความคลาดเคลื่อนของข้อมูล(errors) 2.3.1 ข้อผิดพลาดที่อาจเกิดขึ้นได้จากการเก็บรวบรวมข้อมูลประกอบด้วย 1. ความรู้สึก(sensing) 2. การถ่ายทอดหรือการเคลื่อนย้าย(Transmitting) 3. การเก็บหรือการบันทึก(Recording) 4. การจัดเตรียมข้อมูล(Processing)
2.3.2 ลักษณะของข้อผิดพลาดหรือความคลาดเคลื่อนในทางอุทกวิทยา 1.ความคลาดเคลื่อนแบบสุ่ม(random error) 2.ความคลาดเคลื่อนอย่างมีระบบ(systemic error) 3.ความคลาดเคลื่อนจากการไม่เป็นเนื้อเดียวกัน(non-homogeneity)
ภาพที่ 1 กราฟปริมาณน้ำท่ารายปีของแม่น้ำไนล์(Nile River)ตั้งแต่. ปีค. ศ ภาพที่ 1 กราฟปริมาณน้ำท่ารายปีของแม่น้ำไนล์(Nile River)ตั้งแต่ ปีค.ศ.1870 จนถึง ปี ค.ศ. 1955 ซึ่งเป็นตัวอย่างของการเกิด ความไม่น่าเชื่อได้ของข้อมูล(inconsistency)ขึ้นในอนุกรม เวลา
ภาพที่ 2 กราฟอนุกรมเวลาของปริมาณการไหลสูงสุดรายปี (maximum annual flood peak) ของแม่น้ำดานูบ ที่ออร์โชวา ประเทศโรมาเนีย ระหว่างปี ค.ศ.1840-1950 ซึ่งแสดง ให้เห็นลักษณะแนวโน้มเอียงขึ้น ซึ่งเรียกว่า Upward trand :(1) อนุกรมเวลาของ อัตราการไหลสูงสุดรายปี (2) ค่าเฉลี่ยของปริมาณการไหลสูงสุด (3) trend ของค่า เฉลี่ยของปริมาณการไหลสูงสุด
2.4 ปรากฏการณ์ทางอุทกวิทยา ตัวแปรและพารามิเตอร์ 2.4 ปรากฏการณ์ทางอุทกวิทยา ตัวแปรและพารามิเตอร์ ข้อมูลอุทกวิทยา คือ ข้อมูลที่ได้จากปรากฏการณ์ทางอุทกวิทยา เช่น ฝน น้ำท่า การระเหย ตะกอน เป็นต้น ตัวแปร คือ เทอมที่ใช้อธิบายปรากฏการณ์อุทกวิทยา เช่น ปริมาณการไหลรายวัน รายเดือนและรายปี หรือปริมาณฝน จำนวนวันฝนตก ฯลฯ พารามิเตอร์หรือตัวสถิติ คือ ค่าที่ใช้อธิบายเกี่ยวกับการแจกแจง(distribution) และกระบวนการของตัวแปรอุทกวิทยาเช่น ค่าเฉลี่ย ค่าความแปร ปรวน ค่าความเบ้ ค่าสัมประสิทธิ์สหสัมพันธ์ ฯลฯ
2.5 ความน่าเชื่อถือได้ของข้อมูลแบ่งได้เป็น 4 ประเภทคือ 1. มีความน่าเชื่อถือมากที่สุด 2. มีความน่าเชื่อถือน้อยกว่าประเภทที่ 1 3. มีความน่าเชื่อถือน้อยกว่าประเภทที่ 2 4. มีความน่าเชื่อถือน้อยที่สุด
3. การตรวจสอบข้อมูลทางอุทกวิทยา 1. การตรวจสอบความเชื่อถือได้ของข้อมูล ด้วยการทำ double mass analysis 2.การตรวจสอบ non-homogeneity ของข้อมูล ทำการตรวจสอบได้ 2 วิธี 1. Physical/historical evidence คือการหาหลักฐานมาสนับสนุนการเกิด non-homogeneity 2. Statistical test คือการทดสอบทางสถิติด้วย t-test และ f-test
ภาพที่ 3 การทำ double mass analysis
4. ขั้นตอนการทดสอบสมมุติฐาน 4.1 ขั้นตอนการทดสอบสมมุติฐานประกอบด้วย 1. ตั้งสมมุติฐานทางสถิติประกอบด้วย สมมุติฐานที่ต้องการทดสอบ(Null Hypothesis ; Ho) และสมมุติฐานแย้ง(Alternatives Hypothesis ; H1) 2.กำหนดค่านัยสำคัญ (œ)ที่จะปฏิเสธ Ho 3. เลือกตัวสถิติที่ใช้ทดสอบเป็น t,F,z, X2 ฯลฯ 4. สร้างขอบเขตในการยอมรับและปฏิเสธ 5. คำนวณค่าสถิติ 6. การเปรียบเทียบค่าสถิติที่คำนวณได้กับค่า Critical
4.2 ค่าสถิติ t t-Test จะใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของสองประชากรที่มีการแจกแจงแบบปรกติ เมื่อขนาดตัวอย่างเล็ก (n) คือมีค่าน้อยกว่า 30 (ขนาดตัวอย่างมากกว่า 30 เป็นตัวอย่างใหญ่ใช้ z-test กรณีไม่ทราบค่า 12 ,22 และ 12 =22
= ความแปรปรวน t = (x1 – x2) – (1 - 2) Sp2 ( 1 + 1 ) n1 n2 Sp2 = ความแปรปรวน (n1 - 1) S12 + (n2 - 1) S22 Sp2 = n1 + n2 – 2 n I=1 ( xi – x1 )2 S12 = n1 – 1 n I=1 ( xi – x2 )2 S22 = n2 – 1 df = n1 + n2 – 2
4.3 ค่าตัวสถิติ F F-Test จะใช้ทดสอบความแตกต่างระหว่างค่าความแปรปรวนของสองประชากรที่มีการแจกแจงแบบปรกติและเป็นอิสระต่อกัน S12 F = S22 df1 = n1– 1 df2 = n2– 1 S2larger ปกติจะใช้ F = S2smaller df1 = nlarger-1 df2 = nsmaller-1
ถ้าทดสอบ Ho ; 12 22 หรือ 12 22 Fcritical = F1 - (nlarger-1 , nsmaller-1) ถ้าทดสอบ Ho ; 12 = 22 Fcritical = F1 - (nlarger-1 , nsmaller-1) 2
5.สรุป ดังนั้นการตรวจสอบความน่าเชื่อถือได้ของข้อมูลทางอุทกวิทยาจึงมีความจำเป็นยิ่งก่อนที่จะนำข้อมูลนั้นไปวิเคราะห์หรือสังเคราะห์ ในการที่จะข้อมูลนั้นไป generation หรือ forecasting ต่อไป