2.6 การประมาณค่า พารามิเตอร์เป็นองค์ประกอบที่สำคัญองค์ประกอบหนึ่งของแบบจำลอง การกำหนดค่าของพารามิเตอร์สามารถทำได้ด้วยการพิจารณาจากข้อมูลเดิมหรือทำการประมาณค่าเพื่อใช้กับแบบจำลอง.

Slides:



Advertisements
งานนำเสนอที่คล้ายกัน
คณิตคิดเร็วโดยใช้นิ้วมือ
Advertisements

ที่ โรงเรียน เฉลี่ย 1 บ้านหนองหว้า บ้านสะเดาหวาน
การใช้โปรแกรม SPSS ในการตรวจสอบการแจกแจงของข้อมูล
การวิเคราะห์ข้อมูลเบื้องต้น
แบบรูปและความสัมพันธ์
ยินดีต้อน เข้าสู่ โครงงาน.
การทดสอบสมมติฐานเกี่ยวกับ ค่าเฉลี่ยประชากร 1 กลุ่ม
ความน่าจะเป็น Probability.
ไม่อิงพารามิเตอร์เบื้องต้น
พลังงานในกระบวนการทางความร้อน : กฎข้อที่หนึ่งของอุณหพลศาสตร์
การซ้อนทับกัน และคลื่นนิ่ง
เลขฐานต่าง ๆ อ.มิ่งขวัญ กันจินะ.
สถิติ และ การวิเคราะห์ข้อมูล
1.7 ระเบียบวิธีทางสถิติ 1. การเก็บรวบรวมข้อมูล (Data Collection)
บทที่ 12 การวิเคราะห์การถดถอย
บทที่2 การแจกแจงความถี่ (Frequency Distributions)
มิติที่ 1 มิติด้านประสิทธิผลตามแผนปฏิบัติราชการ
เปรียบเทียบจำนวนประชากรทั้งหมดจากฐาน DBPop Original กับจำนวนประชากรทั้งหมดที่จังหวัดถือเป็นเป้าหมาย จำนวน (คน) 98.08% % จังหวัด.
จำนวนเต็ม จำนวนเต็ม  ประกอบด้วย                   1. จำนวนเต็มบวก    ได้แก่  1 , 2 , 3 , 4, 5 , ....                   2.  จำนวนเต็มลบ      ได้แก่  -1.
การเลื่อนเงินเดือนข้าราชการ
ทศนิยมและเศษส่วน F M B N โดย นางสาวสุพรรษา ธรรมสโรช.
สำเร็จการศึกษาในเวลา 4 ปี
จำนวนนับใดๆ ที่หารจำนวนนับที่กำหนดให้ได้ลงตัว เรียกว่า ตัวประกอบของจำนวนนับ จำนวนนับ สามารถเรียกอีกอย่างว่า จำนวนเต็มบวก หรือจำนวนธรรมชาติ ซึ่งเราสามารถนำจำนวนนับเหล่านี้มา.
การขอเบิกเงินนอกงบประมาณ
เป้าเบิกจ่าย งบรวม เป้าเบิกจ่าย งบลงทุน งบรวม เบิกจ่าย.
จำนวนทั้งหมด ( Whole Numbers )
สถิติเชิงสรุปอ้างอิง(Inferential or Inductive Statistics)
การดำเนินงานอาชีวเวชศาสตร์: แพทย์ที่ผ่านการอบรม
การประเมินผลผลลัพธ์การดำเนินงาน ที่สำคัญ ( พ. ศ. ๒๕๕๓ ) ๑. ความพึงพอใจของประชาชนต่อคุณภาพ การให้บริการของหน่วยงานระดับ Front Office ( ๓. ๑. ๑. ๑ ) ๒. ความพึงพอใจของประชาชนต่อการ.
การทดสอบสมมติฐาน
สำนักงานสถิติแห่งชาติ กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ กองทุนหมู่บ้านและชุมชนเมือง พ.ศ สำนักงานสถิติแห่งชาติกระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร สิงหาคม.
ข้อมูลเศรษฐกิจการค้า
งานอนามัยแม่และเด็ก ปี 2551
การเลื่อนเงินเดือนในระบบใหม่
สำนักวิชาการและแผนงาน
การวัดการกระจาย (Measures of Dispersion)
การดำเนินงานตามแผนปฏิบัติการ โครงการที่ได้รับ
ภาพรวมเศรษฐกิจไทยล่าสุด (ณ เดือนตุลาคม) และแนวโน้มไตรมาส 3/50 และ 4/50
การแจกแจงปกติ.
การเปรียบเทียบทศนิยม และการใช้เครื่องหมาย  ,  ,  และ 
บทที่ 9 สถิติที่ใช้ในการประเมินผล
ค21201 คณิตศาสตร์เพิ่มเติม 1
F M B N สมบัติของจำนวนนับ ตัวคูณร่วมน้อย (ค.ร.น.).
ผลการทดสอบทางการศึกษา ระดับชาติขั้นพื้นฐาน ( O-NET) ระดับชั้นมัธยมศึกษาปีที่ 6 ผู้จัดทำ นางสาวภัทศิรา ภูมิเมือง เลขที่ 16 นางสาวสุพัชรญา มะโนรา เลขที่
สรุปสถิติ ค่ากลาง ค่าเฉลี่ยเลขคณิต เรียงข้อมูล ตำแหน่งกลาง มัธยฐาน
เรื่องการประยุกต์ของสมการเชิงเส้นตัวแปรเดียว
คณิตศาสตร์ (ค33101) หน่วยการเรียนรู้ที่ 7 เรื่อง สถิติ
หน่วยการเรียนรู้ที่ 7 ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
สถานการณ์ โรคเฝ้าระวังทางระบาดวิทยา ธันวาคม 2553 งานระบาดวิทยา งานระบาดวิทยา สำนักงานสาธารณสุขอำเภอเมืองลำปาง.
การทดสอบค่าเฉลี่ยประชากร
สรุปผลสัมฤทธิ์ปีการศึกษา 2552 ชั้ น จำนว นสาระการเรียนรู้ นักเรี ยนทค ค. เพิ่มวสพ.พ. ศ.ศ. ดน ตรีง.ง. คอ ม. อ อ. เพิ่ม ป.1ป
ณ โรงแรมมารวยการ์เด็น ธันวาคม 2555
บทที่ 4 การวัดการกระจาย
สรุปผลการสำรวจ ความคิดเห็นของประชาชนเกี่ยวกับ การป้องกันและปราบปรามยาเสพติด (ก่อนและหลัง การประกาศสงครามขั้นแตกหักเพื่อเอาชนะยาเสพติด) พ.ศ สำนักงานสถิติแห่งชาติ
ผลการทดสอบทางการศึกษาระดับชาติขั้นพื้นฐาน
สรุปผลการสำรวจ ความคิดเห็นของประชาชน
จำนวนจริง จำนวนอตรรกยะ จำนวนตรรกยะ เศษส่วน จำนวนเต็ม จำนวนเต็มบวก
Chi-Square Test การทดสอบไคสแควร์ 12.
หน่วยการเรียนรู้ที่ 7 ความรู้เบื้องต้นเกี่ยวกับจำนวนจริง
สถานการณ์ โรคเฝ้าระวังทางระบาดวิทยา มิถุนายน 2554 งานระบาดวิทยา งานระบาดวิทยา สำนักงานสาธารณสุขอำเภอเมืองลำปาง.
กราฟเบื้องต้น.
ภาวะราคาปาล์มน้ำมัน จังหวัดสุราษฎร์ธานี จังหวัดชุมพร จังหวัดกระบี่
โครงสร้างข้อมูลแบบ สแตก (stack)
กราฟเบื้องต้น.
การวัดและประเมินผล.
ผลการประเมิน คุณภาพการศึกษาขั้นพื้นฐาน ปีการศึกษา
คณิตศาสตร์ (ค33101) ชั้นมัธยมศึกษาปีที่ 3 สอนโดย ครูปพิชญา คนยืน.
คณิตศาสตร์ (ค33101) ชั้นมัธยมศึกษาปีที่ 3 หน่วยการเรียนที่ 7
แผนภูมิแสดงแผนและผลการใช้จ่ายงบประมาณปี 2549 การใช้ จ่าย ( สะสม ) ต.ค.ต.ค. พ.ย.พ.ย. ธ.ค.ธ.ค. ม.ค.ม.ค. ก.พ.ก.พ. มี. ค. เม. ย. พ.ค.พ.ค. มิ. ย. ก.ค. ก.ค.
ใบสำเนางานนำเสนอ:

2.6 การประมาณค่า พารามิเตอร์เป็นองค์ประกอบที่สำคัญองค์ประกอบหนึ่งของแบบจำลอง การกำหนดค่าของพารามิเตอร์สามารถทำได้ด้วยการพิจารณาจากข้อมูลเดิมหรือทำการประมาณค่าเพื่อใช้กับแบบจำลอง เทคนิคนี้เป็นการหาค่าประมาณของตัวประมาณค่า หรือที่เรียกว่า Estimator ของพารามิเตอร์

การประมาณค่าทำได้ 2 แบบคือ - การประมาณค่าแบบจุด ตัวประมาณค่าพารามิเตอร์ของประชากรมีค่าเพียงค่าเดียว - การประมาณค่าแบบช่วง ตัวประมาณค่าพารามิเตอร์ของประชากรให้ค่าเป็น 2 จำนวนคือขอบล่างและขอบบน

คุณสมบัติสำหรับการพิจารณาความเหมาะสม ของตัวประมาณค่า 1. ความไม่ลำเอียง (Unbiasness) 2. ความแปรปรวนน้อยที่สุด (Minimum Variance) 3. ความเสมอต้นเสมอปลาย (Consistency) วัดได้จาก

2.7 การทดสอบความถูกต้อง 2.7.1 การทดสอบสมมติฐาน เพื่อทดสอบความมีนัยสำคัญของค่าพารามิเตอร์ของข้อมูล และลักษณะการกระจายของความน่าจะเป็นของประชากร 2.7.2 การทดสอบลักษณะการกระจาย เพื่อตรวจสอบว่ารูปแบบการแจกแจงที่กำหนดให้นั้นมีความถูกต้องหรือน่าเชื่อถือมากน้อยเพียงใด เราจะต้องทำการทดสอบลักษณะการกระจาย

2.7.1 การทดสอบสมมติฐาน สมมติฐานที่จะทดสอบนั้นจะแบ่งเป็น 2 ส่วนคือ H0 เป็นสมมติฐานหลัก (Null hypothesis) คือสมมติฐานที่มีค่าที่ต้องการพิจารณาเพียงค่าเดียว เช่น H0 :  = 0 0 คือค่าหรือผลของระบบงานจริง Ha เป็นสมมติฐานรอง (Alternative hypothesis) คือสมมติฐานที่มีค่าที่ต้องการพิจารณาหลายค่า เช่น Ha :   0 หรือ Ha :  < 0

ขั้นตอนของการตรวจสอบสมมติฐาน 1. ตั้งสมมติฐาน H0 และ Ha กำหนดระดับนัยสำคัญ () โดยถ้าค่าระดับ นัยสำคัญสูง โอกาสที่จะปฏิเสธ H0 ก็จะสูง 3. คำนวณค่าสถิติที่เหมาะสมกับข้อมูล (ค่า Z หรือ t จากข้อมูล) 4. เปรียบเทียบค่าสถิติจากข้อ 3. ว่าอยู่ในช่วง วิกฤต (Critical region) หรือไม่ ถ้าอยู่ในช่วง critical region จะปฏิเสธ สมมติฐาน H0 ถ้าไม่ใช่จะยอมรับสมมติฐาน

ค่าสถิติที่ใช้สำหรับทดสอบได้แก่ ค่า Zc หรือค่า tc โดยมีหลักการใช้ดังนี้ กรณีที่ n  30 จะใช้ ค่า Zc ซึ่งคำนวณ จาก แสดงว่า ยอมรับ H0 (กรณีที่เป็นด้านเดียว) ถ้า ผลลัพธ์ ถ้า แสดงว่า ยอมรับ H0 (กรณีที่เป็นสองด้าน)

กรณีที่ n < 30 จะใช้ ค่า tc ซึ่งคำนวณ จาก แสดงว่า ยอมรับ H0 (กรณีที่เป็นด้านเดียว) ถ้า ผลลัพธ์ ถ้า แสดงว่า ยอมรับ H0 (กรณีที่เป็นสองด้าน)

ตัวอย่าง 2.7 บริษัทผลิตตะปูคอนกรีต ได้ทำการผลิต ตะปูตามแบบจำลองที่สร้างไว้ โดยแบบจำลองให้ผลว่า ตะปูแต่ละตัวที่ผลิตมานั้น สามารถรับน้ำหนักได้ 14 กก. และจากข้อมูลเดิมของบริษัททราบว่าความต้านทาน น้ำหนักของตะปูที่ผลิตขึ้นมานั้นมีการแจกแจงแบบปกติ ที่มีค่าเบี่ยงเบนมาตรฐานเป็น 1.2 กิโลกรัม ผู้บริหาร ต้องการให้ยืนยันผลการทดสอบจึงให้ทำการทดลอง สุ่มตัวอย่างตะปูมา 36 ตัว และวัดค่าน้ำหนักเฉลี่ยที่ สามารถรับได้คือ 13.7 กก. อยากทราบว่าภายใต้ ความเชื่อมั่น 95% ตะปูจะสามารถรับน้ำหนักได้ 14 กก. จริงหรือไม่

วิธีทำ สมมติฐาน H0 คือ  = 14 Ha คือ  < 14 จากโจทย์จะได้ n = 36, จากตารางค่า ที่ระดับความเชื่อมั่น 95% = 1.65 คำนวณหาค่า = = -1.5 พบว่า < 1.65 ดังนั้น ยอมรับ สมมติฐาน H0 คือตะปูที่ผลิตได้นั้นจะสามารถรับน้ำหนักได้ 14 กก.

ตัวอย่าง 2.8 ยางรถยนต์ที่ผลิตโดยบริษัทแห่งหนึ่ง โฆษณาว่าสามารถวิ่งได้ระยะทางเฉลี่ยไม่ต่ำกว่า 22,000 กิโลเมตร โดยไม่ต้องเปลี่ยน เพื่อทดสอบข้อมูลนี้จึงทำการสุ่มนำยางรถยนต์มาทดสอบจำนวน100 เส้น ใช้ทดลองวิ่งพบว่า ได้ระยะทางเฉลี่ย 21,431 กิโลเมตร และมีค่าเบี่ยงเบนมาตรฐาน 1,295 กิโลเมตร จงแสดงให้เห็นว่าภายใต้ความเชื่อมั่น 99 % ยางรถยนต์ ที่ผลิตได้นี้สามารถวิ่งได้ระยะทางเฉลี่ยตามที่บริษัทโฆษณาหรือไม่

วิธีทำ สมมติฐาน H0 คือ  = 22,000 Ha คือ  < 22,000 จากโจทย์จะได้ n = 100, จากตารางค่า ที่ระดับความเชื่อมั่น 99% = 2.33 คำนวณหาค่า = = -4.39 พบว่า < 2.33 ดังนั้น ปฏิเสธ สมมติฐาน H0 คือยางรถยนต์ที่ผลิตได้จะวิ่งได้ระยะทางเฉลี่ยน้อยกว่า 22,000 กิโลเมตร

ตัวอย่าง 2.9 บริษัทเครื่องดับเพลิงกล่าวว่า เครื่องจะฉีดน้ำยาในระดับอุณหภูมิ 130 องศาเซลเซียส เพื่อพิสูจน์ข้อความนี้จึงสุ่มเครื่องมา 49 เครื่อง และทดลองใช้ที่อุณหภูมิเฉลี่ย 131.08 องศาเซลเซียส ถ้าอุณหภูมิที่ใช้สุ่มมีค่าเบี่ยงเบนมาตรฐาน 1.5 องศาเซลเซียส อยากทราบว่าข้อความข้างต้นนี้สามารถยอมรับได้ภายใต้ความเชื่อมั่นที่ระดับนัยสำคัญ 0.05 หรือไม่

วิธีทำ สมมติฐาน H0 คือ  = 130 Ha คือ   130 จากโจทย์จะได้ n = 49, จากตารางค่า คือ Z  -1.96 และ Z  1.96 คำนวณหาค่า = = 5.05 ดังนั้น ปฏิเสธ สมมติฐาน H0 คือคือเครื่องดับเพลิงนี้จะฉีดน้ำยาออกมาที่ระดับอุณหภูมิไม่เท่ากับ 130 องศา

2.7.2 การทดสอบลักษณะการกระจาย วิธีการทดสอบที่นิยมใช้กันอยู่มี 2 วิธีคือ - การทดสอบแบบไคร์สแควร์ (2 - test) - การทดสอบแบบโครโมโกรอฟ-สเมอร์นอฟ (Komogorov-Smirnov test)

การทดสอบแบบไคร์แสควร์ ( 2 -test) เป็นการทดสอบสำหรับกรณีที่ข้อมูลหรือ ค่านั้นมีการประมาณค่าพารามิเตอร์หรือไม่มี การประมาณค่าพารามิเตอร์ก็ได้ ดีกรีของความอิสระคือ k-r-1 โดย k = จำนวนกลุ่มของข้อมูล r = จำนวนพารามิเตอร์ที่มีการประมาณค่า Oi = ค่าความถี่ของข้อมูล (Observed Frequency) Ei = ค่าความถี่คาดหมายของจากการกระจายของ ความน่าจะเป็นของข้อมูลที่ต้องการทดสอบ (Expected Frequency)

สำหรับสูตรนี้ ค่าความถี่คาดหมายใน แต่ละกลุ่มนั้นต้องเท่ากับหรือมากกว่า 5 ถ้ากลุ่มใดมีน้อยกว่า 5 ให้รวมกับกลุ่มที่ติดกัน จนกว่าจะได้ความถี่มากกว่าหรือเท่ากับ 5 ซึ่งมีหลักการพิจารณาดังนี้ ถ้า ยอมรับลักษณะการกระจายของ ข้อมูลที่ทดสอบ ถ้าไม่ใช่ จะปฏิเสธรูปแบบของการกระจาย

จงทดสอบว่าการโยนลูกเต๋ามีลักษณะกระจาย ตัวอย่าง 2.10 จากการโยนลูกเต๋า 120 ครั้ง ได้ค่าความถี่จากการสังเกตดังตารางต่อไปนี้ แต้มที่โยนได้ 1 2 3 4 5 6 ความถี่ที่ได้จากการสังเกต 18 19 23 26 16 จงทดสอบว่าการโยนลูกเต๋ามีลักษณะกระจาย แบบสม่ำเสมอ โดยใช้ระดับนัยสำคัญ 0.05

วิธีทำ จากตารางพิจารณาค่า Oi และ Ei ดังนี้ แต้มที่โยนได้ 1 2 3 4 5 6 ความถี่ที่ได้จากการสังเกต (Oi) 18 19 23 26 16 ความถี่ที่คาดหวัง (Ei) 20

จากค่าที่คำนวณได้ เปิดตารางค่า พบว่า ดังนั้น ยอมรับว่าข้อมูลการโยนลูกเต๋านี้มีลักษณะการกระจายแบบสม่ำเสมอ

การทดสอบแบบโครโมโกรอฟ-สเมอร์นอฟ (Komogorov-Smirnov test) เป็นการทดสอบที่ใช้เฉพาะกรณีที่ไม่ต้องมี การประมาณค่าพารามิเตอร์ โดยใช้ค่า D เป็นค่า สถิติสำหรับทดสอบซึ่งจะคำนวณได้จากสูตรดังนี้ โดยที่ S (x) = ค่าความน่าจะเป็นสะสมของข้อมูล (Observed Cumulative Probability) F (x) = ค่าความน่าจะเป็นสะสมคาดหมาย (Expected Cumulative Probability) จากนั้นเปรียบเทียบค่า D ที่คำนวณได้กับค่า จากตาราง โดยที่ n คือจำนวนข้อมูล ถ้า ยอมรับลักษณะ การกระจายของความน่าจะเป็นแบบที่ทดสอบ

ตัวอย่าง 2. 11 จากข้อมูลในตัวอย่าง 2 ตัวอย่าง 2.11 จากข้อมูลในตัวอย่าง 2.10 จงทดสอบว่าการโยนลูกเต๋ามีลักษณะกระจายแบบสม่ำเสมอ ด้วยวิธีโครโมโกรอฟ-สเมอร์นอฟ โดยใช้ระดับนัยสำคัญ 0.05 วิธีทำ จากข้อมูลนำมาคำนวณหาค่า S (x) และ F (x) เพื่อคำนวณหาค่า D ได้ดัง ตาราง

จำนวนครั้งที่โยนได้จริง แต้มที่โยนได้ จำนวนครั้งที่โยนได้จริง จำนวนครั้งที่ประมาณ p(x) S(X) F(X) |S(X)-F(X)| 1 18 20 18/120=0.15 0.15 0.166 0.016 2 19 0.16 0.31 0.332 0.022 3 0.46 0.498 0.038 4 23 0.191 0.651 0.664 0.013 5 26 0.216 0.867 0.83 0.037 6 16 0.133 1.00 120

ดังนั้นค่า D คือ 0.038 และจากตารางค่า = 0.521 พบว่าค่าสถิติ จึงยอมรับว่าข้อมูลการโยนลูกเต๋านี้มีลักษณะ การกระจายแบบสม่ำเสมอ

2.8 เทคนิคมอนติ คาร์โล ตัวแบบจำลองมอนติ คาร์โล (Monte Carlo Model) เป็นตัวแบบจำลองที่ทำงานโดยการเปลี่ยนแปลงเวลาของตัวแบบจำลองไม่เกี่ยวข้องกับการเปลี่ยนแปลงของเวลาจริง โดยอาศัยเทคนิคที่เรียกว่า มอนติ คาร์โล เทคนิคมอนติ คาร์โล เทคนิคนี้เป็นเทคนิคที่นิยมใช้ในการแก้ปัญหาที่มีความไม่แน่นอนของข้อมูลในเชิงปริมาณ

ความหมายของเทคนิคมอนติ คาร์โล เทคนิคในการสร้างข้อมูลจากตัวเลขแบบสุ่มและความน่าจะเป็นสะสม ซึ่งโดยปกติแล้วตัวเลขแบบสุ่มสามารถสร้างได้หลายวิธี เช่น นำค่ามาจากตารางตัวเลขแบบสุ่ม (Random Numbers Table) สร้างจากโปรแกรมคอมพิวเตอร์ หรือจากการสุ่มด้วยวิธีโยนลูกเต๋า เป็นต้น และตัวเลขแบบสุ่มที่สร้างขึ้นนี้จะมีลักษณะการกระจายของความน่าจะเป็นแบบสม่ำเสมอ

ขั้นตอนการจำลองแบบปัญหาโดยใช้เทคนิค มอนติ คาร์โล กำหนดปัญหาหรือสิ่งที่สนใจ ระบุองค์ประกอบที่เกี่ยวข้องและพิจารณาว่า องค์ประกอบใดบ้างที่มีความไม่แน่นอน 3) พิจารณาหาการแจกแจงของความน่าจะเป็น (Probability distribution) ของ องค์ประกอบที่มีความไม่แน่นอนแต่ละตัว แล้ว คำนวณเป็นค่าความน่าจะเป็นสะสม 4) กำหนดค่าตัวเลขแบบสุ่ม (Random Number) เพื่อใช้แทนค่าความน่าจะเป็นสะสม

ขั้นตอนการจำลองแบบปัญหาโดยใช้เทคนิค มอนติ คาร์โล (ต่อ) นำค่าที่ได้ในข้อ 4) ซึ่งคือค่าข้อมูลที่ ต้องการนั้นไปใช้ในการทดสอบตัว แบบจำลอง 6) สร้างตัวแบบจำลองทางคณิตศาสตร์ 7) ทำการทดสอบตัวแบบจำลอง 8) เมื่อตัวแบบจำลองสามารถทำงานได้ตาม เป้าหมายแล้ว กำหนดจำนวนครั้งในการ จำลอง 9) ทำการจำลองเพื่อหาผลลัพธ์ที่ต้องการ

ตัวเลขแบบสุ่ม เป็นตัวแปรที่สร้างขึ้นเพื่อใช้ ในแบบจำลองเมื่อใช้เทคนิคมอนติ คาร์โล โดยการพิจารณาตัวเลขแบบสุ่ม ประกอบด้วย 1. คุณสมบัติของตัวเลขแบบสุ่ม 2. วิธีการสร้างตัวเลขแบบสุ่ม 3. การทดสอบตัวเลขแบบสุ่ม

คุณสมบัติของตัวเลขแบบสุ่ม ตัวเลขแบบสุ่มที่ดีนั้นจะต้องมีคุณสมบัติเบื้องต้นเพื่อพิจารณาว่าตัวเลขแบบสุ่มนี้เป็นตัวเลขที่สามารถนำไปใช้งานได้จริง คุณสมบัติที่สำคัญมี 2 ประการคือ (1) มีความสม่ำเสมอ (Uniformity) (2) มีความเป็นอิสระ (Independence)

ฟังก์ชันหนาแน่นความน่าจะเป็นของตัวเลขแบบสุ่มนั้นจะมีรูปแบบดังนี้

ค่าคาดหมาย คือ ค่าความแปรปรวน คือ คุณสมบัติเหล่านี้จะเป็นคุณสมบัติสำหรับ ตัวเลขที่ถูกสร้างขึ้นมาให้เป็นตัวเลขแบบสุ่ม ซึ่งเรียกว่าตัวเลขคล้ายสุ่ม (Pseudo Random Number) คือเป็นตัวเลขแบบสุ่มที่สร้างขึ้นโดย วิธีการต่าง ๆ เพื่อใช้เสมือนเป็นตัวเลขแบบสุ่ม สำหรับตัวแบบจำลอง

วิธีการสร้างตัวเลขแบบสุ่ม ลักษณะของสร้างตัวเลขแบบสุ่มโดยภาพรวมนั้นจะเป็นวิธีการเลียนแบบลักษณะของการเกิดตัวเลขแบบสุ่มโดยใช้หลักทางคณิตศาสตร์เข้ามาช่วยสร้างชุดตัวเลขแทนตัวเลขจริง วิธีการสร้างตัวเลขแบบสุ่มที่รู้จักและใช้กันนั้นมีอยู่หลากหลาย โดยจะยกตัวอย่างมา 5 วิธี ได้แก่

วิธีตัดกลางกำลังสอง (Midsquare Method) เริ่มด้วยการกำหนดค่าเริ่มต้น (seed) แล้วนำค่าเริ่มต้นนี้มายกกำลังสองแล้วตัดตัวเลขส่วนหัวและท้ายออกไปโดยมีจำนวนหลักที่ตัดออกไปเท่า ๆ กัน แล้วนำตัวเลขที่อยู่ตรงกลางมาใช้เป็นตัวเลขสุ่มโดยปรับเปลี่ยนตัวเลขนั้นให้เป็นค่าทศนิยม

ตัวอย่าง 2.12 จงสร้างชุดตัวเลขสุ่มทศนิยม 4 ตำแหน่ง ด้วยวิธีตัดกลางกำลังสอง โดยให้ค่าเริ่มต้น X0 = 3175 วิธีทำ X0 = 3175 = (3175)2 = 10080625  X1 = 0806 R1 = 0.0806 = (0806)2 = 649636  X2 = 4936 R2 = 0.4936 = (4936)2 = 24364096  X3 = 3640 R3 = 0.3640 = (3640)2 = 13249600  X4 = 2496 R4 = 0.2496 ……….

จุดด้อยของวิธีนี้คือ จำนวนตัวเลขแบบสุ่มที่สร้างขึ้นมานั้นอาจจะมีวัฎจักรสั้นหรือยาวขึ้นอยู่กับการกำหนดค่าเริ่มต้นของ X0 เช่น ถ้า X0 มีค่าเป็น 4500 X0 = 4500 = (4500)2 = 20250000  X1 = 2500 R1 = 0.25 = (2500)2 = 06250000  X2 = 2500 R2 = 0.25 = (2500)2 = 06250000  X3 = 2500 R3 = 0.25 = (2500)2 = 06250000  X4 = 2500 R4 = 0.25 ……….

วิธีตัดกลางของผลคูณ (Midproduct Method) กำหนดค่าเริ่มต้น 2 จำนวน คือ เป็นตัวเลขเริ่มต้นตัวแรก และ X0 เป็นตัวเลขเริ่มต้นตัวที่ 2 โดยตัวเลขทั้งสองเป็นเลขขนาด d หลัก ขั้นตอนของการสร้างตัวเลขแบบสุ่มคือ นำตัวเลขทั้งสองนี้มาคูณกันแล้วตัดเลขตรงกลางของผลคูณมา d หลัก เพื่อเป็น X1 แล้วนำเลขนั้นมาทำเป็นจุดทศนิยมจะได้ R1 จากนั้นนำ X1 ไปคูณกับ X0 แล้วตัดเลขตรงกลาง d หลักอีกครั้งนำมาเป็น X2 ซึ่งค่านี้นำไปทำเป็นจุดทศนิยมจะได้ R2 ทำเช่นนี้ต่อไปเรื่อย ๆ จนกว่าจะได้จำนวนตัวเลขแบบสุ่มครบตามต้องการ

ตัวอย่าง 2.13 จงสร้างตัวเลขแบบสุ่มทศนิยม 4 ตำแหน่งด้วยวิธีตัดกลางของผลคูณ โดยให้ค่าเริ่มต้น X0 = 3175 และ = 5137 วิธีทำ = 3175(5137) = 16309975  X1 = 3099 R1 = 0.3099 X0X1 = (3175)(3099) = 09839325  X2 = 8393 R2 = 0.8393 X1X2 = (3099)(8393) = 26009907  X3 = 0099 R3 = 0.0099 …………………

วิธีตัวคูณคงที่ (Constant Multiplier Technique) เริ่มจากการกำหนดค่าคงที่ 1 ตัวคือ k แล้วนำมาคูณกับค่าตัวเลขเริ่มต้น X0 ซึ่งมีขนาด d หลัก แล้วนำเอาตัวเลขตรงกลางขนาด d หลักมาเป็น X1 แล้วนำมาทำเป็นจุดทศนิยมกำหนดเป็นค่า R1 จากนั้นนำค่า k มาคูณกับ X1 แล้วตัดเอาตัวเลขตรงกลางขนาด d หลักมาเป็นค่า X2 และนำค่านี้มาทำเป็นจุดทศนิยมให้เป็นค่า R2 และดำเนินการอย่างนี้ซ้ำไปเรื่อย ๆ เพื่อสร้างค่าตัวเลขแบบสุ่มต่อไป

ตัวอย่าง 2.14 จงสร้างตัวเลขแบบสุ่ม ด้วยวิธีตัวคูณคงที่ โดยมี k = 3157, X0 = 2468 R1 = 0.7914 kX1 = (3157)(7914) = 24984498  X2 = 9844 R2 = 0.7914 kX2 = (3157)(9844) = 31077508  X3 = 0775 R3 = 0.0775 ……………….

วิธี Additive Congruential วิธีการนี้กำหนดตัวเลขจำนวนเต็ม ตามลำดับ จากนั้นนำตัวเลขเหล่านี้มาสร้างเป็น แล้วจึงนำค่าที่สร้างใหม่เหล่านี้มาสร้างเป็น ต่อไป โดยใช้สูตรการสร้างดัง ต่อไปนี้ โดยค่า m ที่กำหนดให้นี้จะส่งผลให้ค่าที่ได้ เป็นเลขเศษที่มีค่าน้อยกว่า m

ตัวอย่าง 2.15 จงสร้างชุดตัวเลขสุ่มจำนวน 5 ตัว โดยวิธี Additive Congruential และใช้ค่าที่กำหนดให้ดังนี้ X1 = 34, X2 = 27, X3 = 87, X4 = 45, X5 =18, n = 5 และ m =100 วิธีทำ X6 = (X5 + X1 ) mod 100 = ( 18+34 ) mod 100 = 52 R6-5 = R1 = X6 /100 = 0.52 X7 = (X6 + X2 ) mod 100 = ( 52+27 ) mod 100 = 79 R7-5 = R2 = X7 /100 = 0.79

X8 = (X7 + X3 ) mod 100 = ( 79+87 ) mod 100 = 66 R8-5 = R3 = X8 /100 = 0.66 X9 = (X8 + X4 ) mod 100 = ( 66+45 ) mod 100 = 11 R9-5 = R2 = X9 /100 = 0.11 X10 = (X9 + X5 ) mod 100 = ( 11+18 ) mod 100 = 29 R10-5 = R5 = X10 /100 = 0.29

วิธี Linear Congruential วิธีนี้เป็นวิธีที่นิยมใช้ในปัจจุบัน โดยมีสูตรการ คำนวณดังนี้ ; i = 0,1,2,… โดยที่ X0 เป็นตัวเลขเริ่มต้น a เป็นค่าคงที่ที่ใช้ในการคูณ c เป็นค่าที่เพิ่มขึ้น m เป็นตัวโมดูลัส และ Xi เป็นตัวเลขจำนวนเต็มที่อยู่ระหว่าง 0 กับ m-1 จะได้

ตัวอย่าง 2.16 จงสร้างชุดตัวเลขสุ่มจำนวน 5 ตัว โดยวิธี Linear Congruential และใช้ค่าที่กำหนดให้ดังนี้ X0 = 2468 a = 35862 c = 253 m = 10000 วิธีทำ X1 = (35862)(2468)+253 mod 10000 = 88507669 = 7669 R1 = X1/10000 = 0.7669 X2 = (35862)(7669)+253 mod 10000 = 275025931 = 5931 R2 = X2/10000 = 0.5931 X3 = (35862)(5931)+253 mod 10000 = 212697775 = 7775

R3 = X3/10000 = 0.7775 X4 = (35862)(7775)+253 mod 10000 = 278827303 = 7303 R4 = X4/10000 = 0.7303 X5 = (35862)(7303)+253 mod 10000 = 261900439 = 0439 R5 = X5/10000 = 0.0439

การทดสอบตัวเลขแบบสุ่ม เนื่องจากตัวเลขแบบสุ่มเหล่านี้จะถูกสร้างขึ้นด้วยโปรแกรมคอมพิวเตอร์ ดังนั้นจึงต้องมีการทดสอบว่าตัวเลขที่สร้างขึ้นมานั้นมีคุณสมบัติของตัวเลขแบบสุ่มคือ ความสม่ำเสมอและความเป็นอิสระ การทดสอบนี้จะใช้วิธีทดสอบความถี่ (Frequency Test) มาทดสอบความสม่ำเสมอของตัวเลข

การทดสอบความถี่ เป็นการทดสอบว่าตัวเลขที่ได้นั้นมีลักษณะการกระจายเป็นแบบสม่ำเสมอหรือไม่ อาจใช้การทดสอบแบบไคร์สแควร์หรือการทดสอบแบบโคโมโกรอฟ-สเมอร์นอฟ วิธีทดสอบแบบไคร์สแควร์ ค่าสถิติที่ใช้ทดสอบคือ 2 โดยสูตรการคำนวณดังนี้

ดีกรีของความอิสระคือ k-1 Oi = ค่าความถี่ของข้อมูล (Observed Frequency) Ei = ค่าความถี่คาดหมาย (Expected Frequency) ของข้อมูลที่มีการ กระจายแบบสม่ำเสมอ = N/k N = จำนวนข้อมูลทั้งหมด ถ้า ยอมรับว่าข้อมูลมีลักษณะการกระจายแบบสม่ำเสมอ ที่ระดับนัยสำคัญ 

ตัวอย่าง 2.17 จากตัวเลขแบบสุ่มจำนวน 50 ค่า ต่อไปนี้ จงใช้การทดสอบแบบไคร์สแควร์แสดง ให้เห็นว่าชุดตัวเลขแบบสุ่มดังกล่าว มีลักษณะ การกระจายแบบสม่ำเสมอ ที่ระดับนัยสำคัญ 0.01 0.41 0.83 0.10 0.25 0.36 0.55 0.71 0.94 0.79 0.16 0.23 0.12 0.01 0.90 0.92 0.42 0.75 0.01 0.18 0.85 0.25 0.46 0.28 0.51 0.73 0.95 0.24 0.13 0.04 0.39 0.38 0.49 0.58 0.27 0.35 0.68 0.75 0.48 0.98 0.64 0.01 0.19 0.18 0.35 0.37 0.24 0.86 0.74 0.85 0.43

วิธีทำ ช่วงของ ค่าตัวเลข สุ่ม จำนวน ตัวเลขสุ่ม ที่เกิดขึ้น จำนวนที่ ประมาณค่า Oi - Ei (Oi – Ei)2 (Oi – Ei)2/ Ei 0.0-0.09 4 5 -1 1 0.2 0.1-0.19 7 2 0.8 0.2-0.29 0.3-0.39 6 0.4-0.49 0.5-0.59 3 -2 0.6-0.69 -3 9 1.8 0.7-0.79 0.8-0.89 0.9-0.99 รวม 50 5.2

จากตาราง ดังนั้น ยอมรับว่าชุดตัวเลขแบบสุ่มนี้มีลักษณะ การกระจายแบบสม่ำเสมอ

วิธีทดสอบแบบโครโมโกรอฟ-สเมอร์นอฟ ค่าสถิติสำหรับทดสอบคือ D ที่สามารถคำนวณได้ดังนี้ โดยที่ S(x) = ความน่าจะเป็นสะสมของ ข้อมูล (Observed Cumulative Probability) F(x) = ความน่าจะเป็นสะสมของข้อมูล ที่มีลักษณะการกระจายแบบสม่ำเสมอ

จากตาราง โดยที่ n คือจำนวนข้อมูล ถ้า การเปรียบเทียบ เปรียบเทียบค่า D ที่คำนวณได้กับค่า ยอมรับว่าข้อมูลที่ทดสอบมี ลักษณะการกระจายแบบสม่ำเสมอ

กรณีที่นำมาใช้กับการทดสอบลักษณะการกระจาย ของตัวเลขแบบสุ่มนั้น สามารถใช้ขั้นตอนการ ทดสอบและการคำนวณดังนี้ ขั้นที่ 1 นำตัวเลขแบบสุ่มทั้งหมดมาเรียงลำดับ จากน้อยไปหามาก ให้ R( i ) หมายถึงตัวเลข ลำดับที่ i คือ ขั้นที่ 2 คำนวณหาค่า ดังนี้

ขั้นที่ 3 คำนวณค่า ขั้นที่ 4 อ่านค่า จากตาราง ตามค่าระดับนัยสำคัญที่กำหนด ขั้นที่ 5 ถ้า ยอมรับว่าตัวเลขที่นำมาทดสอบนั้นมีลักษณะ การกระจายแบบสม่ำเสมอ

ตัวอย่าง 2.18 จากชุดตัวเลขแบบสุ่ม จำนวน 10 ตัว ตัวอย่าง 2.18 จากชุดตัวเลขแบบสุ่ม จำนวน 10 ตัว ต่อไปนี้ 0.15 0.82 0.47 0.36 0.25 0.97 0.58 0.36 0.13 0.04 จงทดสอบว่าข้อมูลมีลักษณะ การกระจายแบบสม่ำเสมอ ที่ระดับนัยสำคัญ 0.05 ด้วยวิธีโคโมโกรอฟ-สเมอร์นอฟ วิธีทำ จากตัวเลขที่กำหนดให้ นำมาคำนวณหาค่าต่าง ๆ สำหรับหาค่าสถิติ D เพื่อทำการทดสอบดังนี้ R(i) 0.04 0.13 0.15 0.25 0.36 0.36 0.47 0.58 0.82 0.97 i/N 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 (i/N)-R(i) 0.06 0.07 0.15 0.15 0.14 0.24 0.23 0.22 0.08 0.03 R(i)-(i-1)/N 0.04 0.03 - - - - - - 0.02 0.07

D = 0.24 จากตาราง ค่า ดังนั้นสรุปว่า ยอมรับชุดตัวเลขแบบสุ่มนี้ว่ามีลักษณะการกระจายแบบสม่ำเสมอ ภายใต้ระดับนัยสำคัญ 0.05

วิธีทดสอบความเป็นอิสระนั้นมี 4 แบบคือ การทดสอบการเรียงลำดับของตัวเลข (Runs Test) การทดสอบอัตตสหสัมพันธ์ (Autocorrelation Test) การทดสอบช่วงห่าง (Gap Test) การทดสอบแบบโปกเกอร์ (Poker Test)

วิธีทดสอบการเรียงลำดับของตัวเลข เป็นการพิจารณาจากการเรียงลำดับของตัวเลขสุ่มที่ต้องการตรวจสอบ ถ้าตัวเลขแบบสุ่มเป็นอิสระต่อกัน จะได้ลักษณะการเรียงลำดับของตัวเลขนั้นมีความไม่แน่นอน คือไม่มีลักษณะของการเป็นวัฏจักร (cycle) หรือมีแนวโน้มเอียงไปทางด้านใดด้านหนึ่ง

ขั้นที่ 1 กำหนดค่าระดับนัยสำคัญ ขั้นตอนการทดสอบ ขั้นที่ 1 กำหนดค่าระดับนัยสำคัญ ขั้นที่ 2 กำหนดเครื่องหมาย + และ – ให้กับ ข้อมูลตัวเลขแบบสุ่ม ดังนี้ (ก) กรณีที่ไม่อ้างอิงค่าเฉลี่ยของข้อมูล พิจารณาจากค่าของตัวเลขตัวถัดไป ถ้าตัวเลขตัวถัดไปมีค่ามากกว่าตัวเลขตัวนั้น จะกำหนดเครื่องหมายเป็น + ถ้าตัวเลขตัวถัดไปมีค่าน้อยกว่าตัวเลขตัวนั้น กำหนดเครื่องหมายเป็น – สำหรับตัวเลขตัวสุดท้ายจะไม่มีเครื่องหมาย เช่น ค่าของตัวเลข 0.05 0.23 0.14 0.52 0.87 0.14 0.02 0.75 เครื่องหมาย + - + + - - +

ขั้นที่ 3 จากข้อมูลเครื่องหมายที่ได้ในขั้นที่ 2 ให้นับ (ข) กรณีอ้างอิงค่าเฉลี่ยของข้อมูล ถ้าตัวเลขมีค่ามากกว่าค่าเฉลี่ยจะกำหนดเครื่องหมายเป็น + ถ้าตัวเลขมีค่าน้อยกว่าค่าเฉลี่ยจะกำหนดเครื่องหมายเป็น – เช่น กำหนดค่าเฉลี่ยเป็น 0.495 ค่าของตัวเลข 0.05 0.23 0.14 0.52 0.87 0.14 0.02 0.75 เครื่องหมาย - - - + + - - + ขั้นที่ 3 จากข้อมูลเครื่องหมายที่ได้ในขั้นที่ 2 ให้นับ จำนวนรัน (ลำดับเครื่องหมายที่ต่อเนื่องกัน) เช่น + + + - - - - - + + + + - - - + + + - - - - + + - - - + + + + - - + + จะมี 11 รัน

ขั้นที่ 4 จากนั้นทำการนับเครื่องหมายที่ได้ในขั้นที่ 3 โดยนับจำนวนเครื่องหมาย + และ - ซึ่ง n1 = จำนวนเครื่องหมาย – n2 = จำนวนเครื่องหมาย + r = จำนวนรัน ขั้นที่ 5 กรณีที่ n1 และ n2 มีค่าน้อยกว่าหรือ เท่ากับ 15 จะใช้ r เป็นค่าสถิติสำหรับการ ทดสอบ แต่ในกรณีที่ n1 และ n2 มีค่า มากกว่าหรือเท่ากับ 10 อาจประมาณ ลักษณะการกระจายของความน่าจะเป็น แบบสม่ำเสมอ และใช้ค่า Z เป็นค่าสถิติ สำหรับการทดสอบ โดยคำนวณดังนี้

แล้วเปรียบเทียบกับค่า ในตาราง

ตัวอย่าง 2.19 จากชุดตัวเลขในตัวอย่าง 2.17 ตัวอย่าง 2.19 จากชุดตัวเลขในตัวอย่าง 2.17 จงทดสอบว่าตัวเลขเป็นอิสระกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05 โดยใช้วิธีทดสอบ การเรียง ลำดับของตัวเลข วิธีทำ จากชุดตัวเลขสามารถกำหนด เครื่องหมายได้ดังนี้ + - + + + + + - - + - - + + - + - + + - + - + + + - - - + - + + - + + + - + - - + - + + - + - + - จากเครื่องหมาย ค่า n1 = 21 n2 = 28 r = 32

var(r) = 2(21)(28)[2(21)(28)-21-28]/ (21+28)2 (21+28-1) = 1176[1176-21-28]/(59)(59)(58) = 1325352/201898 = 6.564 E(r) = (1176/59)+1 = 20.932 Z = (32-20.932)/2.562 = 4.32 จากตาราง ค่า คือ Z  -1.96 และ Z  1.96 พบว่าค่า Z ที่ได้ไม่อยู่ในขอบเขตที่ยอมรับ ดังนั้นสรุปได้ว่าชุดตัวเลขแบบสุ่มนี้ไม่มีความเป็นอิสระต่อกัน

วิธีทดสอบอัตตสหสัมพันธ์ เป็นการทดสอบความสัมพันธ์กันเองของชุดตัวเลขสุ่ม ตัวเลขสุ่มที่ดีจะต้องมีความเป็นอิสระแก่กัน นั่นคือมีค่าอัตตสหสัมพันธ์เป็น 0 การทดสอบค่านี้จะเป็นการทดสอบหรือพิจารณาตัวเลขเช่น ทุก ๆ ตัวเลขตัวที่ 5 เริ่มจากตัวที่ 5 ต่อไปตัวที่ 10 ตัวที่ 15 และต่อ ๆ ไปนั้นมีแนวโน้มไปในทิศทางเดียวกันหรือไม่

การทดสอบอัตตสหสัมพันธ์จะเป็นการทดสอบ สมมติฐาน H0 : Ha : โดยคำนวณค่าสถิติสำหรับทดสอบดังนี้ คือค่าอัตตสหสัมพันธ์ของเลขตัวที่ i กับ ตัวเลขตัวถัดไปลำดับที่ m

M = เลขจำนวนเต็มที่มากที่สุดที่ทำให้ i+(M+1)m  N N = จำนวนตัวเลขทั้งหมด Ri = ค่าของตัวเลขตัวที่ i เปรียบเทียบค่า Z ที่คำนวณได้กับค่า ในตาราง และถ้าค่า Z อยู่ในช่วงที่กำหนด จะยอมรับความเป็นอิสระของตัวเลขที่ระดับ นัยสำคัญ 

ความหมายของค่า ถ้าค่า > 0 แสดงว่าเกิดความสัมพันธ์ระหว่าง กลุ่มเชิงบวก คือตัวเลขสุ่มเริ่มต้นและตัวเลขสุ่มตัว ที่ m ถัดไปจะมีแนวโน้มของค่าตัวเลขไปในทิศทาง เดียวกัน ในทางตรงข้าม แสดงว่าเกิดความสัมพันธ์ระหว่าง กลุ่มเชิงลบ คือตัวเลขสุ่มเริ่มต้นและตัวเลขสุ่มตัว ที่ m ถัดไปมีแนวโน้มของค่าตัวเลขไปในทิศทาง ตรงกันข้าม ถ้าตัวเลขในกลุ่มไม่มีความสัมพันธ์ กันเองระหว่างตัวเลขสุ่มตัวที่ m ถัดไป จะได้ ค่า = 0

ตัวอย่าง 2.20 จากชุดตัวเลขต่อไปนี้ จง ทดสอบว่าตัวเลขตัวที่ 3, 8, 13,…. มี อัตตสหสัมพันธ์ที่ระดับนัยสำคัญ 0.05 หรือไม่ 0.40 0.84 0.75 0.18 0.13 0.92 0.57 0.77 0.30 0.71 0.49 0.05 0.78 0.74 0.52 0.68 0.03 0.18 0.51 0.72 0.14 0.64 0.82 0.32 0.04 0.25 0.69 0.87 0.54 0.17

วิธีทำ ตำแหน่งเริ่มต้น i=3 นับไปทุก ๆ 5 ตัว m=5 และ n=30 คำนวณหาค่า M จาก 3+(M+1)5  30 5M  30-3-5 M  4.4 ดังนั้น M = 4

ดังนั้นค่าสถิติ Z = 0.1859/0.1280 = 1.452 ค่า ในตาราง คือ Z  -1.96 และ Z  1.96 พบว่าค่าที่คำนวณได้อยู่ในขอบเขตที่กำหนด จึงยอมรับว่าชุดตัวเลขแบบสุ่มนี้มีความเป็นอิสระ ต่อกัน คือมีค่าอัตตสหสัมพันธ์เป็น 0

วิธีทดสอบช่วงห่าง ใช้สำหรับการทดสอบตัวเลขแบบสุ่มที่เป็นตัวเลขโดด ๆ คือเป็นตัวเลขตำแหน่งเดียว โดยเป็นการทดสอบช่วงห่างหรือความถี่ของตัวเลขเดิมที่ปรากฏในชุดของตัวเลขแบบสุ่มที่นำมาทดสอบ เปรียบเทียบกับความถี่ที่คาดว่าตัวเลขจะปรากฏ

การทดสอบนี้จะอาศัยการทดสอบแบบ โคโมโกรอฟ-สเมอร์นอฟซึ่งมีขั้นตอนการทดสอบ ดังนี้ ขั้นที่ 1 หาความถี่ของช่วงห่างของตัวเลข 0, 1, 2,…,9 ที่ปรากฏอยู่ในชุด ตัวเลขแบบสุ่ม แล้วคำนวณหาความ น่าจะเป็นสะสม,S(x) ของช่วงห่าง ขั้นที่ 2 คำนวณค่าความน่าจะเป็นสะสม คาดหมายของช่วงห่างของตัวเลข จากสูตร

ขั้นที่ 3 หาค่าสถิติ D สำหรับทดสอบจาก ขั้นที่ 4 อ่านค่า จากตาราง โดย N คือ จำนวนช่วงห่างทั้งหมด ขั้นที่ 5 ถ้าค่า ยอมรับความเป็นอิสระ ของตัวเลขที่ระดับนัยสำคัญ 

ตัวอย่าง 2.21 จากชุดตัวเลขแบบสุ่มต่อไปนี้ จงทดสอบว่าตัวเลขเหล่านี้มีความเป็นอิสระ ต่อกันที่ระดับนัยสำคัญ 0.05 หรือไม่ โดยใช้การทดสอบช่วงห่าง 4 1 3 5 1 7 2 8 2 0 7 9 1 3 5 2 6 8 9 5 1 4 0 3 2 7 6 2 8 0 1 5 9 5 8 9 7 6 1 4 5 2 8 6 6 3 4 7 5 5 9 0 4 2 8 1 5 4 2 2 7 9 8 2 4 3 1 5 3 8

วิธีทำ จากข้อมูลจำนวนตัวเลขมี 70 ตัว ดังนั้นจำนวนช่วงห่างคือ 60 = N ความถี่ ความน่าจะเป็น S(x) F(x) |S(x)-F(x)| 0-3 9 0.15 0.3439 0.1939 4-7 16 0.27 0.42 0.595 0.175 8-11 20 0.33 0.75 0.7176 0.0324 12-15 0.90 0.8147 0.0853 16-19 2 0.03 0.93 0.8784 0.0516 20-23 4 0.07 1.00 0.9202 0.0798 รวม 60

ดังนั้น D = 0.1939 จากตารางค่า เนื่องจากค่า แสดงว่าตัวเลขแบบสุ่ม ชุดนี้ไม่เป็นอิสระต่อกัน

วิธีทดสอบแบบโปกเกอร์ เป็นการทดสอบความเป็นอิสระของตัวเลขโดยพิจารณาความถี่ หรือจำนวนครั้งของการเกิดตัวเลขซ้ำ เช่น 0.344 0.353 0.258 0.577 0.414 0.688 0.152 ……… จากชุดตัวเลขแบบสุ่ม เลขแต่ละตัวจะประกอบ ด้วยตัวเลข 3 ตัว ดังนั้นมีความเป็นไปได้ของการ เกิดลักษณะตัวเลขซ้ำกันในรูปต่อไปนี้ (1) เลขซ้ำกันทั้ง 3 ตัว (2) ตัวเลขไม่ซ้ำกันเลย (3) เลขซ้ำกัน 2 ตัว

ค่าความน่าจะเป็นของการเกิดลักษณะตัวเลข ข้างต้นนั้น สามารถคำนวณได้ดังนี้ ความน่าจะเป็นของตัวเลขซ้ำกันทั้ง 3 ตัว = P(ตัวเลขตัวที่ 2 เหมือนตัวที่ 1) x P(ตัวเลขตัวที่ 3 เหมือนตัวที่ 1) = (0.1) (0.1) = 0.01 ความน่าจะเป็นของตัวเลขไม่ซ้ำกันเลย = P(ตัวเลขตัวที่ 2 ต่างจากตัวที่ 1) x P(ตัวเลขตัวที่ 3 ต่างจากตัวที่ 1 และ 2) = (0.9) (0.8) = 0.72 ความน่าจะเป็นของตัวเลขซ้ำกัน 2 ตัว = 1-0.72-0.01 =0.27

จากการทดสอบแบบโปกเกอร์ จะใช้ค่าสถิตไคสแควร์ 2 โดยสูตร จะใช้ค่าสถิตไคสแควร์ 2 โดยสูตร โดย k = จำนวนกลุ่มของข้อมูล Oi = ค่าความถี่ของข้อมูล Ei = ค่าความถี่คาดหมายของข้อมูล ที่มีการกระจายแบบสม่ำเสมอ = N/k N = จำนวนข้อมูลทั้งหมด ถ้า ยอมรับว่าชุดตัวเลขที่นำมาทดสอบ นั้นเป็นอิสระต่อกัน ที่ระดับนัยสำคัญ 

ตัวอย่าง 2.22 จากชุดตัวเลขแบบสุ่ม 1000 ตัว ซึ่งแต่ละตัวประกอบด้วยตัวเลข 3 ตัว นับได้ว่า มีตัวเลขซ้ำกันทั้งหมด 42 ตัว ตัวเลขต่างกันทั้ง 3 ตัว 694 ตัว และเป็นคู่กัน 264 ตัว จงทดสอบ ว่าตัวเลขแบบสุ่มชุดนี้เป็นอิสระกันหรือไม่ ที่ระดับ นัยสำคัญ 0.05 โดยใช้การทดสอบแบบโปกเกอร์ วิธีทำ สร้างตารางเพื่อคำนวณค่าต่าง ๆ ดังนี้

ดังนั้น 103.472 > 5.99 จึงแสดงว่าตัวเลขแบบสุ่ม ความเป็นไปได้ จำนวนที่นับได้, Oi จำนวนที่คาดหวัง, Ei (Oi – Ei)2/ Ei ต่างกันทั้ง 3 ตัว 694 1000x0.72=720 0.939 เหมือนกัน 1 คู่ 264 1000x0.27=270 0.133 เหมือนกันทั้ง 3 ตัว 42 1000x0.01=10 102.4 จากตารางค่า ดังนั้น 103.472 > 5.99 จึงแสดงว่าตัวเลขแบบสุ่ม ชุดดังกล่าวไม่เป็นอิสระต่อกัน