งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

การจัดการข้อมูล (Organizing Data)

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "การจัดการข้อมูล (Organizing Data)"— ใบสำเนางานนำเสนอ:

1 การจัดการข้อมูล (Organizing Data)
ข้อมูลที่ได้จากแหล่งต่างๆ ทั้งจากการทดลอง หรือ จากการสำรวจและเก็บรวบรวมข้อมูล มักเป็นข้อมูลที่มีปริมาณมาก หรือ ยังไม่เป็นระเบียบ จึงจำเป็นต้องจัดระเบียบ หรือ จัดหมวดหมู่ข้อมูลนั้นๆ ก่อนนำมาคำนวณค่าทางสถิติ หรือ นำมานำเสนอในรูปต่างๆ เช่น ตาราง กราฟ ฯลฯ ข้อมูลที่ยังมิได้จัดระเบียบนี่ เรียกว่า ข้อมูลดิบ (raw data)

2 ตัวอย่างข้อมูลดิบ ข้อมูลเชิงปริมาณ เช่น ปริมาณคอเลสเตอรอลในน้ำเลือด (mg/dl) ของผู้ป่วย 20 คน

3 ตัวอย่างข้อมูลดิบ ข้อมูลเชิงคุณภาพ เช่น สีของลูกกวาด 21 ตัวอย่าง จากตลาดเจ้าพรหม

4 ข้อมูลจากตัวอย่างทั้งเชิงปริมาณ และ เชิงคุณภาพ ที่ยังมิได้มีการจัดระเบียบ หรือ จัดหมวดหมู่นี้เรียกว่า ข้อมูลไม่แบ่งกลุ่ม (ungroup data) ซึ่งประกอบด้วยสมาชิกใน กลุ่มตัวอย่าง หรือ กลุ่ม ประชากร ที่นำมาแสดงให้ดูเป็นรายตัวของสมาชิก

5 การจัดระเบียบและการนำเสนอข้อมูล
การจัดระเบียบข้อมูล วิธีการที่นิยมใช้ในการจัดระเบียบข้อมูลคือ การแจกแจงความถี่ (frequency distribution)

6 ตัวอย่างการจัดระเบียบข้อมูล
ข้อมูลเชิงปริมาณ เช่น ปริมาณคอเลสเตอรอลในน้ำเลือด (mg/dl) ของผู้ป่วย 20 คน รวม

7 ตัวอย่างการจัดระเบียบข้อมูล
ข้อมูลเชิงคุณภาพ เช่น สีของลูกกวาด 21 ตัวอย่าง จากตลาดเจ้าพรหม รวม

8 ความถี่สัมพัทธ์และร้อยละของความถี่สัมพัทธ์
ความถี่สัมพัทธ์ (relative frequency of category) คือ สัดส่วนของความถี่ตัวแปรตัวหนึ่งๆ ต่อ ความถี่ของตัวแปรทั้งหมด ดังสูตร ความถี่สัมพัทธ์ของตัวแปร = ความถี่ของตัวแปรตัวนั้น ผลรวมของความถี่ของตัวแปรทั้งหมด และ ร้อยละของความถี่สัมพัทธ์ = ความถี่สัมพัทธ์ของตัวแปรตัวนั้น X 100

9 ตัวอย่างตารางความถี่สัมพัทธ์ และร้อยละของความถี่สัมพัทธ์

10 การนำเสนอข้อมูล ในการนำเสนอข้อมูลทั้งเชิงปริมาณและเชิงคุณภาพ หากข้อมูลนั้นได้รับการจัดระเบียบมาเป็นอย่างดีแล้ว เราสามรถนำเสนอข้อมูลได้หลายรูปแบบ เช่น นำเสนอในรูป แผนภูมิแท่ง (bar chart) แผนภูมิวงกลม (pie chart) ดังตัวอย่าง

11 แผนภูมิแท่งแสดงจำนวนลูกกวาดแต่ละสี

12 แผนภูมิวงกลมแสดงจำนวนลูกกวาดแต่ละสี

13 การจัดระเบียบและการนำเสนอข้อมูลเชิงปริมาณ
- ข้อมูลดิบเชิงปริมาณ หรือ เชิงตัวเลขส่วนใหญ่จะอยู่ในรูปของการกระจายอย่างสุ่มหรือไม่มีการเรียงลำดับ การจัดการข้อมูลเชิงปริมาณในขั้นแรก จึงต้องดำเนินการ 1. เรียงลำดับข้อมูล (มากไปหาน้อย หรือ น้อยไปหามาก) 2. จัดกลุ่มข้อมูลของตัวแปรแต่ละประเภท - ช่วงตัวเลขที่จัดเป็นกลุ่มที่มีค่าเรียงลำดับจากน้อยไปหามาก หรือ มากไปหาน้อยนี้ เรียกว่า ชั้น (class) หรือ อันตรภาคชั้น (class interval) จำนวนสมาชิกที่อยู่ภายในแต่ละชั้น เรียกว่า ความถี่ (frequency หรือ f)

14 ตัวอย่าง ตารางแสดงปริมาณ SO2 ที่ปล่อยออกมาจากโรงงานแห่งหนึ่งในเวลา 80 วัน (ปริมาณเป็นตัน) 15.8 26.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2 22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7 26.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7 19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0 18.5 23.0 24.6 20.1 16.2 7.7 13.5 23.5 14.5 14.4 29.6 17.0 20.8 24.3 22.5 18.4 18.1 8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8 25.9 10.5 15.9 27.5 17.9 9.4 24.1 28.5

15 การสร้างตารางแจกแจงความถี่ของปริมาณ SO2
ตัวแปร ปริมาณ (ตัน) ความถี่ 3 10 14 25 17 9 2 รวม 80 ชั้นที่ 3 ขีดจำกัดล่างของชั้นที่ 7 ขีดจำกัดบน ของชั้นที่ 7

16 การแจกแจงความถี่ ค่าน้อยที่สุดในแต่ละชั้น เรียกว่า ขีดจำกัดล่าง (lower limit) ค่ามากที่สุดในแต่ละชั้น เรียกว่า ขีดจำกัดบน (upper limit) ค่าเฉลี่ย ระหว่างขีดจำกัดล่างของชั้นหนึ่งๆ และ ขีดจำกัดบนของชั้นที่อยู่ต่ำกว่าชั้นนั้นหนึ่ง เรียกว่า ขอบล่าง (lower boundary) หรือขีดจำกัดล่างจริง ค่าเฉลี่ย ระหว่างขีดจำกัดบนของชั้นหนึ่งๆ และ ขีดจำกัดล่างของชั้นที่อยู่สูงกว่าชั้นนั้นหนึ่งชั้น เรียกว่า ขอบบน (upper boundary) หรือขีดจำกัดบนจริง ผลต่างระหว่างขอบบนและขอบล่าง เรียกว่า ความกว้างของชั้น(class width) ค่าเฉลี่ยระหว่างขีดจำกัดล่างและขีดจำกัดบนเรียกว่า จุดกึ่งกลางชั้น (class midpoint)

17 จงหาค่า ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น
ปริมาณ SO2 (ตัน) ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น

18 จงหาค่า ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น
ปริมาณ SO2 (ตัน) ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น

19 จงหาค่า ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น
ปริมาณ SO2 (ตัน) ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น 4.0

20 จงหาค่า ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น
ปริมาณ SO2 (ตัน) ขอบของชั้น ความกว้างของชั้น จุดกึ่งกลางของชั้น 4.0 6.95 10.95 14.95 18.95 22.95 26.95 30.95

21 การสร้างตารางแจกแจงความถี่
การสร้างตารางแจกแจงความถี่มี 3 ขั้นตอน คือ หาจำนวนชั้น (number of class) ทำได้ 3 วิธี ได้แก่ 1.1 ใช้สูตรของสเตอร์จ ( Sturge’s formula) c= logn เมื่อ c คือจำนวนชั้น และ n คือจำนวนค่าสังเกต 1.2 หาความกว้างของชั้นโดยประมาณ (approximate of class width) ความกว้างของชั้นโดยประมาณ (I)= ค่าสูงสุด - ค่าต่ำสุด จำนวนชั้น * (ปัดเศษแบบง่ายๆ ไม่ว่าจะเหลือเศษเท่าใดให้ปัดขึ้นอีก 1 เสมอ)

22 การสร้างตารางแจกแจงความถี่ (ต่อ)
1.3 หาขีดจำกัดล่างของชั้นแรก หรือ จุดเริ่มต้น (starting point, L1) จากสูตร L1 = Xmin - (I X c – R) 2 เมื่อ R คือ พิสัย (range) = ค่าสูงสุด (xmax) - ค่าต่ำสุด (xmin) c คือ จำนวนชั้น I คือ ความกว้างของชั้น

23 ตัวอย่าง จงสร้างตารางแจกแจงความถี่ของข้อมูลน้ำหนักของเนื้อลูกวัว (หน่วยเป็นปอนด์) จำนวน 30 ตัว จากข้อมูลต่อไปนี้ 204 205 214 222 198 230 220 215 207 208 228 219 194 192 196 202 212 203 206 210 195 235 216 189

24 วิธีทำ หาจำนวนชั้นจากสูตร c = 1+3.322 log n c = 1+3.322 log 30
หาความกว้างของชั้นโดยประมาณ จากสูตร (I) = ค่าสูงสุด-ค่าต่ำสุด จำนวนชั้น = ( ) 6 = 7.68 ปัดเป็น 8

25 วิธีทำ (ต่อ) 3. หาขีดจำกัดล่างของชั้นแรก จากสูตร L1 = X min - (I x c-R) 2 = 189 – ( 8x6-46) = 188

26 ตารงแจกแจงความถี่ น้ำหนักเนื้อ (ปอนด์) ความถี่ รวม

27 ตารงแจกแจงความถี่ รวม น้ำหนักเนื้อ (ปอนด์) ความถี่ 188-195 196-203
รวม

28 ตารงแจกแจงความถี่ รวม 4 8 5 30 น้ำหนักเนื้อ (ปอนด์) ความถี่ 188-195
8 5 รวม 30

29 ความถี่สัมพัทธ์และร้อยละของความถี่สัมพัทธ์
ความถี่สัมพัทธ์ (relative frequency of category) คือ สัดส่วนของความถี่ตัวแปรตัวหนึ่งๆ ต่อ ความถี่ของตัวแปรทั้งหมด ดังสูตร ความถี่สัมพัทธ์ของตัวแปร = ความถี่ของตัวแปรตัวนั้น ผลรวมของความถี่ของตัวแปรทั้งหมด และ ร้อยละของความถี่สัมพัทธ์ = ความถี่สัมพัทธ์ของตัวแปรตัวนั้น X 100

30 ความถี่สัมพัทธ์และร้อยละของความถี่สัมพัทธ์ ของอันตรภาคชั้น
ความถี่สัมพัทธ์และร้อยละของความถี่สัมพัทธ์ ของอันตรภาคชั้น ความถี่สัมพัทธ์ (relative frequency of category) คือ สัดส่วนของความถี่ตัวแปรตัวหนึ่งๆ ต่อ ความถี่ของตัวแปรทั้งหมด ดังสูตร ความถี่สัมพัทธ์ของตัวแปร = ความถี่ของชั้น หรือ f = f ผลรวมของความถี่ทั้งหมด Σf และ ร้อยละของความถี่สัมพัทธ์ = ความถี่สัมพัทธ์ X 100

31 การนำเสนอข้อมูลเชิงปริมาณ
การนำเสนอข้อมูลทำได้หลายวิธี แต่ ในที่นี้จะกล่าวถึงวิธีที่ นิยมใช้ เป็นส่วนใหญ่ 4 วิธี คือ ฮิสโทแกรม (histogram) รูปหลายเหลี่ยม (polygon) แผนภูมิแบบลงจุด (dotplot) แผนภูมิลำต้นและใบ (stem-and-leaf chart)

32 ฮิสโทแกรม (histogram)
เป็นแผนภูมิแท่งที่บอกถึงความถี่ที่เกิดขึ้นในแต่ละอันตรภาคชั้น โดยแต่ละแท่งจะวางเรียงติดกัน แกนนอนจะกำกับด้วยค่าขอบบนและขอบล่างของชั้นนั้น หรือใช้ค่ากลาง (Midpoint) แกนตั้งเป็นค่าความถี่ในอันตรภาคชั้น ดังนั้นความสูงของแต่ละแท่งจะขึ้นอยู่กับความถี่นั่นเอง

33 ตัวอย่าง ตารางแสดงความสูงของนักศึกษาสาขาวิชาจุลชีววิทยา จำนวน 50 คน
จำนวนนักศึกษา

34 จากตารางนี้ สามารถสร้างฮิสโตแกรมแสดงความสูงของนักศึกษา ได้ดังนี้

35 รูปหลายเหลี่ยม (polygon)

36

37 ถ้าข้อมูลมีจำนวนอันตรภาคชั้นหลายชั้น ฮิสโทแกรมก็จะมีหลายแท่ง และเมื่อต่อจุดระหว่างกึ่งกลางของแท่งฮิสโทแกรม ก็จะได้เส้นโค้งเรียบขึ้น

38 แผนภูมิแบบลงจุด (dot plot)
เป็นการนำเสนอข้อมูลแบบใช้จุดแทนตัวข้อมูล โดยหากค่าที่เก็บข้อมูลได้เป็นค่าเดียวกัน ข้อมูลก็จะถูกเขียนเป็นจุด ซ้อนกันขึ้นไป ดังรูป แผนภูมิแบบลงจุดแสดงอุณหภูมิ ในพื้นที่อำเภอต่างๆ ในประเทศไทยจำนวน 520 อำเภอ ที่มีช่วงอุณหภูมิอยู่ระหว่าง 10 องศาเซลเซียส ถึง 50 องศาเซลเซียส ในวันที่ 24 มีนาคม 2558

39

40 แผนภูมิลำต้นและใบ (stem-and-leaf chart)
ใช้เพื่อจัดข้อมูลเป็นกลุ่มๆ และข้อมูลทุกตัวจะถูกแสดงในแผนภาพ ไม่เพียงแค่นับรวมว่าเป็นความถี่ในอันตรภาคชั้นเดียวกันเหมือนกับฮิสโตแกรม สมมติเรามีข้อมูลส่วนสูง(ซม.)ของนักศึกษาชั้นป.6 จำนวน 20 คน ดังนี้ 150  131  166  136  136  134  144  145  149  140   145  158  157  160  160  143  161  163  147  139

41 แผนภูมิลำต้นและใบ (stem-and-leaf chart) (ต่อ)
จะสามารถนำมาทำแผนภาพต้น-ใบ ได้ดังนี้ 1. เลือกเอาตัวเลขหลักที่ซ้ำมาทำเป็น “ต้น” ในตัวอย่างนี้จะได้สองหลักซ้ายมือ 2. นำเลขที่เหลือ ของข้อมูลแต่ละตัว มาเขียนลงไปในช่อง “ใบ” (เช่น 150 ก็แยก 15 เป็น “ต้น” และ 0 เป็น “ใบ”) 3. ควรเรียงลำดับจากน้อยไปมาก เพื่อให้สะดวกต่อการวิเคราะห์

42 แผนภูมิลำต้นและใบ (stem-and-leaf chart) (ต่อ)
จากแผนภาพต้น-ใบนี้ จะบอกได้คร่าวๆว่าข้อมูลที่มีค่าต่ำที่สุดคือ 131 และสูงสุดคือ 166 ช่วงที่มีความถี่สูงสุดคือ 140 – 149

43 เราต้องการจะเปรียบเทียบชุดข้อมูล 2 กลุ่ม ก็สามารถทำ ได้ ตัวอย่างเช่น
ความสูงของนักศึกษาปี 1 และ นักศึกษาปี 2 เป็นดังนี้ ปี 1        131  166  136  136  134  144  145  149  140     158  157  160  160  143  161  163  147  ปี 2                  163  163  172  157  156  154  165  161  172     148  144  160  175  190  169  155  157  176

44 เขียนเป็นแผนภูมิลำต้นและใบได้ดังนี้
ปี 1 ปี 2 ซึ่งเราจะสามารถวิเคราะห์ข้อมูลทั้ง 2 กลุ่มอย่างคร่าวๆ ได้ว่า 1) นักศึกษาชั้นปี 1 มีความสูงอยู่ในช่วง ซม. ในขณะที่นักศึกษาชั้นปี 2 มีความสูงอยู่ระหว่าง ซม. 2) นักศึกษาคนที่เตี้ยที่สุดอยู่ชั้นปี 2 สูง 131 ซม.ส่วนนักศึกษาที่สูงที่สุดอยู่ชั้นปี 1 สูง 190 ซม. 3) ชั้นปี 1 มีนักศึกษาที่สูงผิดปกติ 1 คน 4) ความสูงเฉลี่ยชั้นปี 1 น่าจะมากกว่าชั้นปี 2

45


ดาวน์โหลด ppt การจัดการข้อมูล (Organizing Data)

งานนำเสนอที่คล้ายกัน


Ads by Google