งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

OLAP Analysis and Design

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "OLAP Analysis and Design"— ใบสำเนางานนำเสนอ:

1 OLAP Analysis and Design

2 คลังข้อมูล (Data Warehouse)
ข้อมูลเพื่อการปฏิบัติงาน - การจะนำข้อมูลจากการปฏิบัติงานไปใช้ต้องผ่านการประมวลผล เช่น การรวม การหาผลเฉลี่ย และ การจัดลำดับ เป็นต้น - สำหรับการออกรายงาน - สำหรับการตรวจสอบการทำงาน หรือการตรวจหารายละเอียดต่างๆ 2. ข้อมูลเพื่อการวิเคราะห์ - สำหรับวางแผนหาแนวโน้ม หรือพยากรณ์ค่าต่างๆ ที่มีผลต่อการดำเนินธุรกิจ - ข้อมูลเพื่อการวิเคราะห์จะถูกนำไปใช้เพื่อการวิเคราะห์แบบ OLAP

3 Dimensional Data Model แบบจำลองข้อมูลเชิงมิติ
Measures หมายถึง ข้อมูลที่ต้องการใช้เพื่อการวัด ทั้งในเชิงปริมาณ (Quantitative) และเชิงคุณภาพ (Qualitative) ของสิ่งใดสิ่งหนึ่ง เช่น ยอดขายรวม กำไร ค่าธรรมเนียม Measure จะเป็นข้อมูลตัวเลขเสมอ

4 Dimensional Data Model แบบจำลองข้อมูลเชิงมิติ
Dimensions (มิติ) หมายถึง ข้อมูลที่เป็นมุมมองให้แก่ Measure เพื่อประโยชน์ในการวิเคราะห์ข้อมูล เช่น จังหวัด อำเภอ วัน ไตรมาส เดือน ปี

5 Dimensional Data Model แบบจำลองข้อมูลเชิงมิติ
Facts Fact หมายถึงชุดของค่าที่เกิดจากการจับคู่กันของ Dimension และ Measure ที่ทำให้เกิดค่าใดค่าหนึ่งที่มีความหมายสามารถวัดค่าได้ และบอกเล่าข้อเท็จจริง อย่างใดอย่างหนึ่ง

6 Association Abstraction
*เพิ่ม Association Abstraction Class ประชาชน 1..1 0..1 มี Class บัตรประชาชน ประชาชน 1 คนสามารถมีบัตรประชาชนได้ 1 ใบ หรือ ไม่มีเลย ในขณะที่บัตรประชาชน 1 ใบเป็นของคน 1 คน

7 Association Abstraction
*เพิ่ม Association Abstraction Class แม่ 1..1 เป็นแม่ของ 0..m Class ลูก แม่ 1 คนสามารถมีลูกได้มากกว่า 1 คน หรือไม่มีเลย ในขณะที่ ลูก1 คน ต้องเกิดจากแม่เพียงคนเดียวเท่านั้น

8 Association Abstraction
*เพิ่ม Association Abstraction Class นักเรียน 1..m เรียน 1..m Class วิชาเรียน 0..m สอน Class อาจารย์ 1..1 นักเรียนหนึ่งคนจะต้องเรียนอย่างน้อย 1 วิชาหรือมากกว่า ในขณะที่วิชาเรียนหนึ่งๆจะต้องมีนักเรียนอย่างน้อย 1 คน หรือมากกว่าเช่นกัน อาจารย์ หนึ่งคนสามารถสอนได้หลายวิชา หรืออาจไม่มีวิชาสอน แต่วิชาหนึ่งนั้นจะต้องมีอาจารย์สอนเพียงคนเดียว

9 วันที่ ร้านค้า ประเภทสินค้า ยอดขาย (บาท)
ตัวอย่าง ของ Measure Dimension และ Fact Dimension Measure วันที่ ร้านค้า ประเภทสินค้า ยอดขาย (บาท) 12/06/2551 ร้านค้า A ของเด็กเล่น 15000 13/06/2551 สินค้าบริโภค 28000 ร้านค้า B 12000 Fact ชุดที่ 1 Fact ชุดที่ 2 Fact ชุดที่ 3 เราจะเรียกผลลัพธ์ที่อยู่ในรูปตารางที่เกิดจาก Dimensional Data Model ในลักษณะนี้ว่า Fact Table

10 ค่าที่เป็นไปได้ (Possible Values)
ตัวอย่าง ผู้บริหารต้องการที่จะวิเคราะห์ ยอดขายตาม เวลา และประเภทสินค้า นั่นคือ ผู้บริหารต้องการดูยอดขายสินค้า (Measure) ตามเวลา (Dimension 1) และ ประเภทสินค้า (Dimension 2) ประเภท ชื่อ ค่าที่เป็นไปได้ (Possible Values) Measure ยอดขาย จำนวนจริงใดๆ Dimension 1 ประเภทสินค้า สินค้าบริโภค สินค้าควบคุม และอื่นๆ Dimension 2 วันที่ 4 กันยายน 2551 และอื่นๆ ตัวอย่าง ของตารางที่แสดงความสัมพันธ์ระหว่าง Measure และ Dimension ที่จะเกิดขึ้นใน Fact Table

11 ค่าที่เป็นไปได้ (Possible Values)
Dimensions ชุดหนึ่งๆ อาจสามารถใช้กำหนด Measure ได้หลายๆ ตัวก็ได้ ประเภท ชื่อ ค่าที่เป็นไปได้ (Possible Values) Measure 1 ยอดขาย จำนวนจริงใดๆ Measure 2 จำนวนสินค้าที่ขายได้ จำนวนเต็มใดๆ Dimension 1 ประเภทสินค้า สินค้าบริโภค สินค้าควบคุม และอื่นๆ Dimension 2 วันที่ 4 กันยายน 2551 และอื่นๆ ตัวอย่าง ของตารางที่แสดงความสัมพันธ์ระหว่าง Measure และ Dimension ที่จะเกิดขึ้นใน Fact Table

12 Star Schema Star Schema หมายถึง Dimensional Data Model ที่มี Fact Table ขนาดใหญ่เพียงหนึ่งเดียวอยู่ตรงกลาง และมี Dimension Table จำนวนหนึ่งอยู่รายรอบเพื่อกำหนดมุมมองที่จะมีต่อ Measure ใน Fact Table นั้น โดยจำนวนมุมมองที่มองได้จะเท่ากับจำนวนของ Dimension Table ที่รายรอบอยู่ และเท่ากับจำนวน Dimension ที่เชื่อมต่อโดยตรงกับ Fact Table Fact Table คือ Sales Dimension Table คือ Date, Shop, Product

13 Star Schema ให้นำทุก Primary Key จาก Dimension Table มาใส่ใน Fact Table ความสัมพันธ์ระหว่าง Dimension กับ Fact Table มักเป็น 1 to many ซึ่ง 1 อยู่ฝั่ง Dimension ส่วน many อยู่ฝั่ง Fact Table Measure มักเป็นตัวเลขที่คำนวณ และ นับได้ Attribute ที่อยู่ใน ตาราง Dimension ส่วนใหญ่เป็นตัวอักษร(Varchar) หรือตัวเลขที่ไม่สามารถคำนวณได้ เช่น วันที่ เวลา รหัสสินค้า

14 *แก้ไข วันที่แต่ละวันจะเป็นมิติ ของการขาย หรือไม่เป็นมิติก็ได้ (ถ้าวันที่นั้นไม่มีการขาย) ในขณะที่ การขายจะเป็นของมิติวันที่แต่ละวัน สินค้าแต่ละตัวจะเป็นมิติ ของการขาย หรือ บางตัวไม่เป็นมิติก็ได้ (ถ้าสินค้านั้นไม่ได้ขาย) ในขณะที่การขาย จะมองเป็นของมิติสินค้าใดๆ สินค้าหนึ่ง E-R Diagram ที่แสดง Fact Table, Measure และ Dimension ที่มีความสัมพันธ์กันแบบ Star Schema Fact Table คือ Sales Dimension Table คือ Date, Shop, Product

15 ตัวอย่างข้อมูลใน Star Schema
Dimension: Shop Dimension: Product Shop Id Shop Name 001 เจริญใจ 002 JJ Service 003 คุ้มค่า Product Id Product Name 112 BISCUIT 113 ICE CREAM 114 CAKE Fact: Sales Dimension: Date Shop Id Product Id Date Id Sales Amount 001 112 2130 800 113 2156 900 002 700 003 114 600 Date Id Date Month Year 2130 10/Jan/2001 2165 11/Jan/2001 2174 12/Jan/2001 ตัวอย่างข้อมูลใน Star Schema

16 Snowflake Schema Snowflake Schema หมายถึง Dimensional Data Model ที่มี Fact Table ขนาดใหญ่เพียงหนึ่งเดียวอยู่ตรงกลาง และมี Dimension Table จำนวนหนึ่งอยู่รายรอบเพื่อกำหนดมุมมองที่จะมีต่อ Measure ใน Fact Table นั้น โดยจำนวนมุมมองที่มองได้จะเท่ากับจำนวนของ Dimension Table ที่รายรอบอยู่ แต่จะมากกว่าจำนวน Dimension ที่เชื่อมต่อโดยตรงกับ Fact Table และ Dimension ที่ไม่ได้เชื่อมต่อโดยตรงกับ Fact Table จะมีความสัมพันธ์กับ Dimension ตัวอื่นๆ Fact Table คือ Sales Dimension Table คือ Date, Shop, Product, Region, Product type

17 Snowflake Schema Snowflake Schema
โดยจำนวนมุมมองที่มองได้จะเท่ากับจำนวนของ Dimension Table ที่รายรอบอยู่ คือ Date, Shop, Product, Region, Product type จำนวน Dimension ที่เชื่อมต่อโดยตรงกับ Fact Table คือ Date, Shop, Product

18 Snowflake Schema ให้นำทุก Primary Key จาก Dimension Table ที่เชื่อมต่อโดยตรงกับตาราง Fact Table มาใส่ไว้ที่ Fact Table ส่วน Fk จาก Dimension Table ที่เชื่อมต่อโดยตรงกับตาราง Fact Table นั้นไม่ต้องนำมาใส่ไว้ที่ Fact Table (***) 2. อาจมี Dimension Table บางตารางที่ไม่ได้เชื่อมต่อโดยตรงกับตาราง Fact Table ความสัมพันธ์ระหว่าง Dimension กับ Fact Table มักเป็น 1 to many ซึ่ง 1 อยู่ฝั่ง Dimension ส่วน many อยู่ฝั่ง Fact Table Measure มักเป็นตัวเลขที่คำนวณ และ นับได้ Attribute ที่อยู่ใน ตาราง Dimension ส่วนใหญ่เป็นตัวอักษร(Varchar)หรือตัวเลขที่ไม่สามารถคำนวณได้ เช่น วันที่ เวลา รหัสสินค้า

19 E-R Diagram ที่แสดง Fact Table, Measure และ Dimension ที่มีความสัมพันธ์กันแบบ Snowflakes Schema
Fact Table คือ Sales Dimension Table คือ Date, Shop, Product, Region, Product type

20 Dimension: Shop Fact: Sales Dimension: Date Dimension: Product
Dimension: Region Shop Id Region Id Shop Name 001 11 เจริญใจ 002 22 JJ Service 003 คุ้มค่า Region Id Region Name 11 Maeka Phayao 22 Muang Phayao Fact: Sales Dimension: Date Shop Id Product Id Date Id Sales Amount 001 112 2130 800 113 2156 900 002 700 003 114 600 Date Id Date Month Year 2130 10/Jan/2001 2165 11/Jan/2001 2174 12/Jan/2001 Dimension: Product Dimension: Product Type Product Id Product Type Id Product Name 112 1 BISCUIT 113 2 ICE CREAM 114 CAKE Product Type Id Product Type Name 1 Snack 2 Ice Cream ตัวอย่างข้อมูลใน Snowflake Schema

21 OLAP และ Cubes OLAP (Online Analytical Processing)
หมายถึงวิธีการ ที่ใช้ในการวิเคราะห์ข้อมูลด้วย Dimension และ Fact Table โดย Fact Table และ Dimention Table จะถูกประมวลผลให้พร้อมสำหรับการนำไปใช้งาน โดยการประมวลผลอยู่ในรูปของลูกบาศก์ ที่มีหลายมิติ โดยภายในบรรจุข้อมูลที่มีประโยชน์ต่อการวิเคราะห์ข้อมูลที่อยู่ภายในนั้น โดยมีจำนวนมิติเท่ากับจำนวนของ Dimention เราเรียกรูปทรงนี้ว่า Cube

22 2-dimension Cube 2nd Dimension 1st Dimension

23 3 - dimension Cube 2nd Dimension 3rd Dimension 1st Dimension

24 4- dimension Cube 4th Dimension 2nd Dimension 3rd Dimension
1st Dimension

25 ตัวอย่าง Cube ที่เกิดจาก Star Schema
800 112 600 900 700 Product Id 113 2130 114 Date Id 2156 001 002 003 Shop Id สินค้าที่มีรหัส 113 ขายได้ = 1600 ตัวอย่าง Cube ที่เกิดจาก Star Schema

26 ตัวอย่าง Cube ที่เกิดจาก Snowflake Schema
Product Type Product Id 800 1 112 600 900 700 2 113 2130 1 114 Date Id 2156 Shop Id 001 002 003 11 22 22 Region Id สินค้าที่มีรหัส 113 ขายได้ = 1600 ตัวอย่าง Cube ที่เกิดจาก Snowflake Schema

27 OLAP : การดำเนินการกับ OLAP
Roll up และ Drill Down Roll up เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากส่วนของรายละเอียดมาก จนมาเป็นข้อมูลสรุป Drill Down เป็นกระบวนการเปลี่ยนแปลงระดับความละเอียดของการพิจารณาข้อมูล จากข้อมูลสรุป จนมาเป็นข้อมูลในส่วนรายละเอียด Slice and Dice Slice เป็นการเลือกพิจารณาผลลัพธ์บางส่วนที่เราสนใจ โดยการเลือกเฉพาะค่าที่ถูกกำกับด้วยข้อมูลบางค่าของแต่ละมิติ Dice เป็นกระบวนการพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

28 การดำเนินการกับ OLAP : Roll up และ Drill Down (1/2)
Region Sum North 61,000 South 41,500 Region Roll up Drill Down Product Type Glossary Misc. Region North 55,000 6,000 South 31,000 10,500 Region-Product Type Roll up Drill Down Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type

29 การดำเนินการกับ OLAP : Roll up และ Drill Down (2/2)
Product Type Glossary Misc. Region Shop North ABC 30,000 Platter 25,000 6,000 South Five Mart 31,000 10,500 Region-Shop-Product Type Roll up Drill Down Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Region-Shop-Product Type-Product Type

30 การดำเนินการกับ OLAP : Slice (1/2)
10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Source Cube Fish Meat Pork Med. Pencil Glossary Misc. 10,000 8,000 23,000 25,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Glossary 10,000 8,000 23,000 500 25,000 6,000 20,000 ABC Platter Five Mart North South Slice Fish Meat Pork Med. Pencil Glossary Misc. แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณา เฉพาะกลุ่มสินค้าประเภท “Glossary”

31 การดำเนินการกับ OLAP : Slice (2/2)
Product Type Glossary Misc. Product Fish Meat Pork Medicine Pencil Region Shop North ABC 10,000 20,000 Platter 25,000 6,000 South Five Mart 8,000 23,000 500 Slice:Glossary Product Type Glossary Product Fish Meat Pork Region Shop North ABC 10,000 20,000 Platter 25,000 South Five Mart 8,000 23,000 แสดงตัวอย่างการ Slice ข้อมูลเพื่อพิจารณาเฉพาะกลุ่มสินค้าประเภท “Glossary”

32 การดำเนินการกับ OLAP : Dice (1/2)
Shop Product Type Date Product Type Shop Date การพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

33 การดำเนินการกับ OLAP : Dice (2/2)
Product Type Glossary Misc. Shop ABC 30,000 Platter 25,000 6,000 Five Mart 31,000 10,500 Shop-Product Type Product Type Glossary Misc. Date 6/07/2004 43,000 10,000 7/07/2004 6,500 Date-Product Type การพลิกแกนหรือมิติข้อมูล ให้มุมมองที่ต่างออกไป

34 Example: Star Schema Source: Connelly & Begg (2001), Database Systems: A Practical Approach to Design, Implementation, and Management (3rd Edition), Addison Wesley

35 Example: Snowflake Schema
4 Measures = OfferPrice, SellingPrice, SaleCommission, SaleRevenue ไม่นำ CityID, Province ไปใส่ใน Fact Table Source: Connelly & Begg (2001), Database Systems: A Practical Approach to Design, Implementation, and Management (3rd Edition), Addison Wesley

36 Constellation Schema A Constellation Schema contains more than one fact table sharing one or more dimension tables Multiple fact tables and dimension tables form ‘constellation’ of facts

37 Example: Constellation Schema
Source: Connelly & Begg (2001), Database Systems: A Practical Approach to Design, Implementation, and Management (3rd Edition), Addison Wesley

38 Fact constellation schema architecture
For each star schema or snowflake schema it is possible to construct a fact constellation schema. This schema is more complex than star or snowflake architecture, which is because it contains multiple fact tables. This allows dimension tables to be shared among many fact tables. That solution is very flexible, however it may be hard to manage and support.

39 หนังสืออ้างอิง การออกแบบและพัฒนาคลังข้อมูล, กิตติพงศ์ กลมกล่อม เทอม 1 ปีการศึกษา 2562


ดาวน์โหลด ppt OLAP Analysis and Design

งานนำเสนอที่คล้ายกัน


Ads by Google