งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

งานนำเสนอกำลังจะดาวน์โหลด โปรดรอ

Chapter 3 :OLAP โดย อ.เธียรชัย พัฒนศิริเวทิน. Outline ที่มาของแนวคิด OLAP ที่มาของแนวคิด OLAP หลักการวิเคราะห์ข้อมูล หลักการวิเคราะห์ข้อมูล ความหมายของแบบจำลองหลายมิติ

งานนำเสนอที่คล้ายกัน


งานนำเสนอเรื่อง: "Chapter 3 :OLAP โดย อ.เธียรชัย พัฒนศิริเวทิน. Outline ที่มาของแนวคิด OLAP ที่มาของแนวคิด OLAP หลักการวิเคราะห์ข้อมูล หลักการวิเคราะห์ข้อมูล ความหมายของแบบจำลองหลายมิติ"— ใบสำเนางานนำเสนอ:

1 Chapter 3 :OLAP โดย อ.เธียรชัย พัฒนศิริเวทิน

2 Outline ที่มาของแนวคิด OLAP ที่มาของแนวคิด OLAP หลักการวิเคราะห์ข้อมูล หลักการวิเคราะห์ข้อมูล ความหมายของแบบจำลองหลายมิติ Multidimensional ความหมายของแบบจำลองหลายมิติ Multidimensional องค์ประกอบของ Multi Dimensional Model องค์ประกอบของ Multi Dimensional Model ความสามารถแบบจำลอง Multi dimensional(OLAP Operation) ความสามารถแบบจำลอง Multi dimensional(OLAP Operation) แบบจำลองข้อมูลที่ใช้ใน OLAP ( Multidimensional Schema Model ) แบบจำลองข้อมูลที่ใช้ใน OLAP ( Multidimensional Schema Model ) การจัดเก็บของ Multidimensional การจัดเก็บของ Multidimensional

3 ที่มาของแนวคิด OLAP เนื่องจากความต้องการ ระบบ DSS ที่ใช้ในกระบวนการ วิเคราะห์ที่รวดเร็ว ถูกต้องและแม่นยำ เนื่องจากความต้องการ ระบบ DSS ที่ใช้ในกระบวนการ วิเคราะห์ที่รวดเร็ว ถูกต้องและแม่นยำ แนวคิด OLAP (Online Analytical Processing) ที่ เขียนโดย ดร. EF Codd ในปี 1994 จึงได้รับความ สนใจอย่างมาก แนวคิด OLAP (Online Analytical Processing) ที่ เขียนโดย ดร. EF Codd ในปี 1994 จึงได้รับความ สนใจอย่างมาก และได้ถูกนำไปเป็นส่วนหนี่งของระบบ DSS, BI รวมถึง EIS (Executive Information System) และได้ถูกนำไปเป็นส่วนหนี่งของระบบ DSS, BI รวมถึง EIS (Executive Information System) ปัจจุบันมีเครื่องมือ DBMS หลายค่ายสนับสนุนแนวคิด ของ OLAP เช่น Oracle Express, Microsoft SQL Data Analysis, Informix MetaCube, Hyperion Essbase และอื่นๆ ปัจจุบันมีเครื่องมือ DBMS หลายค่ายสนับสนุนแนวคิด ของ OLAP เช่น Oracle Express, Microsoft SQL Data Analysis, Informix MetaCube, Hyperion Essbase และอื่นๆ

4 Nature of OLAP Analysis ( หลักการวิเคราะห์ข้อมูล ) Aggregation -- (total sales, percent-to- total) Aggregation -- (total sales, percent-to- total) Comparison -- Budget vs. Expenses Comparison -- Budget vs. Expenses Ranking -- Top 10, quartile analysis Ranking -- Top 10, quartile analysis Access to detailed and aggregate data ( ดูรายละเอียด และ สรุป ) Access to detailed and aggregate data ( ดูรายละเอียด และ สรุป ) Complex criteria specification Complex criteria specification Visualization Visualization Need interactive response to aggregate queries Need interactive response to aggregate queries

5 OLAP: 3 Tier DSS Data Warehouse Database Layer Store atomic data in industry standard Data Warehouse. OLAP Engine Application Logic Layer Generate SQL execution plans in the OLAP engine to obtain OLAP functionality. Decision Support Client Presentation Layer Obtain multi- dimensional reports from the DSS Client.

6 Data Warehouse Environment จะไม่มีการ normalized คือทำตามวิธี relational model แต่ทำการ denormalized จะไม่มีการ normalized คือทำตามวิธี relational model แต่ทำการ denormalized ผลของการออกแบบจะเป็นฐานข้อมูลซึ่งง่ายต่อการเข้าใจ ผลของการออกแบบจะเป็นฐานข้อมูลซึ่งง่ายต่อการเข้าใจ จะเก็บข้อมูลที่ระดับต่ำสุดของ transactional detail หรือ หลาย ๆ ระดับของบทสรุปข้อมูล จะเก็บข้อมูลที่ระดับต่ำสุดของ transactional detail หรือ หลาย ๆ ระดับของบทสรุปข้อมูล ลดจำนวนของ join table ใน queries ลดจำนวนของ join table ใน queries มีความยืดหยุ่นมากกว่า OLTP environment มีความยืดหยุ่นมากกว่า OLTP environment Multidimensional model ง่ายต่อการทำให้ข้อมูล สามารถเข้ากันได้ถ้าการออกแบบเปลี่ยนไป Multidimensional model ง่ายต่อการทำให้ข้อมูล สามารถเข้ากันได้ถ้าการออกแบบเปลี่ยนไป

7 Denormalization เป็นกระบวนการรวมข้อมูลที่อยู่ในต่างตารางเข้าในตาราง เดียวตามความเหมาะสมเพื่อเป็นการเพิ่มประสิทธิภาพของ ระบบ เป็นกระบวนการรวมข้อมูลที่อยู่ในต่างตารางเข้าในตาราง เดียวตามความเหมาะสมเพื่อเป็นการเพิ่มประสิทธิภาพของ ระบบ วัตถุประสงค์ของการทำ Denormalization วัตถุประสงค์ของการทำ Denormalization เพื่อลดกระบวนการรวมกันของข้อมูล เมื่อมีการใช้คำสั่ง query เพื่อลดกระบวนการรวมกันของข้อมูล เมื่อมีการใช้คำสั่ง query เพื่อให้โครงสร้างฐานข้อมูลใกล้เคียงกับโมเดลของ องค์กร โครงสร้างของข้อมูลควรเป็นไปในทางเดียวกัย คำตอบที่ผู้ใช้ต้องการ เพื่อให้โครงสร้างฐานข้อมูลใกล้เคียงกับโมเดลของ องค์กร โครงสร้างของข้อมูลควรเป็นไปในทางเดียวกัย คำตอบที่ผู้ใช้ต้องการ

8 แบบจำลองหลายมิติ Multi Dimensional Model คือ แบบจำลองที่ได้รับการออกแบบให้มีโครงสร้างเหมือนกับ องค์กรที่กำลังพิจารณาโดยข้อมูลเหลานั้นมีความสัมพันธ์กันใน แต่ละมิติ เพื่อให้ผู้ใช้งายต่อการสืบค้นและดึงข้อมูลได้อย่างมี ประสิทธิภาพ คือ แบบจำลองที่ได้รับการออกแบบให้มีโครงสร้างเหมือนกับ องค์กรที่กำลังพิจารณาโดยข้อมูลเหลานั้นมีความสัมพันธ์กันใน แต่ละมิติ เพื่อให้ผู้ใช้งายต่อการสืบค้นและดึงข้อมูลได้อย่างมี ประสิทธิภาพ ฐานข้อมูลหลายมิติ (Multi Dimensional Database) หมายถึง ซอฟท์แวร์คอมพิวเตอร์ซึ่งได้รับการออกแบบเพื่อให้ง่าย ต่อการจัดเก็บและดึงข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ ฐานข้อมูลหลายมิติ (Multi Dimensional Database) หมายถึง ซอฟท์แวร์คอมพิวเตอร์ซึ่งได้รับการออกแบบเพื่อให้ง่าย ต่อการจัดเก็บและดึงข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ ลักษณะข้อมูลที่เก็บจะต้อง ลักษณะข้อมูลที่เก็บจะต้อง 1. มีความสัมพันธ์กัน 2. ข้อมูลเหล่านั้นถูกเก็บและได้รับการวิเคราะห์จากมุมมองที่ แตกต่างกัน หรือที่เรียกว่า มิติ

9 องค์ประกอบของ Multi Dimensional Model ส่วนประกอบรายละเอียด Fact table เป็นตารางศูนย์กลางที่ใช้ใน data warehouse และ data mart ที่จะเก็บจำนวน measures และ รายละเอียดสำคัญในเชิงธุรกิจ Fact คือ row ในตาราง โดย fact จะเก็บค่าตัวเลขที่ใช้ วัดเหตุการณ์ที่เกิดขึ้นกับ data Measure คือ ปริมาณ, จำนวน column ใน fact table โดย measure จะแสดงให้เห็นถึงค่าที่ถูกวิเคราะห์แล้ว Dimension คือ เอกลักษณ์ทางธุรกิจเป็นลักษณะทาง กายภาพ Dimension table เป็นตารางใน data warehouse หรือ data mart ที่อธิบายข้อมูลใน fact table

10

11 ตารางองค์ประกอบสำคัญ  Fact Table เป็น ตารางหลัก ซึ่งมีลักษณะคล้านกับตารางประเภท Transaction ของ OLTP (ตาราง ที่มีการเกิดทรานแซคชั่น INSERT, DELETE, UPDATE เสมอๆ) โดยส่วนใหญ่แล้วจะ มีขนาด 80% ของข้อมูลทั้งหมด โดยภายในจะประกอบด้วยคอลัมน์ที่สำคัญ 2 ประเภท คือ Fact Table Key เป็นคอลัมน์ที่ใช้เชื่อมโยงไปยัง Dimension Table ต่างๆ ดังนั้นจำนวนคอลัมน์ของ Fact Table Key จะเพิ่มขึ้นตามจำนวนของ Dimension Table อีกทั้งคอลัมน์ทั้งหมดนี้ยังสามารถนำไปใช้สร้างให้เป็น Primary Key ของตาราง ได้อีกด้วยMeasure เป็นคอลัมน์ที่เป็นข้อมูลตัวเลข ทำหน้าที่เก็บจำนวน หรือปริมาณที่ เกิดขึ้นของแต่ละทรานแซคชั่น นอกจากนี้ยังเก็บผลลัพธ์ที่ได้จากการคำนวณด้วย  Dimension key เป็น foreign keys ที่เก็บไว้ใน fact table และdimension key จะ map กับ primary key ใน dimension table  Dimension Tables เป็น ตารางแกนต่างๆ ซึ่งมีลักษณะคล้ายกับตารางประเภท Mater ของ OLTP (ตารางข้อมูลที่เก็บการอธิบาย Entity ต่างๆ) โดยประกอบด้วยคอลัมน์ที่เป็น Key เพื่อเชื่อมโยงไป Fact Table Key และคอลัมน์ที่ให้ความหมายเพิ่มเติมแก่ Entity สามารถนำไปสร้างเป็น Dimension ของ OLAP Cube ตามลักษณะ ต่างๆ ดังต่อไปนี้ Standard Dimension มาจาก Dimension Table ปกติ ซึ่งแต่ ละคอลัมน์อธิบายข้อมูล Entity นั้นๆ เพียงอย่างเดียว

12 ลักษณะการจัดเก็บข้อมูล จัดเก็บในลักษณะ Array หลายมิติ โดยเรียกแต่ละ จัดเก็บในลักษณะ Array หลายมิติ โดยเรียกแต่ละ แกนว่า มิติ (Dimension) สมาชิกภายในมิติเรียกว่า Position และเรียกส่วนตัดของ Position ในแต่ละมิติว่า Cell โดยเรียกข้อมูลแต่ละเซลล์ว่า measure Cell Dimension Y Dimension x Dimension Z

13 Hierarchical summarization paths Industry Region Year Category Country Quarter Product City Month Week Office Day Product Region Month Dimensions: Product, Location, Time Measure:Sales_volume(product, month, region) Dimensions Browsing

14 all EuropeNorth_America MexicoCanadaSpainGermany Vancouver M. WindL. Chan... all region office country TorontoFrankfurtcity A Concept Hierarchy: Dimension (location)

15 ความสามารถแบบจำลอง Multi dimensional OLAP Operations 1.Rotating – ความสามารถในการหมุน CUBE เพื่อให้ได้มา ซึ่งสารสนเทศในแง่มุมต่างๆ

16 ความสามารถแบบจำลอง Multi dimensional OLAP Operations 2. Slicing – การหั่น cube เพื่อให้ได้สารสนเทศที่ต้องการ Dice- เลือกพิจารณา...พลิก Dimension... ให้ตรงตามความ ต้องการของผู้ใช้ Date Product Country sum TV VCR PC 1Qtr 2Qtr 3Qtr 4Qtr U.S.A Canada Mexico sum

17 day 2 day 1 * sale(*,p2,*) Slicing Fact table view:

18 Dice- พลิก Dimension city, product, date city, productcity, dateproduct, date cityproductdate all day 2 day 1 use greedy algorithm to decide what to materialize

19 ความสามารถแบบจำลอง Multi dimensional OLAP Operations 3.Consolidation – กระบวนการนำข้อมูลเข้าสู่แบบจำลองมิติค่า ของ measure จะถูกโหลดเข้าสู่แบบจำลองมิติที่สัมพันธ์กับ ข้อมูล และทำการสรุปข้อมูลตามลำดับชั้น 4.Measure หน่วยวัดเป็นตัวเลขที่บ่งชี้ถึงประสิทธิภาพของ องค์กรมี 2 ประเภท Measure ที่เกิดจากค่าที่เก็บใน field ของตาราง Relation Measure ที่เกิดจากค่าที่เก็บใน field ของตาราง Relation Measure ที่เกิดผลจากการทำ Operation Measure ที่เกิดผลจากการทำ Operation

20 Browsing a Data Cube Visualization Visualization OLAP capabilities OLAP capabilities Interactive manipulation Interactive manipulation

21 ความสามารถแบบจำลอง Multi dimensional OLAP Operations 5.Hierarchies, Roll-Up & Drill-Downs การแสดง ความสัมพันธ์ลักษณะลำดับชั้น Roll-Up -> การไปสู่ระดับชั้นที่สูงกว่า (Summarized) Drill-Downs ->การไปสู่ระดับชั้นที่ต่ำกว่า (Detail Data)

22 Fact Table

23 แสดงการ Roll Up and Drill Down

24 Multidimensional Schema Model Star Schema Star Schema Outboard Tables Outboard Tables Multiple Fact Tables Multiple Fact Tables

25 Star Schema ลักษณะของ star schema ลักษณะของ star schema จะมีลักษณะที่มี fact table อยู่ตรงกลางล้อมรอบด้วย หลาย ๆ dimension table ที่เก็บรายละเอียดของ fact ที่ไม่ใช่ normalized center ประโยชน์ของการใช้ star schema ประโยชน์ของการใช้ star schema สามารถวิเคราะห์ได้จำนวนมาก สามารถวิเคราะห์ได้จำนวนมาก มีประสิทธิภาพใน query สูง มีประสิทธิภาพใน query สูง

26 ตัวอย่าง Star Schema

27 Outboard Tables หรือ Snowflake Schema ตารางคุณลักษณะนี้มี Primary Key ที่เป็น column ที่ เป็น Key ต่างๆในตารางคุณลักษณะอื่นๆ จึงเรียกว่า เป็นตารางรอบนอก (Outbound) หรือ อาจเรียกว่า Snowflake Schema ตารางคุณลักษณะนี้มี Primary Key ที่เป็น column ที่ เป็น Key ต่างๆในตารางคุณลักษณะอื่นๆ จึงเรียกว่า เป็นตารางรอบนอก (Outbound) หรือ อาจเรียกว่า Snowflake Schema ลักษณะของ Snowflake schema ลักษณะของ Snowflake schema มีหลาย ๆ ตาราง มีหลาย ๆ ตาราง มี primary dimension table เดียวที่สามารถ join กับ fact table มี primary dimension table เดียวที่สามารถ join กับ fact table มี secondary dimension table ที่ join กับ มี secondary dimension table ที่ join กับ - Primary dimension table - Primary dimension table - Secondary dimension table เดียวกันที่อยู่ในระดับที่สูงกว่า - Secondary dimension table เดียวกันที่อยู่ในระดับที่สูงกว่า Primary dimension table มีขนาดเล็กกว่าของ star schema Primary dimension table มีขนาดเล็กกว่าของ star schema

28 Example of Snowflake Schema time_key day day_of_the_week month quarter year time location_key street city_key location Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales Measures item_key item_name brand type supplier_key item branch_key branch_name branch_type branch supplier_key supplier_type supplier city_key city province_or_street country city smaller dimension tables

29 Multiple Fact Tables ประกอบด้วย Fact Table หลายตาราง ซึ่งเกิดจาก Fact ที่ ไม่เกี่ยวข้องกันหรือบางครั้งต้องการเพิ่มประสิทธิภาพการ สืบค้น ประกอบด้วย Fact Table หลายตาราง ซึ่งเกิดจาก Fact ที่ ไม่เกี่ยวข้องกันหรือบางครั้งต้องการเพิ่มประสิทธิภาพการ สืบค้น โดยแบ่งตารางที่มีข้อมูลจำนวนมากอกเป็นตารางย่อยตาม ช่วงเวลา เช่น ตารางเก็บข้อมูลสรุปการขายรายวัน ราย เดือน รายปี หรือ ข้อเท็จจริงของข้อมูลการขายในปีก่อน หน้าและปีปัจจุบัน โดยแบ่งตารางที่มีข้อมูลจำนวนมากอกเป็นตารางย่อยตาม ช่วงเวลา เช่น ตารางเก็บข้อมูลสรุปการขายรายวัน ราย เดือน รายปี หรือ ข้อเท็จจริงของข้อมูลการขายในปีก่อน หน้าและปีปัจจุบัน

30 Example of Multiple Fact Tables time_key day day_of_the_week month quarter year time location_key street city province_or_street country location Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales Measures item_key item_name brand type supplier_type item branch_key branch_name branch_type branch Shipping Fact Table time_key item_key shipper_key from_location to_location dollars_cost units_shipped shipper_key shipper_name location_key shipper_type shipper galaxy schema Measures

31 คิวบ์ (Cube) เป็นโมเดลของ Data Warehouse เป็นโมเดลของ Data Warehouse เปรียบเสมือนลูกบากส์ ซึ่งแต่ละมุมมองจะทำให้เกิด การคิวรี องค์ประกอบหลักคือ เปรียบเสมือนลูกบากส์ ซึ่งแต่ละมุมมองจะทำให้เกิด การคิวรี องค์ประกอบหลักคือ ไดเมนชัน (Dimention) ไดเมนชัน (Dimention) เมเชอร์ (Measure) เมเชอร์ (Measure) สามารถหมุนแกนได้ (privoted data cube) สามารถหมุนแกนได้ (privoted data cube)

32 วิธีการเก็บข้อมูลลง คิวบ์ MOLAP STORAGE MOLAP STORAGE Multidimensional OLAP เนื่องจากเก็บผลลัพธ์ไว้ในดิสก์ และ สามารถคำนวณผลที่ต้องการไว้ได้ล่วงหน้า เหมาะกับ ระบบที่มี ข้อมูลขนาดปานกลาง Multidimensional OLAP เนื่องจากเก็บผลลัพธ์ไว้ในดิสก์ และ สามารถคำนวณผลที่ต้องการไว้ได้ล่วงหน้า เหมาะกับ ระบบที่มี ข้อมูลขนาดปานกลาง ROLAP STORAGE ROLAP STORAGE Relation OLAP ใช้ relation ใน database เหมาะกับ ระบบที่มี ข้อมูลมาก ความถี่ในการใช้น้อย Relation OLAP ใช้ relation ใน database เหมาะกับ ระบบที่มี ข้อมูลมาก ความถี่ในการใช้น้อย HOLAP STORAGE HOLAP STORAGE Hybrid OLAP โครงสร้างนี้จะผสมระหว่าง MOLAP และ ROLAP โดยใช้ข้อมูลที่มีอยู่ใน relation Database แต่สร้างยอด รวมไว้ในคิวบ์ Hybrid OLAP โครงสร้างนี้จะผสมระหว่าง MOLAP และ ROLAP โดยใช้ข้อมูลที่มีอยู่ใน relation Database แต่สร้างยอด รวมไว้ในคิวบ์

33 MOLAP Server Multi-Dimensional OLAP Server Multi-Dimensional OLAP Server multi- dimensional server M.D. tools utilities could also sit on relational DBMS Product City Date milk soda eggs soap A B Sales

34 ROLAP Server Relational OLAP Server Relational OLAP Server relational DBMS ROLAP server tools utilities Special indices, tuning; Schema is “denormalized”


ดาวน์โหลด ppt Chapter 3 :OLAP โดย อ.เธียรชัย พัฒนศิริเวทิน. Outline ที่มาของแนวคิด OLAP ที่มาของแนวคิด OLAP หลักการวิเคราะห์ข้อมูล หลักการวิเคราะห์ข้อมูล ความหมายของแบบจำลองหลายมิติ

งานนำเสนอที่คล้ายกัน


Ads by Google