Data Management (Cont.)
Data Warehouse Process ประกอบด้วย
1. รวบรวมและคัดเลือกข้อมูลจากภายในองค์กรและภายนอกองค์กร(Operational Data +External Data) เพื่อสร้าง meta data ซึ่งเป็นข้อมูลของข้อมูลที่ช่วยให้อธิบายข้อมูล
2. Data Staging(ECTL) คือการคัดเลือกข้อมูลที่ต้องการใช้จาก Database มาเก็บไว้ใน Data Cube โดยประกอบด้วย
· Extract การคัดเลือกข้อมูลที่ต้องการ
· Clean แก้ปัญหาข้อมูลไม่สม่ำเสมอหรือซ้ำซ้อน
· Transform การแปลงสภาพข้อมูลให้อยู่ในสภาพที่สามารถนำไปใช้ประโยชน์ต่อได้
· Load การโหลดข้อมูลที่ได้ลงใน data cube
3. Data Warehouse Business Subject การสร้าง Data warehouse โดยคำนึงถึงมุมมองของ Business Subject
4. Business View
5. Information Catalog
Data Mart
คือ Data warehouse ขนาดเล็กซึ่งสร้างขึ้นเพื่อการใช้งานภายในแผนกหนึ่งๆขององค์กร โดยแบ่งเป็น 2 ประเภท คือ
1. Replicated Data Mart พบมากที่สุด โดยมี data warehouse ในส่วนของ Enterprise มาก่อน และแต่ละแผนกก็มี data mart เป็ยของตนเอง
2. Stand – alone data marts องค์กรไม่พร้อมทำ enterprise data warehouse แต่ละแผนกเลยสร้าง data mart ของของตนเองเพื่อใช้งาน
Data Cube (OLAP)
คือ ฐานข้อมูลที่มีหลายมิติ(Multi Dimensional Database) ซึ่งช่วยเพิ่มความรวดเร็วของการ
· Queries การสอบถามหรือตั้งคำถามกับระบบ
· Slice & dice of Information
· Roll up
· Drill down การลงรายละเอียดข้อมูล
Business Intelligence
คือ การรวมเครื่องมือในการทำงานต่างๆ เช่น ฐานข้อมูล application และวิธีการ เพื่อทำให้สามารถที่จะจัดการข้อมูลได้ดี และพร้อมที่จะนำเสนอข้อมูลต่อผู้บริหารเพื่อสามารถวิเคราะห์ข้อมูลต่างๆได้อย่างมีประสิทธิภาพ
· ตัวอย่าง BI Function and Feature
1. Dashboard เป็นการนำเสนอผลการดำเนินงานในรูปแบบกราฟ โดยแบ่งเป็น 3 ลักษณะ
o Operational dashboards
o Tactical dashboards
o Strategic dashboards
2. Balance scorecard เป็นการวัด performance ขององค์กร ผ่านมุมมอง 4 ด้าน คือ ด้านการเงิน ด้านกระบวนการภายใน ด้านการเรียนรู้และเติบโต และด้านลูกค้า
Online Analytical Processing (OLTP)
เป็นประเภทของซอฟต์แวร์ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลในมุมมองเชิงลึกอย่างรวดเร็ว consistent และ interactive โดยสามารถปรับเปลี่ยนรูปแบบการนำเสนอข้อมูลตามความต้องการของผู้บริหาร
Data Mining
เป็นการ extract ข้อมูลที่ไม่เคยทราบมาก่อนจาก database ขนาดใหญ่เพื่อนำไปใช้ในการตัดสินใจทางธุรกิจ โดยต้องทำกับข้อมูลที่มีจำนวนมากถึงแสนหรือล้าน record ซึ่งประโยชน์ของ Data Mining ขึ้นอยู่กับผู้ใช้ว่าจะสามารถตีความข้อมูลที่นำเสนอได้มากแค่ไหน
· Mining Process เป็นรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่นๆ และผ่านกระบวนการ ECTLและ Mining เพื่อวิเคราะห์และประมวลผลข้อมูล
· Yield from Data Mining
o Clustering การจัดกลุ่มข้อมูล โดยใช้ความสัมพันธ์ของตัวข้อมูลเอง
o Classification การจำแนกข้อมูล โดยผู้ใช้เป็นผู้กำหนดเกณฑ์ในการจำแนก
o Association ดูผลกระทบของข้อมูลกลุ่มหนึ่งต่อข้อมูลอีกกลุ่มหนึ่ง
o Sequence discovery
o Prediction
Text Mining
เป็นการ mining ข้อมูลที่มีรูปแบบแบบ Non-structured หรือ ข้อมูลที่ไม่มีรูปแบบชัดเจน ไม่สามารถคำนวณได้ เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน
No comments:
Post a Comment