Wednesday, 19 January 2011

IT Learning Journal Week9: 19/01/11

Data Management (Cont.)
Data Warehouse Process ประกอบด้วย
1.       รวบรวมและคัดเลือกข้อมูลจากภายในองค์กรและภายนอกองค์กร(Operational Data +External Data) เพื่อสร้าง meta data ซึ่งเป็นข้อมูลของข้อมูลที่ช่วยให้อธิบายข้อมูล
2.       Data Staging(ECTL) คือการคัดเลือกข้อมูลที่ต้องการใช้จาก Database มาเก็บไว้ใน Data Cube  โดยประกอบด้วย
·        Extract การคัดเลือกข้อมูลที่ต้องการ
·        Clean แก้ปัญหาข้อมูลไม่สม่ำเสมอหรือซ้ำซ้อน
·        Transform การแปลงสภาพข้อมูลให้อยู่ในสภาพที่สามารถนำไปใช้ประโยชน์ต่อได้
·        Load การโหลดข้อมูลที่ได้ลงใน data cube
3.       Data Warehouse Business Subject การสร้าง Data warehouse โดยคำนึงถึงมุมมองของ Business Subject
4.       Business View
5.       Information Catalog
Data Mart
คือ Data warehouse ขนาดเล็กซึ่งสร้างขึ้นเพื่อการใช้งานภายในแผนกหนึ่งๆขององค์กร โดยแบ่งเป็น 2 ประเภท คือ
1.       Replicated Data Mart พบมากที่สุด โดยมี data warehouse ในส่วนของ Enterprise มาก่อน และแต่ละแผนกก็มี data mart เป็ยของตนเอง
2.       Stand – alone data marts  องค์กรไม่พร้อมทำ enterprise data warehouse แต่ละแผนกเลยสร้าง data mart ของของตนเองเพื่อใช้งาน
Data Cube (OLAP)
คือ ฐานข้อมูลที่มีหลายมิติ(Multi Dimensional Database) ซึ่งช่วยเพิ่มความรวดเร็วของการ
·        Queries การสอบถามหรือตั้งคำถามกับระบบ
·        Slice & dice of Information
·        Roll up
·        Drill down การลงรายละเอียดข้อมูล
Business Intelligence
คือ การรวมเครื่องมือในการทำงานต่างๆ เช่น ฐานข้อมูล application และวิธีการ เพื่อทำให้สามารถที่จะจัดการข้อมูลได้ดี และพร้อมที่จะนำเสนอข้อมูลต่อผู้บริหารเพื่อสามารถวิเคราะห์ข้อมูลต่างๆได้อย่างมีประสิทธิภาพ
·        ตัวอย่าง BI Function and Feature
1.       Dashboard เป็นการนำเสนอผลการดำเนินงานในรูปแบบกราฟ โดยแบ่งเป็น 3 ลักษณะ
o   Operational dashboards
o   Tactical dashboards
o   Strategic dashboards
2.       Balance scorecard เป็นการวัด performance ขององค์กร ผ่านมุมมอง 4 ด้าน คือ ด้านการเงิน ด้านกระบวนการภายใน ด้านการเรียนรู้และเติบโต และด้านลูกค้า

Online Analytical Processing (OLTP)
เป็นประเภทของซอฟต์แวร์ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลในมุมมองเชิงลึกอย่างรวดเร็ว consistent และ interactive โดยสามารถปรับเปลี่ยนรูปแบบการนำเสนอข้อมูลตามความต้องการของผู้บริหาร
Data Mining
เป็นการ extract ข้อมูลที่ไม่เคยทราบมาก่อนจาก database ขนาดใหญ่เพื่อนำไปใช้ในการตัดสินใจทางธุรกิจ โดยต้องทำกับข้อมูลที่มีจำนวนมากถึงแสนหรือล้าน record ซึ่งประโยชน์ของ Data Mining ขึ้นอยู่กับผู้ใช้ว่าจะสามารถตีความข้อมูลที่นำเสนอได้มากแค่ไหน
·        Mining Process  เป็นรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่นๆ และผ่านกระบวนการ ECTLและ Mining เพื่อวิเคราะห์และประมวลผลข้อมูล  
·        Yield from Data Mining
o   Clustering  การจัดกลุ่มข้อมูล โดยใช้ความสัมพันธ์ของตัวข้อมูลเอง
o   Classification การจำแนกข้อมูล โดยผู้ใช้เป็นผู้กำหนดเกณฑ์ในการจำแนก
o   Association ดูผลกระทบของข้อมูลกลุ่มหนึ่งต่อข้อมูลอีกกลุ่มหนึ่ง
o   Sequence discovery
o   Prediction

Text Mining
เป็นการ mining ข้อมูลที่มีรูปแบบแบบ Non-structured หรือ ข้อมูลที่ไม่มีรูปแบบชัดเจน ไม่สามารถคำนวณได้ เช่น ความคิดเห็นของลูกค้า ซึ่งเครื่องมือนี้จะช่วยในการหา hidden content จากข้อมูลที่ไม่มีรูปแบบ และจับกลุ่มข้อมูลที่มีลักษณะเดียวกันเข้าด้วยกัน

No comments:

Post a Comment