انبار داده و داده کاوی
• یک انبار داده ،دادههای دلخواه را از یک یا چند منبع جمع آوری کرده و آنها را به موضوعاتی با و گروههای اطلاعاتی تبدیل می کند، سپس آنها را به همراه اطلاعات زمان و تاریخ برای پشتیبانی بهتر از تصمیم گیریها ذخیره می کند، این سیستمها ، دیدهای متعددی از اطلاعات برای طیفها ی مختلف کاربران فراهم می کند، قدرت این مفهوم در آن است که به کاربران اجازه تحلیلها و پرس و جوهای گوناگون بر روی دادهها یی می دهد که قبل از آن هیچ ارتباطی با هم نداشتند [16]
فهرست 1
فصل اول: انبارداده چیست؟ 4
بخش یک: تعریف انبار داده 4
بخش دو: 4 خصوصیت اصلی انبار داده 5
بخش سه: تفاوت انبار داده و پایگاه داده 7
فصل دوم: فعالیتهای انبارداده 10
بخش یک: دریافت داده 10
بخش دو: پیش پردازش دادهها 11
پاکسازی 11
یکپارچهسازی 12
تبدیل دادهها 13
کاهش دادهها 14
بخش سه:OLAP 15
مدلهای دادهای رابطهای وچندبعدی 16
حجمهای دادهای 20
شماهای دادهای 21
طراحی پایگاه داده چند بعدی انبار داده 24
ملاحظات مربوط به طراحی پایگاه داده انبار 25
انتقال اطلاعات به جدولهای طراحی شده 26
ساخت حجمهای دادهای (در AM ) 27
عملیات بر روی حجمهای دادهای 27
Roll Up 27
Drill Down 28
Slice 28
Dice 28
Pivot 29
Drill-acros 30
Ranking 30
سرورهای OLAP 30
مفاهیم actions
named set
calculated member
نمایش حجمهای دادهای در AM و Excel
فصل سوم: دادهکاوی
فصل اول: انبارداده چیست؟
بخش یک: تعاریف انبارداده
• Bill Inmon: مجموعه ای از دادهها ی موضوع گرا، مجتمع، غیرفرار و وابسته به زمان که برای پشتیبانی از تصمیم گیریها ی مدیریتی مورد استفاده قرار می گیرد [15]
• نسخه ای از دادهها ی چند پایگاه داده، که به منظور تسهیل پردازش و پرس و جوهای کاربران طراحی شده است
• یک انبار داده ،دادههای دلخواه را از یک یا چند منبع جمع آوری کرده و آنها را به موضوعاتی با و گروههای اطلاعاتی تبدیل می کند، سپس آنها را به همراه اطلاعات زمان و تاریخ برای پشتیبانی بهتر از تصمیم گیریها ذخیره می کند، این سیستمها ، دیدهای متعددی از اطلاعات برای طیفها ی مختلف کاربران فراهم می کند، قدرت این مفهوم در آن است که به کاربران اجازه تحلیلها و پرس و جوهای گوناگون بر روی دادهها یی می دهد که قبل از آن هیچ ارتباطی با هم نداشتند [16]
• جمع آوری ، پاکسازی انتقال داده از سیستمهای عملیاتی متعدد و آماده کردن اطلاعات حاصل برای تحلیل و گزارش گیری کاربران نهایی ، انبار داری دادهها نامیده می شود [22]
• انبار داده پایگاه داده بزرگی است که برای پاسخگویی به سوالات، ایجاد شده است متناسب با انبار ، سوالات مذکور هم با هم فرق می کنند انبار می تواند در اندازهها ی بزرگ (در حدود گیگابایت) یا کوچکتر باشد کاربران انبار ممکن است کارکنان داخلی ، افراد ناشناس شبکهها و یا هر دو باشند
• انبار داده اساس هر سیستم نرم افزاری پشتیبان تصمیم گیری است و برای اخذ دادههای DSS و کارایی بهتر پرس و جوها طراحی شده است [24][18]
• انبار داده یک پایگاه داده موضوع گرا است که به منظور دسترسیهای گسترده طراحی شده است و ابزارهایی برای برآوردن نیازهای اطلاعاتی مدیران در همه سطوح سازمان آماده می کند ، به بیان دیگر یک انبار داده به صورتی طراحی می شود که کاربران اطلاعات مورد نیاز خود را شناسایی کنند و بتوانند با استفاده از ابزارهای ساده ای به آنها دسترسی داشته باشند [16]
• یک انبار داده مخزنی از اطلاعات مجتمع شده است که برای انجام پرس و جو و تحلیلها آماده می شود
بخش دو: چهار خصوصیت اصلی انبار داده
بر اساس تعریف Bill Inmon (که او را پدر سیستمهای انبار داده نامیدهاند) انبار داده، مجموعه ای از دادههای موضوع گرا، مجتمع، غیرفرار و وابسته به زمان است که برای پشتیبانی از تصمیم گیریهای مدیریتی مورد استفاده قرار می گیرد دراین بخش بر اساس این تعریف، که معمولترین و شناخته شدهترین تعریف انبار داده است، چهار خصوصیت اصلی انبار داده را مورد بررسی قرار میدهیم
• موضوعگرا :هر انبار داده دادههای مرتبط با یک موضوع خاص را در خود نگاه میدارد و این دادهها را به منظور استخراج مفاهیم و نتایج خاصی به شکلی ویژه سازماندهی میکند بدین ترتیب سرعت جستجوها در انبار بسیار بالا خواهد بود انبار داده برای پاسخگویی به پرسشهای مختلف در مورد یک موضوع خاص بهینهسازی میشود [24]
• مجتمع : در سیستمهای مختلف دادهها ممکن است از جنبههای مختلفی با هم نامتناسب باشند مثلاً منابع داده در کشورهای مختلف با زمان و تاریخهای مختلف ذخیره شدهاند و یا منابعی که از ماشینهای مختلف هستند در اعداد، حروف و دیگر فیلدها متناسب با محدودیتهای ماشین، سیستمعامل و تطابق با استانداردهای مختلف متفاوت هستند [22] با توجه به مختلف بودن منابع انبارداده، قبل از ذخیره سازی آنها در انبار داده برای تأمین یکپارچگی تکنیکهای پاکسازی دادهها و مجتمعسازی به کار میرود با توجه به این موضوع که دادهها زیر نظر مدیریت واحدی ذخیره سازی میشوند، دادههای کاملاً سازگاری خواهیم داشت که داشتن چنین سازگاری در سایر سیستمها مثل سیستمهای شبکهای و توزیعی ناممکن است
• متغیر با زمان : دادهها در انبارداده برای تهیه اطلاعات تاریخی( مثلاٌ برای 5 تا 10 سال پیش) به کار میروند هر ساختار کلیدی در انبار داده شامل عنصر زمان یا همان مهر زمانی است این مهر زمانی به عنوان کلیدی به سایر جداول عمل میکند [24]سیستم انبار داده دادهها هرگز به روز درآوری نمیشوند بلکه دادههای جدید و یا تغییر یافته با مهرهای زمانی جدید به انبار اضافه میشوند