четверг, 23 августа 2012 г.

Построение хранилищ данных на основе SQL Server 2012

Эффективное ведение бизнеса в современных условиях немыслимо без использования современных методов бизнес-аналитики на основе вычислительной техники. Грамотное применение этих технологий позволяет не только оперативно выявлять узкие места и обнаруживать негативные тенденции в деятельности предприятия, но и вовремя находить подсказки для решения этих проблем. В свою очередь эффективность бизнес-анализа в значительной степени зависит от используемого аппаратного и, в первую очередь, программного обеспечения. Прекрасным примером такого удобного, гибкого и высокопроизводительного программного обеспечения является комплекс технологий Business Intelligence включенный в Microsoft SQL Server 2012.

Как обычно, представляя на рынке новые программные продукты, корпорация Microsoft позаботилась и о том, чтобы сопроводить их новыми учебными курсами. Корпорацией представлена целая линейка из 5 курсов по освоению SQL Server 2012, два из которых посвящены технологиям бизнес-анализа:
В совокупности эти 2 курса дают целостное представление о том как построить хранилище данных, как его подерживать и, в дальнейшем, как его использовать для целей бизнес-анализа.
В этой статье рассмотрим первый из этих 2 курсов. Курс 10777А является наследником курса очень толкового курса 6235 по прежней версии SQL Server 2008 - “Внедрение и сопровождение SQL Server 2008 Integration Services”. Однако курс 10777А представляет собой не просто адаптацию и обновление прежнего курса – структура и идеология курса в нем изменены радикально. В прежнем курсе весьма доходчиво и детально рассматривались механизмы и возможности Integration Services (напомню, основной задачей этой технологии является экспорт-импорт данных), однако у слушателей подспудно возникал вопрос – для чего это все может понадобиться? Какова главная цель? Ради чего все эти удобные технические приемы существуют?

В новом курсе 10777 А такой вопрос больше не будет возникать. Авторы курса с первых же страниц объявляют, что все рассматриваемые далее приемы и технические средства подчинены одной цели – построению и сопровождению хранилища данных, которое в свою очередь является главным источником информации для бизнес-анализа. Именно этой задаче подчинена вся внутренняя логика курса.

В первых модулях подробно рассматривается принципы организации самих хранилищ  данных, их особенности, отличия от традиционных баз данных на основе интерактивных транзакций (ОLTP). В практических работах слушатели научатся создавать «каркас» таких хранилищ.
Следующая часть курса посвящена тому, как наполнить это хранилище реальными данными – слушатели научатся использовать основные возможности Integration Services для решения этой задачи.

Далее, наполнить хранилище один раз, разумеется, недостаточно. Отсюда возникает еще одна задача – как сделать так, чтобы хранилище регулярно пополнялось свежими данными. И здесь в курсе имеем детальное рассмотрение таких методов, сопровождающихся обильными практическими занятиями.

Наконец, как максимально избежать попаданию в хранилище некорректных данных? На помощь приходят Службы качества данных (Data Quality Services), которые опять-таки подробно рассматриваются в этом курсе.

В заключение еще раз отметим, что курс дает именно целостное, систематизированное представление о технологиях построения и поддержания хранилищ данных.

Комментариев нет:

Отправить комментарий