Энциклопедия мобильной связи

Что такое BI-инструменты? Технология построения информационного блока управленческой отчетности и аналитической обработки данных в сфере управления финансами.


Часть 1. Построение хранилища данных
Д. А. Вульф, ведущий специалист ОАО «КМ–бизнес»

Тематика настоящего доклада непосредственно перекликается с назначением системы ТИС МО, которое заключается в обеспечении информационной поддержке деятельности органов государственной власти Московской области (МО) и органов местного самоуправления. В докладе представлена технология, реализуемая в данный момент в проекте создания интегрированной информационной системы поддержки принятия решений по формированию бюджета, анализу и контролю его исполнения (“МОФИН”) в Министерстве финансов (МФ) МО. ОАО «КМ–бизнес» выступает в качестве системного интегратора проекта и разрабатывает информационно-аналитический блок, включающий в себя управленческую отчетность. Основными задачами информационно-аналитического блока являются:
информационное обеспечение процесса принятия управленческих решений;
интеграция разнородных потоков информации из разных источников, упорядочение и консолидация поступающей информации, представление ее в удобной для управленцев форме
оперативное обслуживание нестандартных потребностей управленцев в информации, а также обслуживание запросов сторонних организаций;
предоставление мощного инструмента аналитической обработки данных
Технологически информационно-аналитический блок включает в себя хранилище данных и OLAP-систему. Хранилище данных (ХД) - это некая совокупность данных объединенных из различных источников, структурированная и оптимизированная для доступа к ним при помощи средств оперативной аналитической обработки (OLAP).
Основной принцип построения информационно-аналитической системы состоит в разработке автоматической процедуры агрегации необходимых данных из всей используемых ИС и информации поступающей из внешних источников, организация хранения данных и реализации процедур оперативного доступа к ним, дополненного сервисом полнофункциональной аналитической обработки информационных массивов.
Хранилища данных позволяют разгрузить оперативные базы данных, и тем самым, позволяют пользователям более эффективно и быстро извлекать необходимую информацию. Они могут быть включены в общую корпоративную сеть, по которой в хранилище по заранее определенному расписанию, как правило, в период наименьшей загрузки сети и серверов копируется накопленная за день или за неделю информация.
ХД решает сразу 2 задачи:
консолидация данных из различных источников,
разгрузка основной системы оперативной обработки.
Таким образом, предлагается очищать систему оперативной обработки от исторических данных, не используемых в ежедневной работе, но не удалять эти данные, а помещать их в ХД.
Отличительные черты ХД:
Предметная ориентация. Данные в ХД ориентированы на решение задач анализа и представления данных. Предметная ориентация позволяет существенно ускорить доступ к данным за счет предварительной реструктуризации данных в момент загрузки. Предметная ориентация позволяет также хранить в ХД только те данные, которые необходимы для средств анализа, что существенно сокращает затраты на носители информации и повышает безопасность доступа к данным, повышает скорость доступа к данным.
Интеграция.Различные системы обслуживания баз данных разрабатываются различными коллективами разработчиков, зачастую в разное время и различными средствами разработки, например в МФ МО сейчас параллельно эксплуатируются две функционально дублирующиеся системы - ИСУФМО, СЕ-2. Это приводит к тому что объекты, отражающие одну сущность, имеют различные наименования и единицы измерения. Обязательная интеграция данных в ХД позволяет решить эту проблему.
Важность этого ключевого свойства ХД может быть продемонстрирована в различных аспектах:
Единые правила наименования объектов
Единые единицы измерения для однотипных объектов
Единое физическое представление однотипных объектов
Единые атрибуты представления однотипных объектов
По сути, Хранилище Данных - это оптимально организованная база данных, обеспечивающая максимально быстрый и комфортный доступ к информации, необходимой при принятии решений.
Архитектура информационно-аналитического блока ИС представлена на рисунке 1.

Рис. 1. Архитектура информационно-аналитического блока
1.Методы сбора, чистки и обобщения данных
- Диспетчер процессов
Диспетчер осуществляет выполнение процессов загрузки на основе разработанного ранее регламента.
- Загрузчик данных
В функции загрузчика входит трансформация данных в заданный формат.
- Анализатор данных
В этой части производится анализ данных на корректность и непротиворечивость и дальнейшее помещение отфильтрованной информации в Хранилище. Анализ данных является самой сложной частью проекта
Технически предлагается реализовать методы сбора, чистки и обобщения данных на технологии DTS, реализованной в Microsoft SQL Server.
DTS представляет собой набор программируемых сервисов, позволяющих переносить данные из разнородных электронных источников информации в хранилище данных, при этом производя контроль и очистку переносимых данных.
2. Разделение хранилища данных на витрины данных.
Подобно большинству хранилищ данных, витрины представляют собой системы поддержки принятия решений. Их отличие от более крупных хранилищ состоит в ограниченности информационного диапазона, они позволяют обеспечить потребности одного подразделения или отдела. На данный момент это самый распространенный тип ХД, позволяющий реализовать ХД в виде набора составных компонентов. Причем реализация уже 1-го компонента делает систему работоспособной. Каркасом витрины данных является набор таблиц фактов.
В витринах данных предлагается размещать таблицы предварительно вычисленных итогов, в которых содержаться агрегированные данные, что дает большой выигрыш в производительности при построении отчетов.
Ядро ХД и витрины данных предлагается реализовать на MS SQL Server. Выбор MS SQL Server для случая МФ МО объясняется следующими факторами:
1. Одно из лучших соотношений цена/производительность;
2. Уже существующая реализация учетной системы ИСУФМО на данной платформе, следовательно, согласованность данных при переносе из ИСУФМО в ХД
3. Средства представления и анализа данных
Итак, хранилище данных собирает информацию в простой, понятной и удобной для последующего анализа структуре. Следующий вопрос, который нужно решать – это собственно представление собранной информации в виде отчетов, дальнейший анализ с целью выработки на его основе каких-то решений. Программными продуктами, которые наилучшим образом ориентированы на выполнение данных задач, являются так называемые OLAP-системы.
Итак, технология построения хранилищ данных позволяет снять проблемы с централизованным доступом ко всей информации организации и предоставить оперативное и адекватное информационное обеспечение управления организацией.


Часть 2. Формирование управленческой отчетности и аналитическая обработка информации
С. А. Гусев, ведущий специалист ОАО «КМ–бизнес»

В настоящий момент особую актуальность приобретает информационная поддержка процессов принятия управленческих решений.
Эффективное управление крупной организацией сегодня не мыслимо без применения передовых информационных технологий, среди которых одно из важных мест занимают Информационно-Аналитические Системы.
В самом общем виде процесс управления можно свести к решению трех задач:
где мы находимся?
куда мы хотим придти?
как мы туда попадем?
Для сложных систем характерно то, что управлять ими приходится, как правило, в условиях неполной информации, незнания закономерностей функционирования и постоянного изменения внешних факторов.
Поэтому процесс управления имеет итерационный, т.е. циклический, характер.
После принятия решения и применения управляющего воздействия необходимо вновь оценить состояние, в котором находится система, и решить вопрос о том, правильно ли происходит движение по намеченному пути.
Если отклонения нас не удовлетворяют, то необходимо переопределить процесс управления, задать новое воздействие, основываясь на точной и разносторонней оценке текущего состояния и анализе каких-то закономерностей.
Таким образом, получается, что ключевым моментом на каждом витке процесса управления является информация – о состоянии дел в настоящий момент и на какой-то промежуток времени назад.
Зачастую в организации имеется полная информация, ее может быть даже слишком много, в избытке, но складывать целую картину тяжело из-за отсутствия правильных инструментов и технологий по ее обработке и подготовке для анализа и представления.
Таким образом, получается, что для современного процесса управления исключительную важность приобретают так называемые Информационно-аналитические системы – это программные комплексы, предназначенные максимально возможно облегчить процессы получения ясной информационной картины о текущем состоянии дел вашей организации, причем делая это очень гибко и оперативно, а также обеспечить возможность разнообразного анализа информации, не говоря об удобстве и простоте работы.
В общем случае можно сказать, что принятие решения о построении Информационно-аналитической системы в вашей организации считается обоснованным и правильным, если на данном этапе деятельности у руководства и работников разных уровней существуют потребности:
читать существующие заранее подготовленные отчеты
посылать запросы к корпоративным источникам данных, чтобы получить новые данные
анализировать данные, просматривая их на различных уровнях детализации и с различных перспектив
создавать свои собственные отчеты
Как правило, информационно-смысловая направленность обычных систем отчетности специализированных программ довольно узкая, смысл этих программ не в удобных и гибких механизмах отчетности, а в фиксации и сборе неких фактов деятельности организации, а уж о простоте создания новых отчетов и о каких-то механизмах манипуляции отчетными данными речь, как правило, не идет совсем.
Получается, что никак не обойтись без построения ИАС – системы особого класса, сугубо специфической по технологиям построения отчетности и технологиям анализа данных, не зависящей от интерфейсов, технологий и традиций, существующих у вас на данный момент программ.
Переход к использованию ИАС, в общем и по сути, является переходом к использованию системы, позволяющей перейти в вашей повседневной работе от простой переработки данных к их системному представлению и глубокому анализу, методы и результаты которых так необходимы управленцам и аналитикам в любой нормальной организации.
Такого класса задачи, как построение ИАС организации, в мировой практике решаются с использованием OLAP-систем и конструирования Хранилищ Данных.
Централизация данных и удобное их структурирование - это далеко не все, что нужно аналитику. Ему ведь еще требуется инструмент для просмотра, визуализации информации. Традиционные отчеты, даже построенные на основе единого хранилища, лишены одного - гибкости. Их нельзя "покрутить", "развернуть" или "свернуть", чтобы получить желаемое представление данных.
Ключевую позицию в предлагаемой системе занимает информационно-аналитический блок (управленческая отчетность и аналитика). Предлагается следующая технология построения информационно-аналитической системы для органов управления:
представление информации в наглядной форме (диаграммы, графики, таблицы), удобной для потребления управленцами
построение в ИС промежуточного слоя “бизнес-логики”, который позволяет функциональным специалистам самостоятельно конструировать и выполнять запросы данных к ИС, а не дожидаться обслуживания их потребностей программистами
предоставление мощного инструмента аналитической обработки многомерных данных
оперативное обслуживание нестандартных запросов информации, в том числе из сторонних организаций
удобные механизмы распределения и распространения отчетов
Хотелось бы подчеркнуть два ключевых момента предлагаемой технологии, которые, на наш взгляд, существенно повышают общую скорость информационно-аналитических аспектов работы управленцев и аналитиков в организации.
Первое – то, что проистекает из использования OLAP – многомерность данных в отчетах, то есть это возможность без переделки отчета получить различные “срезы” информации, вращать данные туда-сюда, сворачивать и разворачивать периоды времени и прочие группируемые понятия, даже не думая о том, чтобы встать из удобного кресла управленца или чуть менее удобного, но все-таки удобного, кресла аналитика, и пойти с требованиями переделки к разработчику отчета.
Второе – это слой “бизнес-логики”, или “семантический слой” – уникальный механизм предоставления пользователям возможности строить и изменять любые формы отчетности на основе каталогов хорошо им известных по повседневной работе терминов, не задумываясь ни о том, как на самом деле извлекаются данные из ХД, ни о том, где эти данные находятся. Опять же, применение технологии семантических слоев существенно снижает частоту обращения к специалистам – программистам.
Остановимся немного поподробнее на технологии “семантического слоя”.
Современные технологии позволяют перейти к созданию отчетов самими пользователями.
Это возможно благодаря так называемому “семантическому слою”, являющемуся существенной особенностью представляемых технологий.
Семантический слой - это набор каталогов бизнес-терминов, характерных для предметной области и соответствующих определенным данным, а также их параметров и методов извлечения. Хранится в файле специального формата.
В Информационно-аналитической системе семантический слой занимает ключевую позицию во взаимодействии пользователей с информацией и во взаимодействии пользователей с программистами.
Фактически это означает, что, получив от программиста файл с семантическим слоем, пользователи могут сами строить необходимые отчеты и изменять существующие по своему усмотрению, не утруждая себя общением с сотрудниками ИТ-департаментов, ведь это общение частенько затягивается и в конечном счете в деле теряется оперативность.


Изначально, определив общие потребности целевых групп пользователей, программистами создается основа для дальнейшей работы – файлы семантических слоев для каждой из групп пользователей.
Под этим подразумевается, что программисты, знающие внутреннюю структуру хранилища данных, осуществляют создание семантического слоя, в котором содержатся методы и правила для физического получения нужного значения из ХД.
После построения семантического слоя для написания отчетов уже не требуются услуги программиста, не нужно и знание того, как и где именно хранится информация.
Уровень подготовки специалиста, создающего или модифицирующего отчеты, может быть примерно как у среднего пользователя Excel, ему достаточно владеть понятиями предметной области.
Далее, после создания файла с описанием семантического слоя, этот файл становится доступным для создания на его основе конкретных отчетов.
Отчет можно сохранить в файл специального формата, и его могут использовать другие пользователи.
Особенности технологии семантического слоя:
это подсистема, которая позволяет конечным пользователям OLAP формулировать запросы к базе данных, используя свои привычные термины
используется управленцами и аналитиками для получения отчетов без углубления в технические моменты
создается дизайнером - разработчиком, хорошо представляющим как систему хранения данных и язык запросов SQL, так и предметную область, этими данными описываемую
разрабатывается один раз – используется во многих отчетах
при создании используется богатый набор средств и возможностей - агрегатные функции, контексты, диалоговые компоненты, подзапросы и т.д.
персонализация и целевая направленность каталогов терминов
Итак, реализация нашей технологии построения информационно-аналитической системы государственного органа власти МО предоставит возможности
Руководителям:
Оперативно принимать решения на основе отчетов, содержащих информацию из корпоративных источников данных;
Аналитикам и управленцам среднего звена:
Самостоятельно строить любые запросы ко всем источникам данных;
Самостоятельно создавать и форматировать любые отчеты (предопределенные и непредсказуемые);
Консолидировать информацию из различных источников в одном отчете;
Представлять информацию в удобном для принятия решений и анализа виде;
Обмениваться и совместно использовать документы;
Получать автоматически создаваемые и обновляемые отчеты;
Самостоятельно строить сложные аналитические запросы к источникам данных;
Создавать аналитические отчеты с необходимым представлением данных;
Рассматривать информацию в различных срезах и разрезах;
ИТ-специалистам:
Значительно сократить время на сопровождение аналитической и отчетной деятельности организации;
Предоставить возможность пользователям самостоятельно обращаться к данным;
Организовать безопасную и надежную совместную работу пользователей;
Сконцентрироваться на других задачах.

http://www.cm-business.ru



На рынке существует множество Business Intelligence решений, которые, как правило, решают одну задачу - построить корпоративную отчетность, или, иными словами, reporting. Грубо говоря, они выступают заменителями Microsoft Excel. Кстати, Excel тоже можно отнести к инструментам BI, поэтому те, кто работал с данными в Excel, строил графики и т.п., отчасти - BI разработчики. А если вам еще необходимо было собирать требования на построение отчета, подключаться к базам данных и использовать Pivot в Excel, то вы точно можете считать себя BI разработчиком.

К сожалению, Excel имеет ограниченный функционал и не подходит крупным организациям (Enterprise), поэтому существует отдельный класс BI приложений от именитых вендоров, таких как Oracle, SAP, IBM и другие. Для того чтобы лучше разбираться в основных игроках BI-рынка, можно ознакомиться с ежегодными результатами крупнейших аналитических агентств, таких как Gartner или Forrester . Каждый год они публикуют список лидеров и указывают их сильные и слабые стороны. Если вам когда либо придется выбирать для своей компании BI инструмент, то необходимо начинать именно с этого.

Давайте определимся: что же такое BI инструмент? Это решение, которое создано специально для людей, не знающих и не понимающих, как работают базы данных (им в принципе это и не нужно). Эти люди сосредоточены на бизнес-процессах, и они привыкли работать с удобными для них наименованиями, такими как «Доход», «Номер договора», «Ставка» и т.п. Им совершенно всё равно, откуда берутся данные, как они хранятся или как рассчитывается тот или другой показатель. Им нужно решение, с помощью которого они смогут получить быстрый ответ на свой бизнес-вопрос, например «Сколько телефонов было продано в прошлом месяце?» или «Какой самый популярный продукт в линейке продуктов?». BI приложение имеет удобный интерфейс, в котором бизнес-пользователь может легко «накидать» (используя drag and drop) необходимые поля, и построить отчет. Затем он легко сохраняет свой отчет и отправляет коллегам.

Прежде чем изучать любой BI продукт, необходимо понять из чего он состоит:

  • Коннектор к данным - это может быть ODBC, JDBC или любой другой драйвер, который позволяет подключаться к базам данных или к обычным «плоским» файлам;
  • Семантический слой - сердце любого BI инструмента, здесь происходит вся магия. Если по-простому, то семантический слой - прослойка между технически сложными вещами, такими как «база данных», «таблица», «соединение» и бизнес-объектами, с которыми будет работать пользователь.
  • Бизнес-объекты - непосредственно сами показатели и атрибуты, для построения отчетности.

Таким образом, когда бизнес пользователь хочет получить ответ на свой бизнес-вопрос, он просто накидывает объекты, нажимает кнопочку «обновить отчет» и получает необходимые данные для работы. Когда человек накидывает объекты, создается SQL, MDX которые отправляется в базу данные, (конечно если у нас в качестве источника данных - база данных или куб), дальше база данных отправляет результат в кеш BI приложения, чтобы пользователь мог работать, выстраивая графики и отчеты.

СЕМАНТИЧЕСКОЕ ПРОСТРАНСТВО - предложенная американским физиком Д. Бомом модель целостности мира как всеобъемлющего движения (Holomovement). Он поставил задачу построения концепции, которая в рамках единого методологического подхода объединила бы материальную Вселенную и сознание. Фундаментальная отличительная черта космологии Бома состоит в признании неразрывного единства реальности, ее неделимой целостности. С этой точки зрения мы являемся частью целого, которое обладает способностью генерировать идеи о самом себе и регистрировать их внутри себя самого. Эта парадигма объединенного бытия напоминает индийскую концепцию акаша.

В России близкий подход развивал математик и философ В.В. Налимов. Однако в его концепции смыслы и материя - это не различные проявления единой реальности, как у Бома, а две автономные реальности - физический мир и мир семантический, которые непосредственно связаны между собой через геометрию мира. По мнению Налимова, такой подход обладает тем преимуществом, что создает предпосылки для построения сверхъединой теории поля, которая будет объединять оба слоя реальности. Придавая смыслам самостоятельное существование как особой реальности, Налимов формулирует основную аксиоматику своей концепции. Весь воспринимаемый нами мир интерпретируется как множество текстов. Что касается биосферы, то здесь текстами следует считать отдельные особи, виды, популяции; в ноосфере в качестве текстов следует принимать различные аспекты сознательной деятельности.

Ключевым понятием тезауруса концепции С.п. является понятие смысла. Согласно Дж. Колеру, смысл есть сеть значений в определенных состояниях и алгоритм для решения проблем. Природа смысла раскрывается через одновременный анализ семантической триады - смысл, текст, язык (код). «Смысл смысла, - пишет австро-американский психолог В. Франкл, - в том, что он направляет ход бытия». Эволюция текста связана со спонтанным появлением фильтра, взаимодействующего с исходной функцией. Для описания этого взаимодействия Налимов предлагает использовать формулу Байеса, которая применяется при решении статистических задач о минимуме риска. Формула Байеса позволяет рассчитать апостериорную вероятность каждого из возможных событий. По Налимову, изначально все возможные смыслы мира спрессованы вдоль семантической оси подобно тому, как на действительной оси спрессованы числа (линейный континуум Кантора). Поскольку спрессованность смыслов в одномерном С.п. следует понимать как их непроявленность, их исходное состояние надо интерпретировать как семантический вакуум. Распаковывание смыслов, или появление текстов, осуществляется путем формализма Байеса, который осуществляет вероятностное взвешивание вдоль семантической оси. Возникновение вдоль этой оси функции распределения статистических весов (плотности вероятности) и означает появление текста. В общем случае, полагает Налимов, можно говорить о текстах, задаваемых функцией распределения не только вдоль оси, но и в многомерном С.п. Если физический мир и мир семантики - два автономных слоя реальности, то их взаимосвязь должна обеспечиваться потоками информации. В рамках анализируемой концепции информацию следует рассматривать как сложный процесс, состоящий из элементарных актов, протекающих в многомерном мире самоорганизующихся систем. Такое понимание информации соответствует философии А. Бергсона и А. Уайтхеда, ориентированной на системный подход постнеклассической науки. Информация, обеспечивающая связь между материальным и семантическими слоями реальности, может быть только необратимым процессом, развивающимся в многомерном и нелинейном мире.

Недостаток концепции В.В. Налимова состоит в том, что, постулируя самостоятельное существование С.п., он не видит необходимости определить соответствующий ему физический референт. Уход от поисков такого референта равнозначен отказу от исследования проблемы методами теоретической и экспериментальной физики.

Независимую попытку обнаружить такой физический референт в 1960-х гг. предпринял российский физико-химик Н.А. Кобозев. По его мнению, для того, чтобы мозг человека был способен мыслить безэнтропийно, должен существовать внешний источник антиэнтропии, или энтропийный вакуум. Связь между этим источником и атомно-молеку- лярными структурами коры головного мозга, согласно гипотезе Кобозева, обеспечивается квантовым ансамблем сверхлегких частиц, обладающих спином S. Однако эти частицы не были обнаружены экспериментально.

Другое решение проблемы предложено Л.B. Лесковым, который сформулировал мэоническую парадигму. Используя в качестве исходного пункта концепцию С.п. Налимова, Лесков дополнил ее двумя постулатами: а) физическим референтом С.п. является мэон - разновидность физического, или квантового, вакуума; б) все объекты материального мира, начиная от элементарных частиц и кончая мозгом человека, обладают свойством консиенции - способностью информационного взаимодействия с семантическим потен-циалом мэона (conscientia на латыни означает осведомленность в чем-либо, совместное знание). Преимущество такого подхода очевидно: он открывает путь к использованию достижений современных теорий физического вакуума, а также к проведению на этой основе специальных экспериментальных исследований.

Свойства мэона парадоксальны. Не будучи объектом материального мира, включенным в метрику Эйнштейна-Минковского, мэон не подчиняется закономерностям термодинамики и теории относительности. Если передача информации осуществляется с участием мэона, то скорость этого процесса может значительно превышать скорость света. Не подчиняясь закону роста энтропии, мэон не характеризуется стрелой времени: прошлое, настоящее и будущее для него как бы синхронны. Эти свойства мэона не укладываются в картезианско-ньютонову парадигму, но здесь нет противоречия, т.к. речь идет о квантово-механическом феномене, соответствующем постнеклассической картине мира. Процессы информационного взаимодействия семантического потенциала мэона с материальными объектами можно описывать на языке современных теорий физического вакуума (торсионные волны в модели А.Е. Акимова - Г.И. Шилова, взаимодействие бюонов по Ю.А. Баурову).

Остается открытым вопрос о механизме кодирования семантического потенциала в квантовых структурах мэона. Существует, однако, один радикальный способ обойти эту трудность: достаточно предположить, что мэон выполняет функцию не банка, а транспортного агента смыслов, а их генерацию в этом случае можно связать с индивидуальным и «коллективным» сознанием. Этой гипотезе соответствует семантический принцип, которому можно придать либо слабую, либо сильную форму. В первом случае это будет означать, что существует планетарное семантическое поле, а во втором - этому соответствует космическое поле.

Литература:

Налимов В.В. Спонтанность сознания. М., 1989;Лесков Л.В. Семантическая Вселенная // Вестник Московского университета. Серия 7. Философия. 1994. № 2.

Словарь философских терминов. Научная редакция профессора В.Г. Кузнецова. М., ИНФРА-М, 2007, с. 487-489.

В кн.: Образы, традиции и культура межнационального мира и согласия. Иркутск: Издательство ИГУ, 2014. С. 51-63.

На основе авторской методологической схемы «образ мира - образ жизни» и моделей образа мира и образа жизни описываются профессиональные, региональные и этнокультурные особенности образа мира и образа жизни, предлагаются схемы дальнейшего описания.

На основе материалов консультирования и специально организованных исследований описано перераспределение и изменение основных функций семьи (воспитательная, психотерапевтическая, эротическая, хозяйственно-бытовая, защитная и др.) при работе мужа вахтовым или сезонным методом.

Ставится проблема необходимости эргономического описания и проектирования про- фессионально специфичного образа жизни для тех специалистов, деятельность которых невозможна без организации особого образа жизни. Приведены примеры, перечислены факторы и параметры описания профессионально специфичного образа жизни. In article the problem of necessity of the ergonomic description and designing of professionally specific way of life for those specialists which activity is impossible without the organization of a special way of life is put. Examples are resulted, factors and parameters of the description of professionally specific way of life are listed.

Хранилище данных Deductor Warehouse - это специально организованная база данных, ориентированная на решение задач анализа данных и поддержки принятия решений, обеспечивающая максимально быстрый и удобный доступ к информации. ХД Deductor Warehouse соответствует модели ROLAP (схема «снежинка») и может быть развернуто на СУБД Firebird.

Хранилище данных Deductor Warehouse включает в себя потоки данных, поступающие из различных источников, и специальный семантический слой, содержащий так называемые метаданные (данные о данных). Семантический слой и сами данные хранятся в одной СУБД.

Запрос к хранилищу осуществляется непосредственно сквозь семантический слой, который через внутреннюю систему команд (скрытую от пользователя и аналитика) подбирает запрашиваемую информацию из многообразия хранимых данных. Работу семантического слоя можно сравнить с деятельностью библиотекаря, который по просьбе читателя достает с разрозненных полок книги и раскрывает их на нужных страницах.

Все данные в Deductor Warehouse хранятся в структурах типа «снежинка», где в центре расположены таблицы фактов, а «лучами» являются измерения, причем каждое измерение может ссылаться на другое измерение. Именно эта схема используется в данном хранилище данных.

Для описания структуры таблиц хранилища данных и связей между ними была использована модель ERD в нотации DM .

В Deductor Warehouse имеются следующие типы объектов:

Измерение - последовательность значений одного из анализируемых параметров. В таблице 3.6 представлены используемые для анализа данных оптовых закупок сумок сетями спортивных магазинов.

Таблица 3.6 - «Измерения»

Атрибут - свойство измерения (то есть точки в пространстве). Атрибут как бы скрыт внутри другого измерения и помогает пользователю полнее описать исследуемое измерение. В таблице 3.7 представлены используемые атрибуты.

Таблица 3.7 - «Атрибуты»

Тип данных

Название сети

Строковый

Тип товара

Строковый

Код типа товара

Наименование товара

Строковый

Код товара

Строковый

Факт - значение, соответствующее измерению. Факты - это данные, отражающие сущность события. Как правило, фактами являются численные значения, например, доход (см. таблицу 3.8).

Таблица 3.8 - «Факты»

Ссылка на измерение - установленная связь между двумя и более измерениями. Дело в том, что некоторые бизнес-понятия (соответствующие измерениям в хранилище данных) могут образовывать иерархии. В данном случае измерение «Код товара» содержит ссылку на измерение «Код типа товара».

Процесс - совокупность измерений, фактов и атрибутов. По сути, процесс и есть «снежинка». Процесс описывает определенное действие.

Все загружаемые в ХД данные обязательно должны быть определены как измерение, атрибут либо факт.

Информация о принадлежности данных к тому или иному типу (измерение, ссылка на измерение, атрибут или факт) содержится в семантическом слое хранилища.

Структура процесса «Хранилище» представлена на рисунке 3.1.

Рисунок 3.1 - Процесс «Хранилище»



Понравилась статья? Поделитесь с друзьями!
Была ли эта статья полезной?
Да
Нет
Спасибо, за Ваш отзыв!
Что-то пошло не так и Ваш голос не был учтен.
Спасибо. Ваше сообщение отправлено
Нашли в тексте ошибку?
Выделите её, нажмите Ctrl + Enter и мы всё исправим!