Важные термины и определения

Назад Дальше

Data mining

("Добыча данных")

Процесс аналитического исследования больших массивов информации (обычно экономического характера) с целью выявления определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных.


Drill Down

("Углубление в данные")

Drill Up ("Консолидация, обобщение данных")

Специальная техника анализа, используемая при изучении данных. Пользователь имеет возможность переходить вверх по направлению от детального представления данных к агрегированному и наоборот. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями. Например, если при анализе данных об объемах продаж в Северной Америке выполнить операцию drill-down для измерения "Регион", то на экране будут отображены такие его элементы как "Канада", "Восточные Штаты Америки" и "Западные Штаты Америки". В результате дальнейшей детализации элемента "Канада" будут отображены элементы "Торонто", "Ванкувер", "Монреаль" и т. д

 


FASMI

Fast Analysis of Shared Multidimensional Information (быстрый анализ разделяемой многомерной информации). Определение понятия OLAP в виде пяти критериев (Fast, Analysis, Shared, Multidimensional, Information), которым должны удовлетворять продукты, попадающие в эту категорию.

 


ODBC

Открытый интерфейс взаимодействия с базами данных (Open DataBase Connectivity [interface]). API для взаимодействия приложений с базами данных, разработанный корпорацией Microsoft. Наиболее широко используется в среде Windows, существуют реализации для UNIX.


OLAP

Оперативная аналитическая обработка (данных), технология OLAP (On-Line Analytical Processing) - класс приложений и технологий, предназначенных для сбора, хранения и анализа многомерных данных в целях поддержки принятия управленческих решений. Технология OLAP позволяет аналитикам, менеджерам и управляющим сформировать свое собственное видение данных, используя быстрый, единообразный, оперативный доступ к разнообразным формам представления информации. Эти формы, полученные на основании первичных данных, позволяют пользователю сформировать полноценное представление о деятельности предприятия.

Функциональность OLAP заключается в динамическом многомерном анализе консолидированных данных предприятия, направленном на поддержание следующих аналитических и навигационных видов деятельности пользователя:

Вычисления и моделирование, примененные к измерениям и/или их конкретным элементам, использующие информацию об иерархиях
Анализ временных тенденций показателей (Анализ трендов)
Формирование срезов многомерного представления для просмотра на экране
Переход к более глубоким уровням детализации
Доступ к исходным данным "Вращение" многомерных представлений: перемещение измерений с целью формирования различных форм представления данных на экране компьютера

Клиент-серверная архитектура OLAP-продуктов обеспечивает одновременный доступ большого числа пользователей (многопользовательский режим работы). При этом анализ должен производиться одинаково быстро по всем аспектам информации (приемлемое время отклика - 5 с или менее) независимо от размера и сложности структуры БД. OLAP предоставляет удобные быстродействующие средства доступа, просмотра и анализа деловой информации. Пользователь получает интуитивно понятную модель данных, организуя их в виде многомерных кубов. Это позволяет ему проводить как сравнительный анализ показателей, так анализ различных сценариев по принципу "что-если", построенных на основе прогнозных и статистических данных компании.

 


OLAP product

Программный продукт, позволяющий выполнять быстрый анализ разделяемой многомерной информации. Пользователи должны иметь возможность проводить гибкий анализ данных либо в рамках OLAP-продукта, либо в интегрированной с ним системе.

 


OLE DB for OLAP

Разработанный корпорацией Microsoft первый действительно эффективный промышленный стандарт, который обеспечивает гибкий API, позволяющий получить доступ к OLAP-данным. OLE DB for OLAP включает полнофункциональный синтаксис выражений (многомерные выражения) для составления запросов к OLAP-серверу.


Pivot

Вращение (пивотинг) данных. Процесс вращения таблицы с данными, т. е. преобразования столбцов в строки и наоборот

 


SQL

Структурированный язык запросов (Structured Query Language). Международный стандартный язык запросов для определения доступа к реляционным базам данных. MDX -это SQL-подобный язык, предназначенный для работы с многомерными базами данных. Тем не менее, использование многомерных выражений требует определенных знаний и навыков.


Агрегирование

1. Операция объединения элементов данных, результатом которого являются данные, предоставляемые в совокупности или в форме единого результата суммирования.

2. Операция по вычислению значений, связанных с родительскими позициями в иерархических измерениях (hierarchical dimensions). Это объединение, консолидация может быть суммированием (addition), усреднением (averaging) или каким-либо другим более сложным действием для получения вторичного интересующего аналитика значения.

3. Операция консолидации значений многомерного показателя по некоторой иерархии, определенной между значениями измерения. В качестве такой операции может использоваться суммирование, вычисление среднего, определение наименьшего или наибольшего и т.п. Например, можно агрегировать значения объема продаж по измерению "Временные периоды", имея эти значения для каждого дня и суммируя их для вычисления агрегированной величины для месяцев. См. также: Консолидация

 


Гиперкуб

Многомерная конструкция, сформированная соединением нескольких измерений и предназначенная для хранения данных. Каждая ячейка определена отдельным элементом из каждого измерения.


Измерение

Один из основных объектов многомерной модели данных. Измерение - это список значений, относящихся к одному и тому же типу данных с точки зрения пользователя. Например, все дни, месяцы, кварталы и годы с точки зрения пользователя относятся к одному и тому же типу "Временные периоды"; список городов, регионов и стран образуют измерение "География". Измерения используются в качестве индексов для идентификации элементов многомерного массива (гиперкуба), в котором хранятся значения многомерных показателей. Если пользователь выбирает один элемент какого-нибудь измерения, остальные измерения, для которых указывается диапазон элементов (или все элементы), образуют подкуб. Если для всех, кроме двух, измерений указывается один элемент, оставшиеся два измерения образуют электронную таблицу ("срез" или "проекцию" куба). При выборе одного элемента для всех измерений будет определена одна единственная ячейка. Применение измерений позволяет интуитивно понятно организовать работу с данными, значительно повышая эффективность поиска, изучения и анализа информации.

 


Консолидация

Многомерные базы данных обычно характеризуются наличием в рамках каждого измерения иерархий или отношений между элементами данных, заданных с помощью формул. Консолидация подразумевает вычисление сводных показателей по этим формулам для одного или нескольких измерений - например, суммирование данных по всем отделам для получения итоговых данных по подразделению в целом. В принципе, между элементами данных может быть задан практически любой тип отношений, хотя обычно они описываются с помощью формул суммирования.

 


Куб

Многомерный массив. Группа ячеек со специальной организацией хранения - данные хранятся как совокупность измерений. Электронная таблица является примером двумерного массива, в котором ячейки данных располагаются по столбцам и строкам. Строки и столбцы в данном случае являются измерениями. Трехмерный массив данных визуально может быть представлен в виде куба, где каждое измерение формирует одну из сторон куба, включая любое подмножество (срез) данных, параллельное этой стороне. Массивы большей размерности не имеют физических аналогов и прототипов, однако они позволяют пользователям группировать информацию в естественные категории, называемые "измерениями" (например, время, продукция, географическое расположение, каналы сбыта и т. п.), которые максимально отображают реальную структуру предприятия.

 


Метаданные

Данные о данных. Метаданные представляют собой описание структуры данных и методов их обработки. Кроме того, в метаданных может содержаться дополнительная информация о базах данных, являющихся источниками и получателями информации, о сведениях, помещаемых в хранилище, а также о качестве данных в хранилище. Также метаданные включают сведения о преобразованиях данных, о дате последнего обновления и о правах доступа пользователей к информации.

 


Миникуб

Подмножество гиперкуба (содержит меньшее число измерений). Гиперкуб представляет собой совокупность однотипных миникубов.

 


Настольный OLAP

Недорогой, простой в использовании OLAP-инструментарий, предназначенный для локального анализа и представления данных.

 


Ячейка

Часть данных, получаемая путем определения одного элемента в каждом измерении многомерного массива. Ячейки гиперкуба могут быть пусты или полны. Когда значительное число ячеек куба не содержит данных, говорят, что он "разрежен"