Бизнес-пользователи в значительной степени полагаются на централизованно управляемые источники данных, созданные группами информационных технологий (ИТ), но ИТ-отделу могут потребоваться месяцы, чтобы внести изменения в заданный источник данных. В ответ пользователи часто прибегают к созданию собственных витрин данных с базами данных Access, локальными файлами, сайтами SharePoint и электронными таблицами, что приводит к отсутствию управления и надлежащего контроля для обеспечения поддержки таких источников данных и их приемлемой производительности.
Витрины данных помогают преодолеть разрыв между бизнес-пользователями и ИТ-специалистами. Витрины данных — это аналитические решения самообслуживания, позволяющие пользователям хранить и исследовать данные, загружаемые в полностью управляемую базу данных. Витрины данных обеспечивают простой и, при необходимости, не требующий написания кода опыт приема данных из различных источников данных, извлечения, преобразования и загрузки (ETL) данных с помощью Power Query, а затем загрузки их в полностью управляемую базу данных Azure SQL, которая не требует настройки или оптимизации.
После загрузки данных в витрину данных вы можете дополнительно определить отношения и политики для бизнес-аналитики и анализа. Витрины данных автоматически создают набор данных или семантическую модель, которые можно использовать для создания отчетов и панелей мониторинга Power BI. Вы также можете запросить витрину данных, используя конечную точку T-SQL или визуальный интерфейс.
Витрины данных предлагают следующие преимущества:
- Пользователи самообслуживания могут легко выполнять аналитику реляционной базы данных без необходимости в администраторе базы данных.
- Витрины данных обеспечивают сквозной прием, подготовку и исследование данных с помощью SQL, включая возможности без кода.
- Возможность создания семантических моделей и отчетов в рамках единого целостного интерфейса.
Возможности Datamart:
- 100% веб-интерфейс, никакого другого программного обеспечения не требуется
- Опыт без кода, приводящий к полностью управляемой витрине данных
- Автоматическая настройка производительности
- Встроенный визуальный редактор и редактор SQL-запросов для специального анализа.
- Поддержка SQL и других популярных клиентских инструментов
- Встроенная интеграция с Power BI, Microsoft Office и другими аналитическими решениями Microsoft.
- Включено в мощности Power BI Premium и Premium Per User
Когда использовать витрины данныхВитрины данных ориентированы на интерактивные рабочие нагрузки данных для сценариев самообслуживания. Например, если вы работаете в области бухгалтерского учета или финансов, вы можете создавать свои собственные модели данных и коллекции, которые затем можно использовать для самообслуживания бизнес-вопросов и ответов с помощью T-SQL и визуальных запросов. Кроме того, вы по-прежнему можете использовать эти коллекции данных для более традиционных отчетов Power BI. Витрины данных рекомендуются для клиентов, которым требуется доменно-ориентированное, децентрализованное владение данными и архитектура, например пользователям, которым нужны данные как продукт или платформа данных самообслуживания.
Витрины данных предназначены для поддержки следующих сценариев:
- Данные отдела для самообслуживания: централизуйте небольшие и средние объемы данных (примерно 100 ГБ) в полностью управляемой базе данных SQL с самообслуживанием. Витрины данных позволяют выделить единое хранилище для самообслуживания для последующих отчетов отдела (например, Excel, отчеты Power BI и т. д.), тем самым уменьшая инфраструктуру в решениях самообслуживания.
- Аналитика реляционных баз данных с помощью Power BI: доступ к данным витрины данных с помощью внешних клиентов SQL. Azure Synapse и другие службы/инструменты, использующие T-SQL, также могут использовать витрины данных в Power BI.
- Сквозные семантические модели. Позвольте разработчикам Power BI создавать комплексные решения, не завися от других инструментов или ИТ-команд. Datamarts избавляет от необходимости управлять согласованием между потоками данных и наборами данных с помощью автоматически созданных наборов данных, предоставляя при этом визуальные возможности для запроса данных и специального анализа, и все это поддерживается базой данных SQL Azure.
В следующей таблице описаны эти предложения и наилучшее использование каждого из них, включая их роль в витринах данных.
Элемент Рекомендуемый вариант использования Дополняющая роль с витринами данных Витрины данных Пользовательское хранилище данных и SQL-доступ к вашим данным Витрины данных можно использовать в качестве источников для других витрин данных или элементов, используя конечную точку SQL:
- Внешний обмен
- Совместное использование за пределами отдела или организации с включенной безопасностью
Потоки данных Повторно используемая подготовка данных (ETL) для наборов данных или витрин Витрины данных используют единый встроенный поток данных для ETL. Потоки данных могут подчеркнуть это, позволяя:
- Загрузка данных в витрины данных с разными расписаниями обновления
- Отделение этапов ETL и подготовки данных от хранилища, чтобы их можно было повторно использовать в наборах данных.
Наборы данных Метрики и семантический уровень для отчетов BI Витрины данных предоставляют автоматически сгенерированный набор данных для отчетов, что позволяет:
- Объединение данных из нескольких источников
- Выборочный общий доступ к таблицам киоска данных для детализированных отчетов
- Составные модели — набор данных с данными из витрины данных и других источников данных за пределами витрины данных.
- Прокси-модели — набор данных, использующий DirectQuery для автоматически сгенерированной модели с использованием единого источника достоверности.
Интеграция витрин данных и потоков данныхВ некоторых случаях может быть полезно объединить потоки данных и витрины данных в одном решении. В следующих ситуациях может оказаться выгодным включение как потоков данных, так и витрин данных:
- Для решений с существующими потоками данных:
- Легко используйте данные с помощью киосков данных, чтобы применить любые дополнительные преобразования или включить специальный анализ и запросы с использованием SQL-запросов.
- Простая интеграция решения для хранения данных без кода без управления наборами данных
- Для решений с существующими витринами данных:
- Выполняйте многократное извлечение, преобразование и загрузку (ETL) в масштабе для больших объемов данных
- Создайте собственное озеро данных и используйте потоки данных в качестве конвейера для витрин данных