Аналитика больших данных и ИИ с использованием оптимизированного проекта Apache Spark
Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (ИИ) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области. Azure Databricks поддерживает Python, Scala, R, Java и SQL, а также библиотеки и платформы обработки и анализа данных, включая TensorFlow, PyTorch и scikit-learn.
Apache Spark™ является товарным знаком компании Apache Software Foundation.
Надежный инжиниринг данных
Крупномасштабная обработка данных для пакетных рабочих нагрузок и рабочих нагрузок с потоковой передачей.
Аналитика для всех ваших данных
Аналитика самых полных и актуальных данных.
Совместная обработка и анализ данных
Упрощение и ускорение обработки и анализа крупных наборов данных.
Открытый код в основе
Быстрая и оптимизированная среда Apache Spark.
Приступите к работе в кратчайшие сроки с оптимизированной средой Apache Spark
Azure Databricks предоставляет последние версии Apache Spark и обеспечивает тесную интеграцию с открытыми библиотеками. Ускорьте запуск кластеров и разработку в полностью управляемой среде Apache Spark благодаря глобальному масштабу и доступности платформы Azure. Кластеры устанавливаются, настраиваются и оптимизируются, чтобы обеспечить надежность и производительность без необходимости в мониторинге. Воспользуйтесь возможностями автомасштабирования и автоматического завершения, чтобы снизить совокупную стоимость владения.
Повысьте продуктивность, используя общую рабочую область и распространенные языки
Организуйте эффективное сотрудничество на открытой унифицированной платформе, позволяющей выполнять все типы рабочих нагрузок аналитики, кем бы вы ни были — специалистом по обработке и анализу данных, инженером данных или бизнес-аналитиком. Выбирайте для разработки любой язык, например Python, Scala, R или SQL. Легко управляйте версиями записных книжек с помощью GitHub и Azure DevOps.
Эффективное машинное обучение с задействованием больших данных
Получите доступ к расширенным возможностям автоматизированного машинного обучения, используя интегрированную службу "Машинное обучение Azure", позволяющую быстро определять подходящие алгоритмы и гиперпараметры. Упростите контроль, мониторинг и обновление моделей машинного обучения, развернутых из облака на пограничные устройства. Служба "Машинное обучение Azure" также предлагает центральный реестр для ваших экспериментов, конвейеров машинного обучения и моделей.
Получите высокопроизводительное современное хранилище данных
Совмещайте данные в любом масштабе и получайте полезные сведения из аналитических панелей мониторинга и эксплуатационных отчетов. Автоматизируйте перемещение данных с помощью службы "Фабрика данных Azure", а затем загружайте данные в Azure Data Lake Storage, преобразуйте и очищайте их с помощью Azure Databricks, а также делайте их доступными для аналитики с помощью Azure Synapse Analytics. Модернизируйте свое хранилище данных в облаке, чтобы обеспечить непревзойденные уровни производительности и масштабируемости.
Основные возможности службы
-
Оптимизированное ядро Spark
Простая обработка данных в автомасштабируемой инфраструктуре на основе высокооптимизированного решения Apache Spark™ позволяет увеличить производительность в 50 раз.
-
Среда выполнения машинного обучения
Доступ одним щелчком к предварительно настроенным средам машинного обучения позволяет использовать расширенные функции машинного обучения на современных и популярных платформах, таких как PyTorch, TensorFlow и scikit-learn.
-
MLflow
Отслеживайте эксперименты и делитесь ими, воспроизводите запуски и совместно управляйте моделями из центрального репозитория.
-
Выбор языка
Используйте удобный для вас язык, включая Python, Scala, R, Spark SQL и .NET, независимо от того, применяете ли вы бессерверные или подготовленные вычислительные ресурсы.
-
Совместная работа с записными книжками
Быстро получайте доступ к данным и изучайте их, находите полезные сведения и делитесь ими, а также совместно создавайте модели с помощью удобных для вас языков и инструментов.
-
Delta Lake
Обеспечьте надежность и масштабируемость существующего озера данных с помощью транзакционного уровня хранилища с открытым кодом, разработанного для всего жизненного цикла данных.
-
Интеграция платформенной функциональности со службами Azure
Дополните свое комплексное решение аналитики и машинного обучения глубокой интеграцией со службами Azure, такими как Фабрика данных, Azure Data Lake Storage, Машинное обучение Azure и Power BI.
-
Интерактивные рабочие области
Организуйте совместную работу инженеров данных, бизнес-аналитиков и специалистов по обработке и анализу данных.
-
Безопасность корпоративного уровня
Автоматическая встроенная система безопасности защищает ваши данные в месте их хранения и создает соответствующие требованиям частные изолированные рабочие области аналитики для тысяч пользователей и наборов данных.
-
Готовность к выпуску
Запускайте и масштабируйте свои критически важные рабочие нагрузки данных на надежной платформе с интеграцией экосистемы для CI/CD и мониторинга.
Примеры архитектуры решений
Обработка и анализ данных и машинное обучение с использованием Azure Databricks
С легкостью получайте информацию из оперативных потоковых данных. Непрерывно собирайте данные с любых IoT-устройств или журналов кликов на веб-сайтах и обрабатывайте их в режиме реального времени.
Архитектура современной аналитики с Azure Databricks
Преобразуйте свои данные в ценные практические сведения, используя лучшие в своем классе средства машинного обучения. Эта архитектура позволяет комбинировать любые данные при любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения с масштабированием.
Конвейеры приема данных, извлечения, преобразования и загрузки, а также потоковой обработки с использованием Azure Databricks
Ускорьте комплексный жизненный цикл машинного обучения и управляйте им с помощью Azure Databricks, MLflow и Машинного обучения Azure для создания, совместного использования, развертывания приложений машинного обучения и управления ими.
Комплексные встроенные средства обеспечения безопасности и соответствия требованиям
-
Корпорация Майкрософт ежегодно инвестирует более 1 млрд USD в исследования и разработку решений для кибербезопасности.
-
У нас работает более 3500 специалистов по безопасности, которые посвятили себя защите данных и обеспечению их конфиденциальности.
-
У Azure больше сертификатов, чем у любого другого поставщика облачных служб. Ознакомьтесь с полным списком.
Подробнее о продуктах и службах Azure Databricks
Фабрика данных Azure
Служба гибридной интеграции данных, которая упрощает извлечение, преобразование и загрузку данных в нужном масштабе.
Azure Data Lake Storage 2-го поколения
Надежное хранилище Data Lake Storage с высокой степенью масштабируемости, созданное на основе хранилища BLOB-объектов Azure.
Машинное обучение Azure
Служба машинного обучения корпоративного уровня для быстрого создания и развертывания моделей.
Power BI
Добавьте в свои приложения возможности аналитики и создания интерактивных отчетов.
-
Цены на Azure Databricks
Быстро запускайте кластеры, а также автоматически увеличивайте и уменьшайте масштаб в соответствии с потребностями. Ознакомьтесь со всеми вариантами цен на Azure Databricks.
Начните работу с бесплатной учетной записью Azure
1
2
Чтобы продолжать работу с этими службами, когда кредит будет израсходован, перейдите на оплату по мере использования. Плата будет взиматься только при использовании служб сверх предоставляемого бесплатно ежемесячного объема.
3
Сообщество и служба поддержки Azure
Задавайте вопросы и получайте ответы на них от специалистов Майкрософт и экспертов сообщества Azure на форумах MSDN и Stack Overflow или обратитесь в службу поддержки Azure.
Популярные задания и шаблоны
Изучите практические задания для самостоятельной работы и популярные шаблоны быстрого запуска для распространенных конфигураций , созданные специалистами Майкрософт и участниками сообщества.
Смотреть ресурсы, посвященные Azure Databricks
Часто задаваемые вопросы об Azure Databricks
-
Соглашение об уровне обслуживания Azure Databricks гарантирует доступность на протяжении 99,95 % времени.
-
Единица Databricks (DBU) — это единица обработки данных в час, использование которой тарифицируется посекундно.
-
Рабочая нагрузка инжиниринга данных — это задание, которое автоматически запускает и отключает кластер, в котором оно выполняется. Например, рабочую нагрузку может активировать планировщик заданий Azure Databricks, который запускает кластер Apache Spark исключительно для этого задания и автоматически завершает работу кластера после выполнения задания.
Рабочая нагрузка аналитики данных не автоматизирована. Например, команды в записных книжках Azure Databricks выполняются в кластерах Apache Spark, пока они не будут остановлены вручную. Несколько пользователей могут использовать один кластер для совместного анализа.