Azure Databricks

Проектируйте решения искусственного интеллекта с использованием аналитики на базе Apache Spark™.

Бесплатная пробная версия Azure Учетная запись с оплатой по мере использования

Аналитика больших данных и ИИ с использованием оптимизированного проекта Apache Spark

Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (ИИ) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области. Azure Databricks поддерживает Python, Scala, R, Java и SQL, а также библиотеки и платформы обработки и анализа данных, включая TensorFlow, PyTorch и scikit-learn.

Apache Spark™ является товарным знаком компании Apache Software Foundation.

Прием данных и оркестрация с помощью Фабрики данных Azure. Подготовка, преобразование и обогащение данных с помощью Azure Databricks. Предоставление данных с помощью Azure Synapse Analytics. Хранение данных в Azure Data Lake Storage. Визуализация с помощью Power BI.

Новое объявление: сэкономьте до 52 % при переходе на Azure Databricks. Подробнее

Надежный инжиниринг данных

Крупномасштабная обработка данных для пакетных рабочих нагрузок и рабочих нагрузок с потоковой передачей.

Аналитика для всех ваших данных

Аналитика самых полных и актуальных данных.

Совместная обработка и анализ данных

Упрощение и ускорение обработки и анализа крупных наборов данных.

Открытый код в основе

Быстрая и оптимизированная среда Apache Spark.

Приступите к работе в кратчайшие сроки с оптимизированной средой Apache Spark

Azure Databricks предоставляет последние версии Apache Spark и обеспечивает тесную интеграцию с открытыми библиотеками. Ускорьте запуск кластеров и разработку в полностью управляемой среде Apache Spark благодаря глобальному масштабу и доступности платформы Azure. Кластеры устанавливаются, настраиваются и оптимизируются, чтобы обеспечить надежность и производительность без необходимости в мониторинге. Воспользуйтесь возможностями автомасштабирования и автоматического завершения, чтобы снизить совокупную стоимость владения.

Читать документацию по Azure Databricks

Пользователь создает новый кластер в Azure Databricks.

Общие сведения об Apache Spark в Databricks

Повысьте продуктивность, используя общую рабочую область и распространенные языки

Организуйте эффективное сотрудничество на открытой унифицированной платформе, позволяющей выполнять все типы рабочих нагрузок аналитики, кем бы вы ни были — специалистом по обработке и анализу данных, инженером данных или бизнес-аналитиком. Выбирайте для разработки любой язык, например Python, Scala, R или SQL. Легко управляйте версиями записных книжек с помощью GitHub и Azure DevOps.

Узнайте, как создать рабочую область Azure Databricks

Эффективное машинное обучение с задействованием больших данных

Получите доступ к расширенным возможностям автоматизированного машинного обучения, используя интегрированную службу "Машинное обучение Azure", позволяющую быстро определять подходящие алгоритмы и гиперпараметры. Упростите контроль, мониторинг и обновление моделей машинного обучения, развернутых из облака на пограничные устройства. Служба "Машинное обучение Azure" также предлагает центральный реестр для ваших экспериментов, конвейеров машинного обучения и моделей.

Смотреть вебинар, посвященный Azure Databricks и службе "Машинное обучение Azure"

Рабочее пространство под названием "Модель машинного обучения" с Scikit-Learn в Azure Databricks

Прогноз относительно потребности в масштабировании в Azure Databricks.

Получите высокопроизводительное современное хранилище данных

Совмещайте данные в любом масштабе и получайте полезные сведения из аналитических панелей мониторинга и эксплуатационных отчетов. Автоматизируйте перемещение данных с помощью службы "Фабрика данных Azure", а затем загружайте данные в Azure Data Lake Storage, преобразуйте и очищайте их с помощью Azure Databricks, а также делайте их доступными для аналитики с помощью Azure Synapse Analytics. Модернизируйте свое хранилище данных в облаке, чтобы обеспечить непревзойденные уровни производительности и масштабируемости.

Подробнее об аналитике в масштабе облака в Azure

Основные возможности службы

Оптимизированное ядро Spark

Простая обработка данных в автомасштабируемой инфраструктуре на основе высокооптимизированного решения Apache Spark™ позволяет увеличить производительность в 50 раз.
Среда выполнения машинного обучения

Доступ одним щелчком к предварительно настроенным средам машинного обучения позволяет использовать расширенные функции машинного обучения на современных и популярных платформах, таких как PyTorch, TensorFlow и scikit-learn.

MLflow

Отслеживайте эксперименты и делитесь ими, воспроизводите запуски и совместно управляйте моделями из центрального репозитория.
Выбор языка

Используйте удобный для вас язык, включая Python, Scala, R, Spark SQL и .NET, независимо от того, применяете ли вы бессерверные или подготовленные вычислительные ресурсы.

Совместная работа с записными книжками

Быстро получайте доступ к данным и изучайте их, находите полезные сведения и делитесь ими, а также совместно создавайте модели с помощью удобных для вас языков и инструментов.
Delta Lake

Обеспечьте надежность и масштабируемость существующего озера данных с помощью транзакционного уровня хранилища с открытым кодом, разработанного для всего жизненного цикла данных.

Интеграция платформенной функциональности со службами Azure

Дополните свое комплексное решение аналитики и машинного обучения глубокой интеграцией со службами Azure, такими как Фабрика данных, Azure Data Lake Storage, Машинное обучение Azure и Power BI.
Интерактивные рабочие области

Организуйте совместную работу инженеров данных, бизнес-аналитиков и специалистов по обработке и анализу данных.

Безопасность корпоративного уровня

Автоматическая встроенная система безопасности защищает ваши данные в месте их хранения и создает соответствующие требованиям частные изолированные рабочие области аналитики для тысяч пользователей и наборов данных.
Готовность к выпуску

Запускайте и масштабируйте свои критически важные рабочие нагрузки данных на надежной платформе с интеграцией экосистемы для CI/CD и мониторинга.

Примеры архитектуры решений

Обработка и анализ данных и машинное обучение с использованием Azure Databricks

С легкостью получайте информацию из оперативных потоковых данных. Непрерывно собирайте данные с любых IoT-устройств или журналов кликов на веб-сайтах и обрабатывайте их в режиме реального времени.

Архитектура современной аналитики с Azure Databricks

Преобразуйте свои данные в ценные практические сведения, используя лучшие в своем классе средства машинного обучения. Эта архитектура позволяет комбинировать любые данные при любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения с масштабированием.

Конвейеры приема данных, извлечения, преобразования и загрузки, а также потоковой обработки с использованием Azure Databricks

Ускорьте комплексный жизненный цикл машинного обучения и управляйте им с помощью Azure Databricks, MLflow и Машинного обучения Azure для создания, совместного использования, развертывания приложений машинного обучения и управления ими.

Комплексные встроенные средства обеспечения безопасности и соответствия требованиям

Корпорация Майкрософт ежегодно инвестирует более 1 млрд USD в исследования и разработку решений для кибербезопасности.

У нас работает более 3500 специалистов по безопасности, которые посвятили себя защите данных и обеспечению их конфиденциальности.

У Azure больше сертификатов, чем у любого другого поставщика облачных служб. Ознакомьтесь с полным списком.

Подробнее о безопасности в Azure

Подробнее о продуктах и службах Azure Databricks

Фабрика данных Azure

Служба гибридной интеграции данных, которая упрощает извлечение, преобразование и загрузку данных в нужном масштабе.

Azure Data Lake Storage 2-го поколения

Надежное хранилище Data Lake Storage с высокой степенью масштабируемости, созданное на основе хранилища BLOB-объектов Azure.

Машинное обучение Azure

Служба машинного обучения корпоративного уровня для быстрого создания и развертывания моделей.

Power BI

Добавьте в свои приложения возможности аналитики и создания интерактивных отчетов.

Цены на Azure Databricks

Быстро запускайте кластеры, а также автоматически увеличивайте и уменьшайте масштаб в соответствии с потребностями. Ознакомьтесь со всеми вариантами цен на Azure Databricks.

Подробнее о ценах

Начните работу с бесплатной учетной записью Azure

Начните работу бесплатно. Получите на свой счет 200 USD, которые можно использовать в течение 30 дней. При наличии денег на счете вы можете бесплатно работать со многими нашими популярными службами в определенном объеме. Еще более 55 других служб будут всегда доступны вам бесплатно в рамках обозначенного объема.

Чтобы продолжать работу с этими службами, когда кредит будет израсходован, перейдите на оплату по мере использования. Плата будет взиматься только при использовании служб сверх предоставляемого бесплатно ежемесячного объема.

По истечении 12 месяцев вам все еще будут доступны более 55 служб, которые всегда предоставляются бесплатно. При этом вы по-прежнему будете платить только за те ресурсы, которые используете сверх бесплатно предоставляемого ежемесячного объема.

Сообщество и служба поддержки Azure

Задавайте вопросы и получайте ответы на них от специалистов Майкрософт и экспертов сообщества Azure на форумах MSDN и Stack Overflow или обратитесь в службу поддержки Azure.

Смотреть ресурсы, посвященные Azure Databricks

Вебинары

Управляйте жизненным циклом машинного обучения с помощью Azure Databricks и решения "Машинное обучение Azure"

Рекомендации по Azure Databricks

Узнайте, как ускорить внедрение инноваций на основе данных

Отчет

Скачайте отчет о цикле зрелости технологий Gartner для обработки и анализа данных, а также машинного обучения

Часто задаваемые вопросы об Azure Databricks

Соглашение об уровне обслуживания Azure Databricks гарантирует доступность на протяжении 99,95 % времени.
Единица Databricks (DBU) — это единица обработки данных в час, использование которой тарифицируется посекундно.
Рабочая нагрузка инжиниринга данных — это задание, которое автоматически запускает и отключает кластер, в котором оно выполняется. Например, рабочую нагрузку может активировать планировщик заданий Azure Databricks, который запускает кластер Apache Spark исключительно для этого задания и автоматически завершает работу кластера после выполнения задания.

Рабочая нагрузка аналитики данных не автоматизирована. Например, команды в записных книжках Azure Databricks выполняются в кластерах Apache Spark, пока они не будут остановлены вручную. Несколько пользователей могут использовать один кластер для совместного анализа.

Бесплатная учетная запись Azure готова к настройке в любой момент

Бесплатная пробная версия Azure