Анализируйте почти в 1.55 раза больше данных в секунду для рабочих нагрузок Apache Spark™ с ВМ Microsoft® Azure® Dds_v4 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения

Apache Spark

  • Анализируйте больше данных в секунду с увеличенной в 1.23 раза пропускной способностью на небольших ВМ.

  • Увеличение пропускной способности в 1.46 раза на средних ВМ.

  • Увеличение пропускной способности в 1.55 раза на больших ВМ.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Ускорьте выполнение рабочих нагрузок машинного обучения с помощью ВМ Microsoft Azure серии Dds_v4 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения

Интерпретация больших объемов данных, собираемых вашей организацией, -большая задача, которая требует наличия обновленной технологии для быстрого выполнения работы. Облачные ВМ Microsoft Azure, выбранные для размещения кластеров Apache Spark, определяют, насколько быстро можно получить практически значимую информацию из ваших данных и превратить ее в бизнес-стратегию. Для ресурсоемких рабочих нагрузок машинного обучения Apache Spark на Microsoft Azure выбор ВМ Dds_v4 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения может позволить анализировать больше данных в секунду для повышения динамичности вашего бизнеса.

При тестировании двух реализаций машинного обучения, где сравнивались ВМ Microsoft Azure, более новые ВМ серии Dds_v4 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения превзошли более старые ВМ серии Ds_v3 с процессорами Intel® Xeon® E5 v4, анализируя почти в 1.55 раза больше данных в секунду для рабочих нагрузок машинного обучения Apache Spark.

Среди небольших, средних и больших размеров предпочтение ВМ серии Dds_v4 с масштабируемыми процессорами Intel® Xeon® 2-го поколения более старым ВМ Ds_v3 может позволить сортировать больше данных быстрее и оперативно принимать бизнес-решения на основе правдивости этих данных.

Предприятия малого бизнеса быстрее получают аналитическую информацию с помощью небольших ВМ

Размер организации вовсе не влияет на потребности в машинном обучении. Для потребностей машинного обучения с большим объемом данных на небольших ВМ выбор обновленной технологии может гарантировать, что ВМ соответствуют текущим требованиям и обеспечивают возможности роста.

Тесты, в которых сравниваются небольшие ВМ с 8 виртуальными процессорами, показывают, что при выборе ВМ Microsoft Azure Dds_v4 с масштабируемыми процессорами Intel® Xeon® 2-го поколения рабочие нагрузки машинного обучения Apache Spark могут обрабатывать почти в 1.23 раза больше данных в секунду, чем ВМ серии Ds_v3 с процессорами Intel® Xeon® E5 v4.

Рисунок 1. Сравнение относительной пропускной способности на небольших ВМ (8 виртуальных процессоров/ОЗУ 32 ГБ) для классификации Naïve Bayesian и рабочих нагрузок кластеризации методом k-средних из набора эталонных тестов HiBench.

Предприятия среднего бизнеса быстрее получают аналитическую информацию с помощью средних ВМ

Как и при тестировании ВМ небольшого размера, тесты, в которых сравниваются средние ВМ с 16 виртуальными процессорами, показали, что ВМ Microsoft Azure Dds_v4 с масштабируемыми процессорами Intel® Xeon® 2-го поколения улучшили реализацию машинного обучения Naïve Bayesian и кластеризации методом k-средних на Apache Spark-в этом случае обеспечивая почти в 1.46 раза выше пропускную способность по сравнению с более старыми ВМ Ds_v3.

Рисунок 2. Сравнение относительной пропускной способности на средних ВМ (16 виртуальных процессоров/ОЗУ 64 ГБ) для классификации Naïve Bayesian и рабочих нагрузок кластеризации методом k-средних из набора эталонных тестов HiBench.

Предприятия быстрее получают аналитическую информацию с помощью больших ВМ

Тестирование показывает, что самого большого увеличения пропускной способности для производительности машинного обучения Apache Spark можно добиться с помощью больших экземпляров (с 64 виртуальными процессорами), которые обеспечивают повышение пропускной способности ВМ серии Ds_v3 почти в 1.55 раза для теста классификации Naïve Bayesian.

По сравнению с более старыми ВМ серии Ds_v3 Microsoft Azure Dds_v4 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения обеспечивают значительное повышение производительности, предлагают диски по умолчанию на 50% большего объема и обеспечивают высокую скорость операций ввода-вывода на дисках по умолчанию, независимо от того, какого размера требуются для них ВМ. Это позволяет ВМ Azure Dds_v4 улучшить машинное обучение по сравнению с серией Ds_v3 при различных размерах ВМ.

Рисунок 3. Сравнение относительной пропускной способности на больших ВМ (64 виртуальных процессора/ОЗУ 256 ГБ) для классификации Naïve Bayesian и рабочих нагрузок кластеризации методом k-средних из набора эталонных тестов HiBench.

Подробнее

Чтобы начать рабочие нагрузки машинного обучения Apache Spark на ВМ Microsoft Azure серии Dds_v4 с масштабируемыми процессорами Intel® Xeon® 2-го поколения, посетите веб-сайт http://intel.ru/Azure.

Подробная информация о тестировании на веб-сайте http://facts.pt/pg16MAO.