Анализируйте в 1,51 раза больше данных в секунду для рабочих нагрузок Apache Spark™ с помощью экземпляров виртуальных машин Google Cloud™ N2

Apache Spark

  • Анализируйте больше данных в секунду с увеличением пропускной способности в 1,51 раза.

  • Оптимизируйте аналитику данных и машинное обучение в облаке.

  • Ускоряйте рабочие нагрузки с помощью энергонезависимой памяти Intel® Optane™.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Получайте аналитику из данных быстрее благодаря экземплярам виртуальных машин Google Cloud N2 на базе масштабируемых процессоров Intel® Xeon® 2-го поколения.

Рабочие нагрузки, связанные с анализом данных, машинным обучением и искусственным интеллектом, сортируют и осмысливают огромные объемы данных компании. Поскольку такие рабочие нагрузки требуют больших вычислительных затрат, для их размещения в облаке необходимо оборудование, способное решать уникальные задачи, связанные с быстрым извлечением информации из данных. Если в вашей организации работают кластеры Apache Spark, представляющие собой единую аналитическую платформу для обработки больших данных, то выбранный вами тип экземпляра виртуальной машины напрямую влияет на скорость превращения данных в действия. Для требовательных рабочих нагрузок Apache Spark экземпляры виртуальных машин Google Cloud N2, оснащенные масштабируемыми процессорами Intel® Xeon® 2-го поколения, могут увеличивать рабочие нагрузки машинного обучения для анализа данных, чтобы ваша организация могла быстро продвигаться вперед в реализации новых инициатив.

При сравнении производительности машинного обучения с кластеризацией K-Means новые виртуальные машины Google Cloud N2, оснащенные масштабируемыми процессорами Intel® Xeon® 2-го поколения, превзошли старые виртуальные машины N1 с процессорами Intel® Xeon® E5 v4, анализируя до 1,51 раза больше данных в секунду для рабочих нагрузок расширенного анализа данных Apache Spark.

Анализируйте больше данных в секунду с увеличением пропускной способности в 1,51 раза.

Облачные экземпляры все чаще поддерживают интенсивные вычислительные нагрузки, такие как анализ данных, машинное обучение и искусственный интеллект (ИИ), что весьма полезно для организаций, стремящихся к адаптивности и гибкости, которые облачные вычисления привносят в остальную часть их бизнеса.

Тесты, сравнивающие производительность кластеризации K-Means с помощью набора эталонных тестов HiBench, показали, что виртуальные машины Google Cloud N2 с масштабируемыми процессорами Intel® Xeon® 2-го поколения могут увеличивать производительность рабочих нагрузок машинного обучения Apache Spark в 1,51 раза по сравнению с виртуальными машинами N1 с процессорами Intel® Xeon® E5 v4.

Это означает, что выбор экземпляров виртуальных машин Google Cloud N2 вместо экземпляров ВМ N1 может значительно повысить скорость обработки данных в вашей организации.

Рис. 1. Сравнение относительной пропускной способности экземпляров виртуальных машин Google Cloud N1 и N2 bhn (32 виртуальных процессора / 128 ГБ оперативной памяти) для рабочих нагрузок кластеризации K-Means из набора эталонных тестов HiBench.

Новые технологии в масштабируемых процессорах Intel® Xeon® 2-го поколения оптимизируют аналитику данных

Выбор экземпляров виртуальных машин Google Cloud N2 означает доступ к ключевым технологиям, встроенным в масштабируемые процессоры Intel® Xeon® 2-го поколения, призванным оптимизировать вычислительные нагрузки, требующие углубленной аналитики данных и машинного обучения. Intel® Advanced Vector Extensions 512 (Intel® AVX-512) обрабатывает больше данных по одной команде, быстрее справляясь с вычислительными задачами и ускоряя эти расширенные рабочие нагрузки. В виртуальных машинах Google Cloud N2 с масштабируемыми процессорами Intel® Xeon® 2-го поколения предлагается технология Intel® Deep Learning Boost (Intel® DL Boost), оптимизирующая кольцевые нейронные сети для улучшения работы ИИ в 3,4 раза, что делает ее мощным инструментом для оптимизации расширенной аналитики данных и рабочих нагрузок машинного обучения. Для повышения гибкости экземпляры виртуальных машин Google Cloud N2, оснащенные масштабируемыми процессорами Intel® Xeon® 2-го поколения, также используют программируемые логические интегральные микросхемы (FPGA) Intel®, конфигурацию которых можно менять для различных моделей машинного обучения — алгоритмы последних часто меняются, чтобы ускорять операции ИИ.

Ускоряйте рабочие нагрузки с помощью энергонезависимой памяти Intel® Optane™

В экземплярах виртуальных машин Google Cloud N2, оснащенных масштабируемыми процессорами Intel® Xeon® 2-го поколения, также появилась возможность дальнейшего ускорения рабочих нагрузок анализа данных с помощью энергонезависимой памяти Intel® Optane™. Энергонезависимая память Intel® Optane™ — это комбинированная технология памяти и хранения данных, позволяющая экземплярам виртуальных машин Google Cloud N2 размещать больше данных ближе к процессору для обеспечения более низких задержек при анализе данных и в машинном обучении.

Подробнее

Чтобы начать работу с нагрузками машинного обучения Apache Spark на виртуальных машинах Google Cloud с масштабируемыми процессорами Intel® Xeon® 2-го поколения, посетите сайт http://intel.ru/GoogleCloud.