UCloud увеличивает скорость обработки пакетов в 5 раз1 с помощью технологий Intel®

Основные выводы

  • Игры, электронные продажи и отрасли розничной торговли требуют большого количества высокочастотных передач небольших пакетов данных.

  • Поставщики облачных услуг (CSP), которые способны удовлетворить данный спрос, могут воспользоваться значительными коммерческими возможностями в этом секторе.

  • UCloud увеличил возможности обработки пакетов в рамках платформы Net-Enhanced UHost в 5 раз1, используя масштабируемые процессоры Intel® Xeon® 2-го поколения, SSD-накопители Intel® и 25GbE Intel® Ethernet.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Для предоставления облачных услуг таким отраслям, как сетевые игры, электронные продажи и розничная торговля, нужно соответствовать высоким требованиям. Эти отрасли часто требуют большого количества высокочастотных передач небольших пакетов данных, чтобы соответствовать ожиданиям их клиентов. Удовлетворение этого конкретного требования компаний, ориентированных на клиентов, может быть непростой задачей и создавать нагрузку для точек входа/выхода сети.

Одна из ведущих компьютерных компаний в Китае, UCloud, предоставляет облачные услуги целому ряду предприятий из сферы потребительских услуг, обеспечивая инфраструктуру, платформу, искусственный интеллект и платформы для работы с большими объемами данных. Компания хотела улучшить свои возможности обработки пакетов в рамках выпуска нового решения Net-Enhanced UHost, чтобы предложить своим клиентам более быстрый и конкурентоспособный продукт.

Мы выбрали масштабируемые процессоры Intel® Xeon® Next-Generation из-за их способности обеспечивать высокую тактовую частоту и надежную вычислительную мощность, что позволяет нам модернизировать процессы в соответствии с требованиями наших клиентов. Наше новое решение Net-Enhanced UHost может эффективно решать пиковые задачи клиентов в сфере электронной торговли и игр.

Благодаря использованию в своем решении Net-Enhanced UHost масштабируемых процессоров Intel® Xeon® 2-го поколения UCloud удалось запустить его с возможностью обработки до 5 миллионов пакетов в секунду (pps). Это в пять раз быстрее, чем у предыдущего поколения UHost1. Кроме того, компания UCloud обновила свою инфраструктуру с помощью SSD-накопителей Intel® с поддержкой до 24,000 IOPS и 25GbE Intel® Ethernet, что помогает UCloud соответствовать требованиям пикового сетевого трафика.

Подробнее о масштабируемых процессорах Intel® Xeon® 2-го поколения

Масштабируемые процессоры Intel® Xeon® 2-го поколения обеспечивают основу для мощного решения, ориентированного на обработку данных, что представляет новый этап в развитии адаптивности и масштабируемости. Эти инновационные процессоры устанавливают новый стандарт для конвергенции и функциональности платформ в области вычислений, хранения данных, памяти, сети и безопасности. Организации и поставщики услуг в сфере облачных технологий и коммуникаций теперь могут запускать самые смелые цифровые проекты благодаря универсальной и многофункциональной платформе.

  • Повышение скорости обработки логических выводов в 30 раз с процессором Intel® Xeon® Platinum 9282 (56 ядер) с технологией Intel® Deep Learning Boost (Intel® DL Boost) для ResNet-50 (рабочая нагрузка по классификации изображений) с использованием Intel® Optimization for Caffe* по сравнению с процессором Intel® Xeon® Platinum 8180 при запуске2
  • Увеличение в 2 раза емкости памяти системы и поддержка до 36ТБ на 8-разъемных системах с энергонезависимой памятью Intel® Optane™ DC3
  • Среднее увеличение производительности в 2 раза на серверах с двумя процессорами с новым процессором Intel® Xeon® Platinum 92004
  • Среднее увеличение производительности в 1,33 раза на процессоре Intel® Xeon® Gold5

Уведомления и отказ от ответственности

Программное обеспечение и рабочие задачи, используемые в тестах оценки производительности, могли быть оптимизированы для обеспечения высокой производительности только с микропроцессорами Intel®. // Тесты производительности, такие как SYSmark и MobileMark, проводятся для конкретных конфигураций вычислительных систем, компонентов, программного обеспечения, операций и функций. Любые изменения этих параметров могут привести к изменению конечных результатов. При принятии решения о покупке следует обращаться к другим источникам информации и тестам производительности, в том числе к информации о производительности этого продукта по сравнению с другими продуктами. Подробную информацию ищите на http://www.intel.ru/performance. // Intel не контролирует и не проверяет сторонние данные тестов и сайты, упомянутые в настоящем документе. // Результаты тестов производительности основаны на тестировании по состоянию на дату, указанную в конфигурациях, и могут не отражать всех общедоступных обновлений безопасности. Подробная информация представлена в описании конфигурации. Ни один продукт или компонент не может обеспечить абсолютную защиту. // Intel не контролирует и не проверяет сторонние данные. Для проверки точности данных, доступных по ссылкам, просмотрите этот контент и обратитесь к другим источникам. // Доступность функций и преимуществ технологий Intel® зависит от конфигурации системы, а для их работы может потребоваться оборудование, программное обеспечение или активация сервисов. Значения производительности могут изменяться в зависимости от конфигурации системы. Ни один продукт или компонент не может обеспечить абсолютную защиту. Проконсультируйтесь с производителем или продавцом системы. Подробная информация также представлена на веб-сайте intel.ru. // Intel, логотип Intel, Xeon и Optane являются товарными знаками корпорации Intel или ее подразделений в США и/или других странах. // *Другие наименования и товарные знаки являются собственностью своих законных владельцев. // © Корпорация Intel.

Информация о продукте и производительности

1

Данные предоставлены компанией UCloud и основаны на результатах внутренних тестов. Для получения дополнительной информации обратитесь в компанию UCloud.

2

Повышение скорости обработки логических выводов в 30 раз по результатам тестирования системы на базе процессора Intel® Xeon® Platinum 9282 с использованием технологии Intel® Deep Learning Boost: Протестировано в корпорации Intel 26 февраля 2019 года. Платформа: 2-сокетный процессор Intel® Xeon® Platinum 9282 Dragon Rock (56 ядер на разъем), технология HT включена, режим turbo включен, общая емкость памяти 768 ГБ (24 модуля/32 ГБ/2933 МГц), BIOS: SE5C620.86B.0D.01.0241.112020180249, CentOS* 7 с ядром 3.10.0-957.5.1.el7.x86_64, платформа глубинного обучения: оптимизация Intel® для Caffe* версии: https://github.com/intel/caffe d554cbf1, ICC 2019.2.187, MKL DNN версии: v0.17 (хэш фиксации: 830a10059a018cd2634d94195140cf2d8790a75a), модель: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt, BS=64, нет синтетических данных уровня данных: 3x224x224, 56 экземпляров/2 разъема, тип данных: INT8 по сравнению с конфигурацией, протестированной Intel 11 июля 2017 года: 2-сокетный процессор Intel® Xeon® Platinum 8180 с тактовой частотой 2,50 ГГц (28 ядер), технология HT отключена, режим turbo отключен, для управления масштабированием установлен режим «производительность» с помощью драйвера intel_pstate, ОЗУ DDR4-2666 ECC емкостью 384 ГБ. ОС CentOS* Linux версии 7.3.1611 (основная), ядро Linux 3.10.0-514.10.2.el7.x86_64. Твердотельный накопитель: твердотельный накопитель Intel® DC серии S3700 (800 ГБ, 2,5 дюйма, SATA, 6 Гбит/с, 25 нм, MLC). Измерение производительности: переменные среды: KMP_AFFINITY=’granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance. Caffe: (http://github.com/intel/caffe/), версия f96b759f71b2281835f690af267158b82b150b5c. Логические выводы измерялись с помощью команды «caffe time --forward_only», обучение измерялось с помощью команды «caffe time». Для топологий «ConvNet» использовался синтетический набор данных. Для других топологий данные были сохранены в локальном хранилище и закэшированы в памяти до начала обучения. Спецификации топологий https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50). Компилятор Intel® C++ версии 17.0.2 20170213, малые библиотеки Intel® Math Kernel Library (Intel® MKL) версии 2018.0.20170425. ПО Caffe выполнялось с «numactl -l».

3

Увеличение емкости системной памяти в 2 раза обусловлено тем, что половина каналов памяти заполнена энергонезависимой памятью Intel® Optane™ DC с использованием продукции, которая в 2 раза увеличивает максимальную емкость всей памяти DRAM. Пример приводится для 8-процессорной системы, предоставляющей 96 разъемов для памяти: емкость 36 ТБ = 48 разъемов, заполненных модулями энергонезависимой памяти Intel® Optane™ DC емкостью 512 ГБ, и 48 разъемов, заполненных модулями DRAM DIMM емкостью 256 ГБ.

4

Среднее увеличение производительности в 2 раза: на серверах с двумя процессорами Intel® Xeon® Platinum 9200 2-го поколения. Среднее геометрическое результатов эталонных тестов est SPECrate2017_int_base, est SPECrate2017_fp_base, STREAM-Triad, Intel® Distribution for LINPACK*, Java* на стороне сервера. Сравнение Platinum 92xx и Platinum 8180. Базовая конфигурация: 1 узел, 2 процессора Intel® Xeon® Platinum 8180 на платформе Wolf Pass с общей емкостью памяти 384 ГБ (12 модулей по 32 ГБ 2666), ucode 0x200004D на RHEL7.6, 3.10.0-957.el7.x86_64, IC19u1, AVX512, технология HT включена (Stream, LINPACK отключены), режим Turbo включен (Stream, LINPACK отключены), результат: пропускная способность при выполнении целочисленных операций = 307, пропускная способность при выполнении операций с плавающей запятой = 251, STREAM-Triad = 204, LINPACK = 3238, Java на стороне сервера = 165724, тест проведен Intel 29.01.2019. Новая конфигурация: 1 узел, 2 процессора Intel® Xeon® Platinum 9282 на платформе Walker Pass с общей емкостью памяти 768 ГБ (24 модуля по 32 ГБ 2933), ucode 0x400000A на RHEL7.6, 3.10.0-957.el7.x86_64, IC19u1, AVX512, технология HT включена (Stream, LINPACK отключены), режим Turbo включен (Stream, LINPACK отключены), результат: пропускная способность при выполнении целочисленных операций = 635, пропускная способность при выполнении операций с плавающей запятой = 526, STREAM-Triad = 407, LINPACK = 6411, Java на стороне сервера = 332913, тест проведен Intel 16.02.2019.

5

Среднее увеличение производительности до 33% (в 1,33 раза) на процессорах Intel® Xeon® Gold массовой категории: среднее геометрическое из результатов эталонных тестов est SPECrate2017_int_base, est SPECrate2017_fp_base, STREAM-Triad, Intel® Distribution for LINPACK*, Java* на стороне сервера. Сравнение Gold 5218 и Gold 5118. Базовая конфигурация: 1 узел, 2 процессора Intel® Xeon® Gold 5118 на платформе Wolf Pass с общим объемом памяти 384 ГБ (12 модулей по 32 ГБ 2666 (2400)), ucode 0x200004D на RHEL7.6, 3.10.0-957.el7.x86_64, IC18u2, AVX2, технология HT включена (Stream, LINPACK отключены), режим Turbo включен, результат: пропускная способность при выполнении целочисленных операций = 119, пропускная способность при выполнении операций с плавающей запятой = 134, STREAM-Triad = 148,6, LINPACK = 822, Java на стороне сервера = 67434, тест проведен Intel 12.11.2018. Новая конфигурация: 1 узел, 2 процессора Intel® Xeon® Gold 5218 на платформе Wolf Pass с общим объемом памяти 384 ГБ (12 модулей по 32 ГБ 2933 (2666)), ucode 0x4000013 на RHEL7.6, 3.10.0-957.el7.x86_64, IC18u2, AVX2, технология HT включена (Stream, LINPACK отключены), режим Turbo включен, результат: пропускная способность при выполнении целочисленных операций = 162, пропускная способность при выполнении операций с плавающей запятой = 172, STREAM-Triad = 185, LINPACK = 1088, Java на стороне сервера = 98333, тест проведен Intel 07.12.2018.