По мере роста требований рабочих задач высокопроизводительных вычислений и их конвергенции с задачами ИИ и аналитики суперкомпьютеры нового поколения поднимают планку требований к производительности памяти и вычислительных ресурсов и начинают использовать облака для обеспечения нового уровня гибкости.
В динамичных условиях современного бизнеса для успешного внедрения высокопроизводительных вычислительных систем необходимо предварительно четко определить их архитектуру. В зависимости от целей вычислений и рабочих задач вашей организации вам могут подойти разные варианты высокопроизводительных вычислительных систем и вспомогательных ресурсов, которые обеспечат повышение продуктивности и масштабируемую производительность.
Разработка высокопроизводительных вычислительных систем
Архитектура высокопроизводительных вычислительных систем может принимать разные формы в зависимости от потребностей пользователя. Организации могут использовать разные подходы к проектированию высокопроизводительных вычислительных систем.
Параллельные вычисления
Кластеры высокопроизводительных вычислительных систем могут выполнять расчеты одновременно или параллельно. Параллельные вычисления помогают оптимизировать решение больших и сложных задач, разбивая их на отдельные вычислительные задания, которые выполняются одновременно.
При проектировании этих систем можно предусмотреть вертикальное или горизонтальное масштабирование. При вертикальном масштабирование задание распределяется в пределах одной системы для максимально эффективного использования ядер серверного процессора. При горизонтальном масштабировании задание разделяется на контролируемые части, которые направляются на несколько серверов или компьютеров, параллельно выполняющих поставленные задачи.
Кластерные вычисления
В кластерах высокопроизводительных вычислительных систем отдельные компьютеры или узлы связаны друг с другом через локальную сеть (LAN) и образуют архитектуру кластера. Кластер выступает в качестве одного компьютера, обладающего огромной вычислительной мощностью. Конфигурация высокопроизводительного вычислительного кластера имеет уникальную схему, позволяющую выполнять задачи посредством их распределения между узлами системы. Высокопроизводительные вычислительные кластеры имеют определенную сетевую топологию и позволяют организациям решать сложные вычислительные задачи с бескомпромиссной скоростью.
Распределенные сети и вычислительные ресурсы
Вычислительные сети и распределенные вычислительные ресурсы — это аналогичные вычислительные архитектуры. В этих архитектурах множество компьютеров объединяются через сеть для общей цели, например для решения сложной задачи или проведения большого объема вычислений. Они идеально подходят для решения задач, которые можно разделить на отдельные части и распределить по сети. Каждый узел системы может выполнять задачи независимо и без взаимодействия с другими узлами.
Совместимость стандартых приложений для высокопроизводительных вычислительных систем
Корпорацяи Intel сотрудничает со своими отраслевыми партнерами при разработке передовых методик для пооуляризации высокопроизводительных вычислительных и кластерных систем на базе архитектуры Intel®. Спецификация Intel® HPC Platform Specification содержит общие программные и аппаратные требования, которые разработчики приложений могут использовать для создания фундамента кластерных решений. Соответствующая этим требованиям система обеспечивает определенный набор возможностей уровня приложений, включая компоненты программного обеспечения Intel®, обеспечивающие наилучшую производительность. Спецификация платформы включает сведения о конфигурации и совместимости широкого спектра разнообразных приложений.
Облачная инфраструктура высокопроизводительных вычислительных систем
В прошлом высокопроизводительные вычислительные системы были ограничены возможностями локальной инфраструктуры. Сейчас же существует возможность дополнять локальные ресурсы облачными.
Новейшие платформы управления облаками позволяют применять гибридный облачный подход, при котором локальная инфраструктура объединяется с публичным облаком для выполнения рабочих задач с использованием всех доступных ресурсов. Такой подход повышает гибкость развертывания высокопроизводительных вычислительных систем, ускоряет вертикальное масштабирование и помогает снизить совокупную стоимость владения.
Обычно локальная высокопроизводительная вычислительная система обходится дешевле резервирования аналогичной системы в облаке на круглосуточной основе. Однако локальное решение, рассчитанное на пиковую нагрузку, будет в полной мере использоваться только при такой нагрузке. Большую часть времени ресурсы локального решения будут использоваться не полностью или простаивать. С другой стороны, невозможность выполнить рабочую задачу из-за недостатка ресурсов может повлечь за собой потерю возможностей.
Таким образом, использование облаков для дополнения возможностей локальной инфраструктуры высокопроизводительных вычислений обеспечивает экономию и при этом помогает снизить риск упустить выгодные возможности.
Подбор масштабируемых и производительных процессоров для высокопроизводительных вычислительных систем
Корпорация Intel обладает огромным опытом в сфере технологий высокопроизводительных вычислительных систем и обеспечивает необходимый уровень производительности для самых высоких требований рабочих задач будущего. Процессоры Intel® Xeon® Scalable — это гибкая и масштабируемая платформа высокопроизводительных вычислительных систем для удовлетворения разнообразных требований к производительности критически важных рабочих задач.
Корпорация Intel совместно с партнерами считает приоритетным проектирование оптимизированных высокопроизводительных вычислительных систем. Инструмент Intel® Cluster Checker помогает проверить соответствие требованиям к производительности и убедиться, что ваш высокопроизводительный вычислительный кластер работает нормально и настроен для параллельного поддержания работы разных приложений с гибкой возможностью переключения между локальными и облачными системами.
Технология Intel® CoFluent™ помогает ускорить развертывание сложных систем и определить оптимальные параметры посредством моделирования взаимодействия программного и аппаратного обеспечения.
Прорыв в области памяти для высокопроизводительных вычислительных систем
Память — неотъемлемый элемент конструкции высокопроизводительных вычислительных систем. Память отвечает за краткосрочное хранение данных и при несоответствущих характеристиках может ограничивать эффективность рабочих процессов. Технология Intel® Optane™ помогает исправить этот недостаток в ЦОД, устраняя узкие места в структуре оперативной памяти и храненилищ данных для соответствия текущим требованиям.
Масштабируемая производительность с суперкомпьютерной микроинфраструктурой
Для эффективного масштабирования высокопроизводительных вычислительных систем требуется высокопроизводительная микроинфраструктура связи, специально разработанная для поддержки кластеров высокопроизводительных вычислительных систем. Архитектура Intel® Omni-Path (Intel® OPA) помогает преодолеть ограничения производительности, обусловденные существующими технологиями, и обеспечивает возможность масштабирования до десятков тысяч узлов и более. В результате разработчики приложений получают комплексное решение для адаптивной и дисперсионной маршрутизации, оптимизации потока трафика, защиты целостности пакетов и динамического масштабирования каналов. Высокопроизводительные микроинфраструктуры связи Intel разработаны для вычислительных задач будущего и успешно конкурируют по стоимости с другими существующими микроинфраструктурами.
Более удобный путь к внедрению высокопроизводительных вычислительных систем
Корпорация Intel обладает уникальным опытом, который помогает понимать необходимые вам области применения и то, как определенная гибридная система может дать желаемые результаты и обеспечить максимальную эффективность. Архитектура высокопроизводительных вычислительных систем на базе технологий Intel® поможет вам подготовиться к новому поколению вычислительных задач, оперирующих эксабайтами данных.
Сегодня облака открывают широкие возможности масштабирования высокопроизводительных вычислительных систем, предоставляя по требованию дополнительные вычислительные ресурсы, ресурсы хранения данных и сетевые ресурсы.