Высокопроизводительные вычисление и искусственный интеллект: мощное сочетание

Машинное и глубинное обучение дополняет высокопроизводительные вычисления для более быстрого получения новой аналитической информации.

Больше обрабатываемых данных и более глубокий анализ с помощью искусственного интеллекта для высокопроизводительных вычислений

  • Внедрение искусственного интеллекта связано с вычислительной архитектурой высокопроизводительных вычислительных систем, поскольку искусственный интеллект и высокопроизводительные вычисления используют аналогичные конфигурации на базе высокопроизводительного аппаратного обеспечения Intel®.

  • Исследователи Европейской организации по ядерным исследованиям (ЦЕРН) используют конволюционные нейронные сети на базе технологий Intel, которые интегрируют законы физики в модели искусственного интеллекта, чтобы получить более точные результаты для реальных сценариев использования.

  • Intel помогает снизить необходимость нахождения компромисса между специализированными платформами искусственного интеллекта и высокопроизводительных вычислений с помощью аппаратно-ускоренного искусственного интеллекта, унифицированного программирования платформы с использованием oneAPI и упрощенных специализированных решений Intel®, позволяющих сократить количество конфликтов при проектировании и развертывании систем.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Высокопроизводительные вычислительные системы на базе технологий Intel, основанные на аппаратно- и программно-ускоренном искусственном интеллекте, расширяют возможности исследователей и специалистов по обработке и анализу данных, а также ускоряют получение результатов и аналитической информации для самых больших в мире наборов данных и сложных моделей.

Высокопроизводительные вычисления с помощью искусственного интеллекта

Архитектура, необходимая для внедрения высокопроизводительных вычислений, во многом схожа с реализацией искусственного интеллекта. Высокопроизводительные вычислительные системы и искусственный интеллект используют высокий уровень вычислительных ресурсов и систем хранения данных, большую емкость памяти и пропускную способность, а также высокоскоростное оптоволокно для получения результатов, обычно обрабатывая при этом огромные наборы данных, размер которых постоянно увеличивается. Глубинное обучение отлично подходит для задач, решаемых высокопроизводительными вычислительными системами, в которых используются очень большие и многомерные наборы данных. Например, компания Quantifi использовала искусственный интеллект на базе технологий Intel для ускорения оценки деривативов на финансовых рынках в 700 раз по сравнению с традиционными методами,1 предоставляя при этом результаты практически в режиме реального времени для стандартных рабочих нагрузок, связанных с оценкой.

Потенциал искусственного интеллекта для высокопроизводительных вычислений заключается в том, что модели искусственного интеллекта способны расширить экспертный анализ наборов данных для более быстрого получения результатов с тем же уровнем точности. В основных сценариях использования высокопроизводительных вычислений используются расширенные возможности искусственного интеллекта, в том числе:

  • Аналитика для финансовых услуг (FSI), таких как выявление рисков и мошенничества, логистика и производство
  • Проектирование промышленной продукции, вычислительная гидродинамика (CFD), компьютерное моделирование (CAE) и автоматизированное проектирование (CAD)
  • Научная визуализация и моделирование, особенно в таких областях, как физика высоких энергий
  • Кластеризация шаблонов, науки о жизни, геномное секвенирование и медицинские исследования
  • Исследование в сфере наук о Земле и энергетики
  • Прогнозирование погоды, метеорология и климатология
  • Астрономия и астрофизика

Изменение рабочих нагрузок

Многие из существующих сценариев использования искусственного интеллекта ограничены развертываниями на периферии или в ЦОД, например интеллектуальные системы управления дорожным движением, где широко применяются умные камеры для распознавания объектов с помощью искусственного интеллекта. Алгоритмы, лежащие в основе моделей искусственного интеллекта, стали значительно сложнее, обеспечивая больший потенциал, но и при этом требуя более значительных вычислительных ресурсов для научных исследований, инноваций, а также для применения в промышленности и бизнесе. Проблема заключается в том, как масштабировать логические выводы искусственного интеллекта до уровня высокопроизводительных вычислений или как перейти от шаблонов дорожного движения на перекрестке к секвенированию генома в считанные часы, а не в течение нескольких недель.

К счастью, сообщество высокопроизводительных вычислений имеет многолетний опыт в решении проблем масштабирования искусственного интеллекта, таких как необходимость дополнительного параллелизма, быстрого ввода-вывода для больших наборов данных и эффективной навигации в распределенных вычислительных средах. Такие возможности высокопроизводительных вычислений могут помочь в ускорении искусственного интеллекта для получения полезных результатов, например применение эвристики экспертного уровня с использованием логических выводов глубинного обучения к тысячам транзакций, рабочих нагрузок или симуляций в секунду.

Нейронные сети с физическими данными (PINN)

Одним из примеров сценариев использования высокопроизводительных вычислений с искусственным интеллектом является интеграция законов физики в модели формирования логических выводов для получения более достоверных результатов. В таких сценариях применения нейронные сети должны подчиняться известным законам, например закону сохранения массы, энергии и скорости, поэтому эти нейронные сети называются нейронными сетями с физическими данными (PINN). Нейронные сети с физическими данными могут быть использованы для того, чтобы дополнить или заменить собой моделирование и симуляцию с применением высокопроизводительных вычислений для таких сценариев использования, как анализ потока жидкости, молекулярная динамика, проектирование аэродинамических поверхностей и реактивных двигателей и физика высоких энергий.

Например, исследователи ЦЕРН использовали технологию Intel® Deep Learning Boost (Intel® DL Boost) на масштабируемых процессорах Intel® Xeon® для замены моделирования методом Monte Carlo столкновения частиц. Квантование int8 низкой точности позволило ускорить обработку данных почти в 68 000 раз по сравнению с программным моделированием,2 добившись при этом также незначительного повышения точности.

Использование искусственного интеллекта в высокопроизводительных вычислениях в связи с ростом объемов данных

Основной движущей силой для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта является постоянный рост объемов данных и необходимость соответствовать скорости анализа в масштабируемых высокопроизводительных вычислительных системах. Алгоритмы искусственного интеллекта становятся все более сложными и могут обрабатывать наборы данных гораздо большего размера по сравнению с предыдущими годами, особенно с внедрением методологий глубинного обучения. Такие дисциплины, как геномное секвенирование, производят огромное количество данных, а такие учреждения, как Институт Брода Массачусетского технологического института и Гарвардского университета, создают около 24 терабайт новых данных каждый день.3

Искусственный интеллект помогает ускорить критически важные рабочие нагрузки, что позволяет проводить исследования вовремя. Например, Intel сотрудничает с Институтом Брода по разработке специализированного решения Intel® для платформы геномной аналитики Genomics Analytics Toolkit (GATK), которое включает в себя аппаратное ускорение искусственного интеллекта для выполнения рабочих нагрузок основных наборов инструментов для геномики. С помощью специализированного решения GATK Институт Брода смог добиться ускорения в 1,75 раза приложения Burrow-Wheeler Aligner (BWA), а также ускорить в 2 раза приложение HaplotypeCaller.4

В суперкомпьютерном центре Сан-Диего (SDSC) находится один из крупнейших академических центров обработки данных в мире, и он признан международным лидером в области управления данными, их использования, хранения и сохранения. Система, предназначенная для использования ИИ, позволяет ученым разрабатывать новые подходы для ускоренного обучения и формирования логических выводов. Практический пример применения: SDSC разрабатывает суперкомпьютер Voyager, предназначенный для использования ИИ.

Решение проблем внедрения искусственного интеллекта в высокопроизводительные вычисления

Когда речь заходит о конфигурациях высокопроизводительных вычислительных систем для искусственного интеллекта, обычно возникает дилемма между требованиями искусственного интеллекта и высокопроизводительных вычислений в рамках архитектуры процессора. Для рабочих нагрузок, использующих в значительной степени искусственный интеллект, более важное значение обычно имеет быстродействие, а не количество ядер, тогда как для рабочих нагрузок высокопроизводительных вычислений зачастую предпочтительнее более высокая вычислительная производительность с большим количеством ядер и более высокой пропускной способностью между ними. Благодаря постоянным улучшениям с каждым поколением Intel предлагает решения, предусматривающие встроенное ускорение для масштабируемых процессоров Intel® Xeon®.

Следующие ключевые инновации на уровне аппаратного и программного обеспечения облегчают проектирование и создания решений для искусственного интеллекта:

  • Масштабируемые процессоры Intel® Xeon® обеспечивают необходимый высокий уровень производительности искусственного интеллекта благодаря встроенному ускорению ИИ. Решение Intel® AVX-512 с векторными командами нейронной сети (VNNI) Intel® DL Boost, которые имеются только в процессорах Intel®, обеспечивает оптимизированную производительность искусственного интеллекта для быстрого получения аналитической информации за меньшее время.
  • Библиотеки оптимизации с низким уровнем точности в инструментарии Intel® oneAPI AI Analytics Toolkit упрощают создание кода для платформ высокопроизводительных вычислений и искусственного интеллекта, при этом повышая производительность и оставаясь в рамках предельных значений точности.
  • Intel® FPGA для машинного обучения обеспечивают высокий уровень распараллеливания и позволяют ускорить получения результатов и аналитики для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта.
  • Корпорация Intel приобрела компанию Habana Labs и продолжает вкладывать средства в ускорители Habana, которые специально созданы для обучения моделей искусственного интеллекта и формирования логических выводов с поддержкой масштабирования.
  • Специализированные решения Intel® для высокопроизводительных вычислительных кластеров с искусственным интеллектом прокладывают путь к развертыванию рабочих нагрузок искусственного интеллекта на конвергентных платформах высокопроизводительных вычислений без использования графических процессоров
  • Разработчики искусственного интеллекта совершенствуют свои методы и код для обеспечения более эффективной работы в кластерах высокопроизводительных вычислений Новые средства оптимизации комплексно ускоряют рабочие нагрузки: от загрузки данных до предварительной обработки, обучения и формирования логических выводов.

Сложность также значительно замедляет внедрение высокопроизводительных вычислений и искусственного интеллекта. Необходимые наборы навыков в очень большой степени зависят от предметной области, поэтому компаниям потребуется найти высококвалифицированных специалистов по высокопроизводительным вычислениям и искусственному интеллекту, чтобы добиться успеха. Лидирующее положение корпорации Intel в отрасли может поспособствовать созданию условий для этого, поскольку Intel тесно сотрудничает с сообществами по высокопроизводительным вычислениям и искусственному интеллекту для обмена опытом и идеями.

Заключение: внедрение искусственного интеллекта в высокопроизводительные вычисления

Искусственный интеллект все больше проникает в приложения для высокопроизводительных вычислений, а новые технологии и методологии увеличивают скорость и охват анализа искусственного интеллекта для ускорения исследований и быстрого получения аналитической информации. Благодаря этим инновациям специалисты по обработке и анализу данных, а также исследователи могут использовать искусственный интеллект, чтобы обрабатывать больше данных, создавать более достоверные модели и делать более точные прогнозы, зачастую затрачивая на это меньше времени.

Производительность зависит от варианта использования, конфигурации и других факторов. Подробнее: intel.ru/PerformanceIndex.

Результаты оценки производительности основаны на тестировании по состоянию на момент времени, указанный в конфигурации, и могут отличаться от тех, что указаны в источниках обновленной общедоступной информации. Подробная информация о конфигурации представлена в резервной копии. Ни один продукт или компонент не может обеспечить абсолютную защиту.

Информация о продукте и производительности

3«Специализированные решения Intel® для геномной аналитики», веб-сайт Intel. Дата доступа: август 2021.
4Специализированные решения Intel® для геномной аналитики», веб-сайт Intel. Дата доступа: август 2021.