Высокопроизводительные вычислительные системы на базе технологий Intel, основанные на аппаратно- и программно-ускоренном искусственном интеллекте, расширяют возможности исследователей и специалистов по обработке и анализу данных, а также ускоряют получение результатов и аналитической информации для самых больших в мире наборов данных и сложных моделей.
Высокопроизводительные вычисления с помощью искусственного интеллекта
Архитектура, необходимая для внедрения высокопроизводительных вычислений, во многом схожа с реализацией искусственного интеллекта. Высокопроизводительные вычислительные системы и искусственный интеллект используют высокий уровень вычислительных ресурсов и систем хранения данных, большую емкость памяти и пропускную способность, а также высокоскоростное оптоволокно для получения результатов, обычно обрабатывая при этом огромные наборы данных, размер которых постоянно увеличивается. Глубинное обучение отлично подходит для задач, решаемых высокопроизводительными вычислительными системами, в которых используются очень большие и многомерные наборы данных. Например, компания Quantifi использовала искусственный интеллект на базе технологий Intel для ускорения оценки деривативов на финансовых рынках в 700 раз по сравнению с традиционными методами,1 предоставляя при этом результаты практически в режиме реального времени для стандартных рабочих нагрузок, связанных с оценкой.
Потенциал искусственного интеллекта для высокопроизводительных вычислений заключается в том, что модели искусственного интеллекта способны расширить экспертный анализ наборов данных для более быстрого получения результатов с тем же уровнем точности. В основных сценариях использования высокопроизводительных вычислений используются расширенные возможности искусственного интеллекта, в том числе:
- Аналитика для финансовых услуг (FSI), таких как выявление рисков и мошенничества, логистика и производство
- Проектирование промышленной продукции, вычислительная гидродинамика (CFD), компьютерное моделирование (CAE) и автоматизированное проектирование (CAD)
- Научная визуализация и моделирование, особенно в таких областях, как физика высоких энергий
- Кластеризация шаблонов, науки о жизни, геномное секвенирование и медицинские исследования
- Исследование в сфере наук о Земле и энергетики
- Прогнозирование погоды, метеорология и климатология
- Астрономия и астрофизика
Изменение рабочих нагрузок
Многие из существующих сценариев использования искусственного интеллекта ограничены развертываниями на периферии или в ЦОД, например интеллектуальные системы управления дорожным движением, где широко применяются умные камеры для распознавания объектов с помощью искусственного интеллекта. Алгоритмы, лежащие в основе моделей искусственного интеллекта, стали значительно сложнее, обеспечивая больший потенциал, но и при этом требуя более значительных вычислительных ресурсов для научных исследований, инноваций, а также для применения в промышленности и бизнесе. Проблема заключается в том, как масштабировать логические выводы искусственного интеллекта до уровня высокопроизводительных вычислений или как перейти от шаблонов дорожного движения на перекрестке к секвенированию генома в считанные часы, а не в течение нескольких недель.
К счастью, сообщество высокопроизводительных вычислений имеет многолетний опыт в решении проблем масштабирования искусственного интеллекта, таких как необходимость дополнительного параллелизма, быстрого ввода-вывода для больших наборов данных и эффективной навигации в распределенных вычислительных средах. Такие возможности высокопроизводительных вычислений могут помочь в ускорении искусственного интеллекта для получения полезных результатов, например применение эвристики экспертного уровня с использованием логических выводов глубинного обучения к тысячам транзакций, рабочих нагрузок или симуляций в секунду.
Нейронные сети с физическими данными (PINN)
Одним из примеров сценариев использования высокопроизводительных вычислений с искусственным интеллектом является интеграция законов физики в модели формирования логических выводов для получения более достоверных результатов. В таких сценариях применения нейронные сети должны подчиняться известным законам, например закону сохранения массы, энергии и скорости, поэтому эти нейронные сети называются нейронными сетями с физическими данными (PINN). Нейронные сети с физическими данными могут быть использованы для того, чтобы дополнить или заменить собой моделирование и симуляцию с применением высокопроизводительных вычислений для таких сценариев использования, как анализ потока жидкости, молекулярная динамика, проектирование аэродинамических поверхностей и реактивных двигателей и физика высоких энергий.
Например, исследователи ЦЕРН использовали технологию Intel® Deep Learning Boost (Intel® DL Boost) на масштабируемых процессорах Intel® Xeon® для замены моделирования методом Monte Carlo столкновения частиц. Квантование int8 низкой точности позволило ускорить обработку данных почти в 68 000 раз по сравнению с программным моделированием,2 добившись при этом также незначительного повышения точности.
Использование искусственного интеллекта в высокопроизводительных вычислениях в связи с ростом объемов данных
Основной движущей силой для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта является постоянный рост объемов данных и необходимость соответствовать скорости анализа в масштабируемых высокопроизводительных вычислительных системах. Алгоритмы искусственного интеллекта становятся все более сложными и могут обрабатывать наборы данных гораздо большего размера по сравнению с предыдущими годами, особенно с внедрением методологий глубинного обучения. Такие дисциплины, как геномное секвенирование, производят огромное количество данных, а такие учреждения, как Институт Брода Массачусетского технологического института и Гарвардского университета, создают около 24 терабайт новых данных каждый день.3
Искусственный интеллект помогает ускорить критически важные рабочие нагрузки, что позволяет проводить исследования вовремя. Например, Intel сотрудничает с Институтом Брода по разработке специализированного решения Intel® для платформы геномной аналитики Genomics Analytics Toolkit (GATK), которое включает в себя аппаратное ускорение искусственного интеллекта для выполнения рабочих нагрузок основных наборов инструментов для геномики. С помощью специализированного решения GATK Институт Брода смог добиться ускорения в 1,75 раза приложения Burrow-Wheeler Aligner (BWA), а также ускорить в 2 раза приложение HaplotypeCaller.4
В суперкомпьютерном центре Сан-Диего (SDSC) находится один из крупнейших академических центров обработки данных в мире, и он признан международным лидером в области управления данными, их использования, хранения и сохранения. Система, предназначенная для использования ИИ, позволяет ученым разрабатывать новые подходы для ускоренного обучения и формирования логических выводов. Практический пример применения: SDSC разрабатывает суперкомпьютер Voyager, предназначенный для использования ИИ.
Решение проблем внедрения искусственного интеллекта в высокопроизводительные вычисления
Когда речь заходит о конфигурациях высокопроизводительных вычислительных систем для искусственного интеллекта, обычно возникает дилемма между требованиями искусственного интеллекта и высокопроизводительных вычислений в рамках архитектуры процессора. Для рабочих нагрузок, использующих в значительной степени искусственный интеллект, более важное значение обычно имеет быстродействие, а не количество ядер, тогда как для рабочих нагрузок высокопроизводительных вычислений зачастую предпочтительнее более высокая вычислительная производительность с большим количеством ядер и более высокой пропускной способностью между ними. Благодаря постоянным улучшениям с каждым поколением Intel предлагает решения, предусматривающие встроенное ускорение для масштабируемых процессоров Intel® Xeon®.
Следующие ключевые инновации на уровне аппаратного и программного обеспечения облегчают проектирование и создания решений для искусственного интеллекта:
- Масштабируемые процессоры Intel® Xeon® обеспечивают необходимый высокий уровень производительности искусственного интеллекта благодаря встроенному ускорению ИИ. Решение Intel® AVX-512 с векторными командами нейронной сети (VNNI) Intel® DL Boost, которые имеются только в процессорах Intel®, обеспечивает оптимизированную производительность искусственного интеллекта для быстрого получения аналитической информации за меньшее время.
- Библиотеки оптимизации с низким уровнем точности в инструментарии Intel® oneAPI AI Analytics Toolkit упрощают создание кода для платформ высокопроизводительных вычислений и искусственного интеллекта, при этом повышая производительность и оставаясь в рамках предельных значений точности.
- Intel® FPGA для машинного обучения обеспечивают высокий уровень распараллеливания и позволяют ускорить получения результатов и аналитики для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта.
- Корпорация Intel приобрела компанию Habana Labs и продолжает вкладывать средства в ускорители Habana, которые специально созданы для обучения моделей искусственного интеллекта и формирования логических выводов с поддержкой масштабирования.
- Специализированные решения Intel® для высокопроизводительных вычислительных кластеров с искусственным интеллектом прокладывают путь к развертыванию рабочих нагрузок искусственного интеллекта на конвергентных платформах высокопроизводительных вычислений без использования графических процессоров
- Разработчики искусственного интеллекта совершенствуют свои методы и код для обеспечения более эффективной работы в кластерах высокопроизводительных вычислений Новые средства оптимизации комплексно ускоряют рабочие нагрузки: от загрузки данных до предварительной обработки, обучения и формирования логических выводов.
Сложность также значительно замедляет внедрение высокопроизводительных вычислений и искусственного интеллекта. Необходимые наборы навыков в очень большой степени зависят от предметной области, поэтому компаниям потребуется найти высококвалифицированных специалистов по высокопроизводительным вычислениям и искусственному интеллекту, чтобы добиться успеха. Лидирующее положение корпорации Intel в отрасли может поспособствовать созданию условий для этого, поскольку Intel тесно сотрудничает с сообществами по высокопроизводительным вычислениям и искусственному интеллекту для обмена опытом и идеями.
Заключение: внедрение искусственного интеллекта в высокопроизводительные вычисления
Искусственный интеллект все больше проникает в приложения для высокопроизводительных вычислений, а новые технологии и методологии увеличивают скорость и охват анализа искусственного интеллекта для ускорения исследований и быстрого получения аналитической информации. Благодаря этим инновациям специалисты по обработке и анализу данных, а также исследователи могут использовать искусственный интеллект, чтобы обрабатывать больше данных, создавать более достоверные модели и делать более точные прогнозы, зачастую затрачивая на это меньше времени.