Как Intel помогает ЦЕРН раскрывать самые большие научные тайны

Технология Intel® поможет фильтровать постоянно растущий объем данных из знаменитого Большого адронного коллайдера

Основные выводы

  • В настоящее время ведется модернизация Большого адронного коллайдера ЦЕРН. Его повторный запуск планируется в 2021 г., когда снова начнется выработка огромного объема данных.

  • Технологии Intel® помогут исследователям ЦЕРН справиться с огромным потоком данных и выделить только значимую информацию.

  • Эти исследования помогут экспертам получить более полное представление о происхождении Вселенной и ответить на ряд самых сложных вопросов в области физики.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Мир научных исследований производит огромный объем данных с постоянно растущей скоростью. Одной из самых сложных задач для исследователей является их хранение и обработка. ЦЕРН*, Европейская лаборатория физики частиц, уже использовала технологии Intel® для облегчения поиска ценных крупиц информации среди огромного объема производимых данных и собирается делать это и в дальнейшем, поскольку объем данных все время растет.

«Мы с нетерпением ждем продолжения сотрудничества с нашими коллегами из ЦЕРН. Это позволит нам эффективно использовать инструменты с открытым исходным кодом, аппаратное обеспечение Intel и опыт в сфере инженерии для решения сложных задач с данными, а также открытия невероятных возможностей в сфере новых исследований».

На территории лаборатории физики частиц на франко-швейцарской границе размещается гигантский комплекс ускорителей частиц. Старейшему из них недавно исполнилось 60 лет1. Самый крупный и мощный ускоритель частиц ЦЕРН — Большой адронный коллайдер* (БАК), который находится в туннеле на глубине 100 м под землей рядом с городом Женева в Швейцарии. Самая большая и сложная в мире машина БАК имеет форму массивного кольца с длиной окружности 27 км и изготовлена из тысячи сверхпроводимых магнитов. Внутри гигантской машины частицы ускоряются с высокой скоростью и сталкиваются либо с целью, либо с частицами, вращающимися в противоположном направлении.2

Подобные столкновения помогают физикам лучше понять, как устроены крошечные частицы, из которых состоят атомы, строительные блоки химических элементов. Это в свою очередь позволит нам получить больше знаний о материи и о Вселенной, а также поможет ученым разгадать самые непостижимые тайны физики. 

БАК, который начал работу в 2008 г., способен ускорять протоны до скорости, которая составляет 99,9999991% скорости света. Во время работы БАК ежесекундно происходит столкновение около 1 миллиарда частиц, в результате чего выделяется колоссальный объем тепла. При столкновении частиц каждую секунду генерируется массив данных размером почти 1 петабайт (или миллион гигабайт). Хранить такой большой объем данных не под силу даже самым крупным исследовательским институтам в мире, поэтому существует необходимость в поиске способа фильтрации и хранения только полезной информации.

С 2018 г. в БАКе ведется плановая работа по модернизации и техническому обслуживанию после трехлетнего сеанса наборах данных, известного как Run 2. Сбор данных возобновится в 2021 г. для сеанса Run 3 и будет продолжаться до следующего отключения для подготовки к значительной модернизации перед сеансом Run 4, начало которого запланировано на конец 2027 г. Как можно догадаться по названию, проект HL-LHC (высокая светимость) предусматривает значительное повышение светимости коллайдера. При более высокой светимости можно собрать больше данных, повысить эффективность существующих исследований и найти возможности для новых открытий.

Основная задача будет заключаться в том, чтобы справиться с масштабным ростом объема данных, ведь предполагается, что HL-LHC будет собирать данные о событиях столкновений, число которых в десять раз превысит предыдущие показатели. В течение следующих лет произойдет огромный рост спроса на ИКТ. В силу ряда факторов он значительно превысит ожидания того, чего можно было бы достичь в рамках выделенного бюджета как в части хранения, так и в части расчетной мощности.

ЦЕРН использует специальное программное обеспечение для фильтрации производимых данных, выбирая столкновения частиц, которые представляют интерес для дальнейшего анализа. Важно, чтобы такая система могла эффективно уменьшать объем данных и не отсеивать столкновения частиц, которые могут скрывать новые секреты. Исследователи, участвующие в четырех главных экспериментах БАК, всегда ищут новые способы оптимизации систем фильтрации. В ходе проведения эксперимента CMS исследователи изучают глубокие нейронные сети — наборы алгоритмов на основе структуры человеческого мозга, предназначенные для выявления паттернов.

Используя разработанные корпорацией Intel инструменты с открытым исходным кодом BigDL* и Analytics Zoo*, а также платформы для обработки больших данных Apache Spark* и ноутбуки Jupyter*, при сотрудничестве с инженерами Intel исследователи разработали конвейер глубинного обучения на базе масштабируемых процессоров Intel® Xeon®. Этот конвейер создан для работы в существующей ИТ-инфраструктуре и предназначен для более эффективной фильтрации данных, полученных в ходе эксперимента. Он также обеспечивает отсеивание столкновений, хранение и обработка которых не представляют интереса. Это поможет им не только усовершенствовать анализ данных, но и сэкономить ресурсы для вычислений и хранения. Команда, участвующая в эксперименте CMS, намерена и дальше тестировать эту новую систему с перспективой увеличения масштабируемости и производительности на базе инфраструктуры Intel. 

«Мы увидели, насколько инфраструктура BigDL эффективна в таких отраслях, как финансы и безопасность. Но особое удовлетворение вызывает то, что BigDL используется в ЦЕРН для изучения величайших научных загадок, — написал в своем блоге Саджан Говиндан (Sajan Govindan), архитектор решений, отдел технологий аналитики данных в Intel. Мы с нетерпением ждем продолжения сотрудничества с нашими коллегами из ЦЕРН. Это позволит нам эффективно использовать инструменты с открытым исходным кодом, аппаратное обеспечение Intel и опыт в сфере инженерии для решения сложных задач с данными, а также открытия невероятных возможностей в сфере новых исследований».

Кроме того, исследователи из ЦЕРН изучают Intel® oneAPI для помощи в модернизации HL-LHC. Этот набор инструментов может обеспечить высочайшую производительность для разнообразных рабочих нагрузок на нескольких архитектурах. Он также способен помочь исследователям удовлетворять огромные вычислительные потребности HL-LHC в лабораторных условиях.

«Сотрудничество Intel и ЦЕРН просто потрясающее, — говорит Клаудио Беллини (Claudio Bellini), руководитель по работе с клиентами, Intel. Intel является частью программы сотрудничества CERN openlab, благодаря которой ученые ЦЕРН имеют ранний доступ к инструментам программного обеспечения и технологиям Intel®, а также могут высказывать замечания и пожелания специалистам Intel о технических параметрах и работе программного обеспечения. Это невероятно успешное и взаимовыгодное сотрудничество, которое началось еще в 2001 г., и мы надеемся, что оно продолжится в будущем».

* Другие наименования и товарные знаки являются собственностью своих законных владельцев