Базы данных лежат в основе аналитики: раскрываем потенциал информации

Оптимизация хранения и доступа для извлечения новой аналитической информации из ваших данных.

Данные — это фундамент аналитики. Для хранения данных и доступа к ним организации используют базы данных. Оптимизация архитектуры баз данных и управления базами данных с использованием технологий Intel® может повысить производительность аналитики и помочь в развитии стратегии аналитики вашей организации. Разные типы баз данных предназначены для разных типов данных и приложений.

Базы данных — это системы, предназначенные для организации и хранения данных. Они формируют фундамент всех аналитических стратегий. Правильная организация структуры и архитектуры систем баз данных может означать разницу между ценной, выгодной и хорошо поддерживаемой структурой и структурой, которая рушится под собственным весом.

Базы данных обычно используются во втором сегменте конвейера данных, то есть для обработки данных (этап «подготовка и хранение»). Аналитические приложения и платформы используют содержащуюся в базах данных информацию, чтобы помочь организациям понимать прошлое и прогнозировать будущее.

Базы данных, оптимизированные для выполнения текущих задач, нужны самым разным организациям, от банков, анализирующих финансовые транзакции для обнаружения мошенничества, до умных сельскохозяйственных компаний, использующих видео для сокращения использования пестицидов. При выборе программного обеспечения и систем баз данных организациям важно подбирать технологии, которые помогут эффективно выполнять поставленные задачи.

Для стабильной работы базы данных важно не только программное обеспечение, но и аппаратное обеспечение. Наличие подходящей инфраструктуры, включающей различные вычислительные ресурсы (центральные процессоры, микросхемы FPGA и ускорители), системы хранения данных, память, сетевые системы, библиотеки программного обеспечения и средства оптимизации для Java, способствует повышению производительности БД и упрощению управления БД.

Программное обеспечение СУБД

Программное обеспечение СУБД позволяет сохранять информацию в БД и извлекать ее из БД. Программное обеспечение СУБД включает не только пользовательский интерфейс для взаимодействия с БД, но и средства оптимизации, устанавливающие приоритеты рабочих задач и ускоряющие доступ.

В число популярных СУБД входят Oracle, SAP HANA, Microsoft* SQL Server, Splunk и Apache Cassandra. В каждой СУБД для организации данных и эффективного управления ими используются определенные структуры данных, такие как деревья, массивы, стеки и графики.

Типы баз данных

Аналитики организаций работают над извлечением ценности из данных разных типов, поступающих из множества источников. Для оптимизации аналитической стратегии необходимо начать с уровня базы данных и выбрать СУБД, которая будет эффективной для выполнения конкретных бизнес-задач. Необходимо обеспечивать баланс между согласованностью, доступностью и поддержкой разделов, и ни одна технология баз данных не может обеспечить идеальные показатели по всем трем пунктам. Эта концепция (теорема CAP) означает, что организациям нужно выбирать те сильные стороны баз данных, которые наиболее важны для их конкретных бизнес-задач.

Базы данных можно размещать локально или в облаке. Облачные базы данных обладают преимуществом масштабируемости, но некоторые организации, особенно из регулируемых отраслей, предпочитают хранить данные в локальных системах для дополнительной безопасности.

Язык программирования определяет структуры данных и имеет решающее значение для анализа данных и манипуляций с данными. В разных базах данных используются разные языки программирования, оптимизированные для определенных типов данных, функций и моделей использования. Многим крупным компаниям необходимо использовать несколько типов баз данных для эффективной организации и использования данных.

Реляционные базы данных

Реляционные базы данных основаны на стандартизированных таблицах, выражающих отношения между данными, и обычно используют язык структурированных запросов (SQL). Реляционные базы данных очень хорошо подходят для управления структурированными данными с едиными правилами и отношениями, в том числе финансовыми транзакциями и записями инвентарного учета. В число реляционных СУБД входят Oracle, Microsoft* SQL Server, IBM DB2 и Azure SQL.

  • OLTP
    OLTP (обработка онлайн-транзакций) — это категория обработки данных, ориентированная на выполнение задач с транзакциями. OLTP обычно предусматривает вставку, обновление и/или удаление небольших объемов данных в БД.
    Базы данных очень часто используются для обработки транзакций. OLTP — это режим доступа к базам данных, специально ориентированный на обработку транзакций при одновременной работе большого количества пользователей. OLTP часто используется с базами данных Oracle, IBM и Microsoft.
  • OLAP
    Аналитическая онлайн-обработка (OLAP) часто используется организациями для обработки больших объемов архивных данных для аналитических целей. Для запросов OLAP обычно используется многомерная модель данных, хотя в некоторых случаях также используются реляционные модели данных. Склады данных — это специализированный тип OLAP, разработанный для аналитических задач.

Объектно-ориентированные базы данных

В объектно-ориентированной базе данных информация представляется в виде объектов и классов объектов. Комбинация объектно-ориентированной и реляционной базы данных называется объектно-реляционной базой данных.

Нереляционные базы данных

Нереляционные базы данных (иногда называемые БД NoSQL) не зависят от табличной структуры. Для организации данных в этих БД обычно используются метаданные, и эти БД эффективно подходят для работы с неструктурированными данными и сложными типами данных (например, изображениями и видео). В качестве примеров популярных нереляционных БД можно назвать MongoDB и Apache Cassandra.

  • База данных «ключ-значение»
    Это самая простая форма баз данных NoSQL, и такие БД иногда также называются хранилищами пар «ключ-значение». К этой категории относятся БД Redis и Oracle NoSQL, которые используют хэш-таблицу для хранения и извлечения данных с использованием уникального идентифицирующего «ключа».
  • Хранилища с широкими столбцами
    В хранилищах с широкими столбцами данные хранятся в столбцах связанной информации. Из этого класса БД чаще всего используется БД Cassandra, обеспечивающая масштабируемость и быстрое выполнение запросов к большим наборам данных.
  • Базы данных документов
    Эти базы данных, иногда также называемые хранилищами документов, хранят данные в виде сложных записей, называемых «документами», которые включают метаданные или информацию о самих данных. В документах могут содержаться данные любого типа, включая изображения и видео.
  • Базы данных с графиками
    Базы данных с графиками — это еще один тип баз данных NoSQL, в котором для определения отношений и хранения данных используются структуры графиков. Базы данных графиков созданы для быстрых запросов и обработки больших объемов тесно связанных данных. Модели баз данных графиков используются в SAP HANA и OrientDB.

Многочисленные инновационные решения Intel, от процессоров до библиотек и оптимизаций Java, обеспечивают повышение производительности и упрощение управления БД для организаций во всем мире.

Технологии Intel® для управления базами данных

Для оптимизации БД, содержащих большие масштабируемые наборы данных, требуется аппаратное обеспечение, способное эффективно поддерживать рабочие задачи баз данных и аналитики.

Вычислительные ресурсы и память должны быть максимально производительными и использовать процессорные инструкции, обеспечивающие быструю обработку запросов и потоков данных. Хранение и доступ к данным зависят от системы уровней, которая автоматически устанавливает приоритет для срочных и важных рабочих задач.

Intel создает инновации на уровне аппаратного обеспечения, добавляя такие наборы инструкций как AVX-512 и TMUL для ускорения обработки данных.

Помимо создания производительного аппаратного обеспечения для баз данных, Intel также содействует разработке программного обеспечения с открытым исходным кодом. Целая команда специалистов Intel занимается оптимизацией Java с целью помочь сообществу разработчиков ПО с открытым исходным кодом и разработчикам баз данных ускорить их рабочие процессы.

Технологии и программное обеспечение Intel® для управления базами данных
Масштабируемые процессоры Intel® Xeon® Процессоры Intel® Xeon® Scalable последнего поколения поддерживают желаемые системы и инструменты баз данных и имеют аппаратные оптимизации, облегчающие выполнение рабочих задач БД и повышающие общую производительность.
Энергонезависимая память Intel® Optane™ Масштабируемые процессоры Intel® Xeon® последнего поколения поставляются в комплекте с энергонезависимой памятью Intel® Optane™. Энергонезависимая память Intel® Optane™ позволяет оптимизировать обработку баз данных в оперативной памяти для расширенной аналитики и обеспечивает прирост производительности ряда платформ СУБД и приложений. 
Твердотельные накопители Intel® SSD-накопители Intel®, в том числе SSD-накопители Intel® Optane™ и SSD-накопители Intel® NVMe, обеспечивают долгосрочное и надежное хранение данных с возможностью чтения и записи. Базы данных могут обрабатывать непрерывные потоки операций чтения-записи на дисках, отличающихся долговечностью.
Продукция Intel® для сетей Ethernet Сетевые адаптеры, контроллеры и аксессуары Intel® для сетей Ethernet поддерживают различные стандарты GbE. Всемирная доступность и исчерпывающее тестирование совместимости делают сетевые устройства Intel® для сетей Ethernet популярным выбором для подключения баз данных.
Программные библиотеки 1 Программные библиотеки Intel®, в том числе комплекты Storage Performance Development Kit (SPDK) и Data Plane Development Kit (DPDK), помогают ускорить разработку приложений БД и оптимизировать производительность баз данных.

Подготовка баз данных для оптимизации производительности

Эффективная стратегия аналитики зависит от использования подходящих технологий БД с подходящими типами данных. По мере развития стратегии аналитики и использования большего количества типов данных в разных приложениях ваша организация, вероятно, начнет использовать разные типы БД от разных поставщиков.

Intel ставит перед собой задачу оптимизировать управление базами данных, и выпускает целый ряд аппаратных продуктов и функций, созданных специально для работы с БД, а также библиотеки программного обеспечения, программные инструменты и средства оптимизации. Корпорация Intel создает аппаратное и программное обеспечение для большинства популярных БД и работает над инновациями завтрашнего дня.

Дополнительные ресурсы по аналитике

Дополнительная информация о технологиях Intel® для аналитики.

Аналитика данных

Узнайте, как аналитика помогает организациям в получении надежной и полезной информации и как разработать стратегию аналитики.

Извлеките из аналитики максимальную выгоду

Специализированные решения Intel® для Microsoft* SQL Server

Гибкие, удобные в развертывании и масштабируемые решения, оптимизированные для производительности, помогают организациям добиваться необходимых результатов.

Получите больше с SQL server

Аналитика в реальном времени

Узнайте, как аналитика в реальном времени помогает организациям получать конкурентные преимущества в новую эпоху бизнеса, ориентированного на данные.

Окунитесь в поток данных

Уведомления и отказ от ответственности
Для работы технологий Intel может потребоваться специальное оборудование, ПО или активация услуг. // Ни один продукт или компонент не может обеспечить абсолютную защиту. // Ваши расходы и результаты могут отличаться. // Intel не контролирует и не проверяет сторонние данные. Для оценки точности следует обращаться к другим источникам информации.

Информация о продукте и производительности

1При использовании микропроцессоров других производителей компиляторы Intel® могут обеспечить или не обеспечить такой же уровень оптимизации, как и для микропроцессоров Intel®, кроме оптимизаций, относящихся только к микропроцессорам Intel®. В число этих оптимизаций входят наборы команд SSE2, SSSE3 и SSE3, а также другие оптимизации. Корпорация Intel не гарантирует наличие, функциональность или эффективность оптимизаций микропроцессоров других производителей. Оптимизации, зависимые от микропроцессора, в этой продукции предназначены для использования на микропроцессорах Intel®. Некоторые оптимизации, не относящиеся к микроархитектуре Intel®, предназначены для микропроцессоров Intel®. Более подробную информацию по конкретным наборам команд, рассматриваемых в настоящем уведомлении, см. руководства пользователя соответствующей продукции.