Существуют способы получения значимых результатов, даже если задача кажется невыполнимой. Главный специалист Intel по обработке и анализу данных Боб Роджерс (Bob Rogers) объясняет, как этого добиться.
Я более десяти лет посвятил прогнозированию будущих доходов в качестве руководителя хеджевого фонда. Десятилетиями в нашем распоряжении были данные о тиках, однако эти данные содержали значимую случайную составляющую, из-за которой делать прогнозы с точностью выше определенного уровня было невозможно. Количество мотивов, которыми руководствуются в определенный момент времени люди при покупке или продаже, в сочетании с огромным количеством тех, кто занимается торгами, сводило на нет все попытки четко отделить нужные сигналы от прочей информации, как бы мы ни старались.
Специалисты по обработке и анализу данных называют эти задачи трудновыполнимыми; по достижении определенного показателя прогресс качества аналитики больших данных замирает на месте.
К счастью, многие задачи, которые на первый взгляд кажутся трудновыполнимыми, можно решить, изменив подход к исходным данным.
Знание того, что задачи, кажущиеся трудновыполнимыми, можно решить с помощью небольших изменений в подходе, обеспечивает успех для компании — и для спонсора проекта. С другой стороны, возможность понять, что определенную задачу решить невозможно — из-за ее масштаба — позволит сэкономить время и деньги, которые можно выгодно потратить на поиск ответа на более «узкий» вопрос.
Ниже приведены четыре метода устранения недостатков в подходе, которые позволят вам улучшить результаты аналитики. Благодаря этим рекомендациям вы больше не будете паниковать, если столкнетесь с неразрешимой задачей, а станете искать способы создания бизнес-преимуществ на основе имеющихся данных.
1. Задавайте более «узкие» вопросы
Зачастую лучше разбить исходный общий вопрос на несколько более конкретных и экстраполировать полученные данные. Если вы попытаетесь определить, с какой вероятностью автомобиль, который вы проектируете, заинтересует пользователей социальных сетей, ваши усилия вряд ли увенчаются успехом. Даже при наличии большого объема качественных данных вы получите огромное количество различных переменных, которые не позволят сформировать ценный прогноз.
Иногда добавление нового набора данных может привести к новым возможностям для прогнозирования.