Сколтех — новый технологический университет, созданный в 2011 году в Москве командой российских и зарубежных профессоров с мировым именем. Здесь преподают действующие ученые, студентам дана свобода в выборе дисциплин, обучение включает работу над собственным исследовательским проектом, стажировку в индустрии, предпринимательскую подготовку и постоянное нахождение в международной среде.

Евгений Бурнаев: Как стать миллионером, предсказывая гололедицу

63a2e92cb9c326468acee7d81cbf8ddee3967fa9 
Евгений Бурнаев. Фото: Сколковский институт науки и технологий
 

Как с помощью нейросетей предсказывать обледенение на дорогах и выборы, почему в Сколтехе не любят термин Big Data и что такое решающее дерево, читайте в материале Indicator.Ru о современном предсказательном моделировании.

Миллион рублей можно получить, не только поучаствовав в телевизионной программе с Дмитрием Дибровым. Правда, нужно будет постараться чуть больше, чем просто отвечать на вопросы, зато принести при этом намного больше пользы обществу. В День российской науки правительство Москвы распределило 33 миллиона рублей среди 48 молодых ученых, которые отличились в 2017 году своими исследованиями и разработками в совершенно разных областях науки и техники, от астрономии и приборостроения до гуманитарных наук и городской инфраструктуры.

В номинации «Передача, хранение, обработка, защита информации» премию получил коллектив ученых из Сколковского института науки и технологий «за разработку методов предсказательной аналитики в задачах обработки индустриальных, биомедицинских и экономических данных», которой руководит доцент Сколтеха Евгений Бурнаев. Это не первая его награда. Например, в конце сентября прошлого года аспиранты и студенты из научной группы Евгения выиграли международное соревнование Data Science Game 2017, проходившее в Париже. 

943dec8e7471cccf1333271c0f29fb2555264fe9
Президент Российской академии наук Александр Сергеев (слева) и профессор Сколтеха Евгений Бурнаев (справа) на церемонии вручения премии правительства Москвы молодым ученым. Фото: Официальный сайт мэра Москвы
 

Предсказательное моделирование и зачем оно нужно

По словам Евгения, подобными задачами его научная группа занимается с 2008 года, когда на базе Института проблем передачи информации (ИППИ) РАН был организован сектор № 5 интеллектуального анализа данных и предсказательного моделирования (позже — одноименная лаборатория № 10). В 2016 году научная группа, получившая название ADASE (Advanced Data Analytics in Science and Engineering), стала работать на базе Сколтеха.

Суть предсказательного моделирования состоит в том, чтобы, располагая данными о поведении той или иной системы в прошлом, построить прогноз ее поведения в будущем и на основе этого прогноза принимать те или иные решения о ее дизайне, управлении ее поведением и тому подобное. Такие задачи регулярно возникают в самых разных сферах — от косметической промышленности до двигателестроения и от борьбы с кражами конфиденциальной информации до прогнозирования результатов терапии онкологических заболеваний. При этом в ряде случаев приходится не только строить математические модели, но и обрабатывать «большие данные» (Big Data). 

54a4d45ba928d8c826c57a4387fa90cd38d52712
Схематическая иллюстрация принципа предсказательного моделирования. AlChe/Indicator.Ru
 

«Честно говоря, мы не очень любим этот расхожий термин, Big Data. Для нас — людей, занятых решением практических задач – этот термин имеет смысл тогда, когда анализируемая информация уже не помещается на отдельном компьютере. Приходится специальным образом организовывать работу с данными из разных источников, учитывать то, что данные могут поступать не одновременно, а вычислительных ресурсов одного компьютера оказывается недостаточно» — пояснил Евгений Бурнаев. Он также добавил, что, несмотря на популярность термина, далеко не все современные промышленные и бизнес-задачи требуют специализированного программного обеспечения, алгоритмов и инфраструктуры, которые относятся к понятию «большие данные» — иногда требуется построить предсказание на основе сравнительно небольшого объема информации.

«Допустим, у нас есть данные об эффективности косметического средства и эти данные представлены в виде таблицы, состоящей из 500 строк. Данные, конечно, не могут быть названы большими – однако это не умаляет важность самой задачи — производителю нужно понять, какая же комбинация ингредиентов может оказаться наиболее удачной», — говорит исследователь.

Полная версия интервью на сайте Индикатора

Контакты:
Skoltech Communications
+7 (495) 280 14 81

Share on VK