Как с помощью нейросетей предсказывать обледенение на дорогах и выборы, почему в Сколтехе не любят термин Big Data и что такое решающее дерево, читайте в материале Indicator.Ru о современном предсказательном моделировании.
Миллион рублей можно получить, не только поучаствовав в телевизионной программе с Дмитрием Дибровым. Правда, нужно будет постараться чуть больше, чем просто отвечать на вопросы, зато принести при этом намного больше пользы обществу. В День российской науки правительство Москвы распределило 33 миллиона рублей среди 48 молодых ученых, которые отличились в 2017 году своими исследованиями и разработками в совершенно разных областях науки и техники, от астрономии и приборостроения до гуманитарных наук и городской инфраструктуры.
В номинации «Передача, хранение, обработка, защита информации» премию получил коллектив ученых из Сколковского института науки и технологий «за разработку методов предсказательной аналитики в задачах обработки индустриальных, биомедицинских и экономических данных», которой руководит доцент Сколтеха Евгений Бурнаев. Это не первая его награда. Например, в конце сентября прошлого года аспиранты и студенты из научной группы Евгения выиграли международное соревнование Data Science Game 2017, проходившее в Париже.

Предсказательное моделирование и зачем оно нужно
По словам Евгения, подобными задачами его научная группа занимается с 2008 года, когда на базе Института проблем передачи информации (ИППИ) РАН был организован сектор № 5 интеллектуального анализа данных и предсказательного моделирования (позже — одноименная лаборатория № 10). В 2016 году научная группа, получившая название ADASE (Advanced Data Analytics in Science and Engineering), стала работать на базе Сколтеха.
Суть предсказательного моделирования состоит в том, чтобы, располагая данными о поведении той или иной системы в прошлом, построить прогноз ее поведения в будущем и на основе этого прогноза принимать те или иные решения о ее дизайне, управлении ее поведением и тому подобное. Такие задачи регулярно возникают в самых разных сферах — от косметической промышленности до двигателестроения и от борьбы с кражами конфиденциальной информации до прогнозирования результатов терапии онкологических заболеваний. При этом в ряде случаев приходится не только строить математические модели, но и обрабатывать «большие данные» (Big Data).

«Честно говоря, мы не очень любим этот расхожий термин, Big Data. Для нас — людей, занятых решением практических задач – этот термин имеет смысл тогда, когда анализируемая информация уже не помещается на отдельном компьютере. Приходится специальным образом организовывать работу с данными из разных источников, учитывать то, что данные могут поступать не одновременно, а вычислительных ресурсов одного компьютера оказывается недостаточно» — пояснил Евгений Бурнаев. Он также добавил, что, несмотря на популярность термина, далеко не все современные промышленные и бизнес-задачи требуют специализированного программного обеспечения, алгоритмов и инфраструктуры, которые относятся к понятию «большие данные» — иногда требуется построить предсказание на основе сравнительно небольшого объема информации.
«Допустим, у нас есть данные об эффективности косметического средства и эти данные представлены в виде таблицы, состоящей из 500 строк. Данные, конечно, не могут быть названы большими – однако это не умаляет важность самой задачи — производителю нужно понять, какая же комбинация ингредиентов может оказаться наиболее удачной», — говорит исследователь.
Полная версия интервью на сайте Индикатора.
Контакты:
Skoltech Communications
+7 (495) 280 14 81