Научный руководитель:
Максим Шараев, руководитель лаборатории BIMAI-Lab
Описание:
Для постановки диагноза «рак» врачу-патологу нужно посмотреть в микроскоп, НО перед этим необходимо провести сложный химический эксперимент, который стоит дорого, длится днями и безвозвратно тратит кусочек ткани пациента.
Мы учим нейросети превращать стандартное, недорогое изображение ткани (H&E) в сложное молекулярное исследование (ИГХ) за секунды.
Проект посвящен решению фундаментальной проблемы в гистопатологии — замене дорогостоящего и трудоемкого химического окрашивания (ИГХ) на цифровое предсказание по снимкам H&E. Мы стремимся преодолеть ограничения существующих методов и предлагаем две траектории исследований, которые можно совмещать:
1. Генеративный дизайн: Исследование и адаптация современных архитектур — Diffusion Bridges, Flow-based models и Rectified Flows. Работаем с открытым датасетом IHC4BC, который превосходит аналоги (BCI, MIST), но еще мало изучен в литературе. Задача — экспериментировать с архитектурными, функциями потерь и извлечением признаков для достижения биологической точности на клеточном уровне.
2. Инженерия данных: Создание уникального, «чистого» датасета обучения надежных моделей окрашивания. В отличие от существующих работ, где данные полны артефактов или отбираются вручную, мы разрабатываем автоматизированный пайплайн предобработки: от нежесткой регистрации (WSI registration) до умных алгоритмов фильтрации. В этой области еще нет устоявшихся стандартов — данная работа может стать первой в этой сфере.
Какой опыт получит стажер?
- Практический опыт работы с SOTA-подходами (Diffusion, Flow-based) за пределами обычных GAN.
- Финальный проект может лечь в основу систем, помогающих врачам спасать жизни.
- Понимание специфики медицинских данных.
- Навыки проведения экспериментов, поиска слабых мест в чужих статьях и разработки собственных архитектурных решений.
- Опыт работы с изображениями сверхвысокого разрешения (WSI — Whole Slide Images) и пайплайнами их подготовки.
- Участие в подготовке публикации в высокорейтинговые журналы и конференции уровня MICCAI/CVPR.
Продолжительность стажировки: 2 месяца
Дата начала стажировки: обсуждается с кандидатами
Требования к кандидату:
Обязательные навыки:
Python — уверенный уровень, опыт написания кастомных модулей (DataLoader-а).
Базовое понимание Generative AI (как работают GAN или базовые диффузионные подходы)
Знание основ цифровой обработки изображений (OpenCV, фильтры, преобразования)
желательно:
Знакомство с современными библиотеками (diffusers, timm, albumentations)
плюс:
Знание методов регистрации изображений (image registration) или опыт работы с библиотеками типа SimpleITK / Kornia.
Опыт участия в соревнованиях (Kaggle)
Ежемесячная компенсация: Не подразумевается
Контактное лицо: Максим Шараев, m.sharaev@skoltech.ru