Ученые ИТМО разработали метод цифровизации наноматериалов для алгоритмов искусственного интеллекта

Ученые Университета ИТМО разработали алгоритм, который автоматически определяет размеры, форму, структуру поверхности наноматериалов и формирует их индивидуальных цифровых двойников. Разработка позволит строить более эффективные предсказательные модели в области материаловедения, а также осуществлять обратный дизайн структур от их свойств к способу получения. Это придаст импульс созданию новых материалов с заранее заданными текстурными свойствами для биомедицины, оптики и биотехнологии.

Машинное обучение и ИИ активно используются в органической и медицинской химии, однако до сих пор существует большой недостаток данных о наноматериалах, а также их цифровых представлений.

Морфология, то есть распределение по размерам, форма и структура поверхности, описываются существующими инструментами неполно. Например, зачастую форму частиц обозначают тривиальными названиями (сферическая, кубическая и т.д.), которые не только не несут количественной информации о форме, но и не позволяют судить о схожести/различиях между разными формами. Размеры описываются средним значением и иногда его разбросом, чего недостаточно для характеризации большинства систем. Структура поверхности не учитывается совсем. Отсутствие системного подхода к параметризации и упрощенное описание изучаемых систем тормозит появление эффективных инструментов для поиска новых наноматериалов с исключительными свойствами, а также исследований в этой сфере, в том числе с использованием методов искусственного интеллекта.

Новый метод ученых Университета ИТМО позволит решить эту проблему. Исследователи разработали алгоритм, который всесторонне описывает морфологию наноматериалов, находит похожие по свойствам и подсказывает параметры синтеза для разработки новых структур по желаемым характеристикам.

Алгоритм анализирует изображение наноматериала с электронного микроскопа, экстрагирует (то есть извлекает) нужные характеристики и затем составляет списки параметров, представленных в виде числовых значений.

Обычно подобная подготовительная работа проводится вручную: ученому приходится просматривать множество статей в поиске нужных параметров и синтетических процедур (концентрация веществ, температура, при которой может быть синтезирован наноматериал).

«Наш алгоритм сравнивает списки чисел, “выжимает” наиболее значимую информацию из изображения наноматериала, отбрасывает шумы. Подобное сжатие позволяет получить небольшой точный набор признаков, из которого мы можем не только узнать интересующие параметры, но и в обратном порядке, основываясь на них, восстановить структуру или создать новую, — объясняет автор исследования, аспирант Университета ИТМО Никита Серов. — Еще инструмент может находить по изображению похожие наноматериалы, это работает примерно как поиск в Google или Яндекс.Картинках. Вы делаете запрос, добавляете иллюстрацию, и алгоритм находит наиболее схожие системы из базы данных и предлагает способы их получения. Весь процесс занимает меньше минуты, тем не менее планируется дальнейшая оптимизация алгоритма. Это открывает новые возможности для исследований».

Ученый добавляет, что алгоритм может распознавать как изображения, полученные при помощи электронной микроскопии, так и нарисованные собственноручно. Для этого необходимо загрузить рисунок контура исследуемой наночастицы, например, в форме круга, квадрата. Также можно обозначить поверхность структуры — шипы, бугорки, отверстия.

Для проверки алгоритма исследователи ИТМО использовали собственную базу данных синтезов карбоната кальция. Это вещество часто встречается в природе: у многих живых существ из него состоят панцири, и это неслучайно. С точки зрения химического синтеза, это довольно простой материал, его легко видоизменять и получать структуры с очень разнообразной и сложной морфологией. Затем ученые продемонстрировали работоспособность системы на данных по синтезу наночастиц золота, экстрагированных из научных статей.

Контроль над морфологическими параметрами наночастиц необходим, чтобы определять их поведение в живом организме, токсичность, безопасность, а также разрабатывать перспективные материалы для биомедицины, терапии, биотехнологии.

«Морфология наноматериалов очень влияет на их поведение в клетках и иммунный ответ живого организма. Например, размер наночастиц определяет, в каких органах человека они будут накапливаться — в почках, печени или будут долго циркулировать в кровотоке. Форма может влиять на метаболизм клеток. При изменении площади поверхности наноматериала могут активизироваться его антибактериальные или токсические свойства», — подчеркивает Никита Серов.

Ученые планируют продолжить работу над предсказательной моделью, проверить ее на практике, осуществив синтез отсутствующей в базе данных системы по рекомендациям модели, а также расширить базу данных и сделать общедоступный и удобный ресурс для пользования по всему миру. Работа выполнена при поддержке программы «Приоритет 2030»​.