Исследователи Сбера вместе с ведущими российскими учёными создали базу изображений минералов с их описаниями для обучения искусственного интеллекта

Исследователи Сбера вместе с учёными из Института искусственного интеллекта AIRI, МГУ им М. В. Ломоносова и Минералогического музея им. А. Е. Ферсмана создали специализированную базу данных из десятков тысяч изображений образцов горных пород. Она поможет обучать искусственный интеллект, классифицировать минералы и определять их размер, а также оценивать качество работы алгоритмов компьютерного зрения для геологии.

Визуальная диагностика — самый распространённый метод анализа горных пород и минералов. Она позволяет отделить образцы, которые можно обрабатывать автоматически, от экземпляров, требующих ручного контроля. Научные группы по всему миру изучают методики визуальной диагностики с помощью искусственного интеллекта, чтобы минимизировать количество ошибок при внешней оценке.

Искусственный интеллект позволит исключить из процесса дорогостоящие спектроскопию или химический анализ в случаях, когда они выполняются для подстраховки, что экономит и деньги, и время.
В то же время, в открытом доступе отсутствуют большие тестовые базы данных для анализа изображений необработанных минералов и общепринятая система сравнительного анализа. Чтобы решить эту проблему, ученые Института искусственного интеллекта AIRI создали проект MineralImage5k. Вместе с коллегами из Sber AI и МГУ им. М. В. Ломоносова учёные собрали базу данных из 44 тыс. изображений более чем 5 тыс. видов минералов. Внутри неё содержится множество данных для классификации, сегментации и оценки размера образцов. Работа велась при поддержке Минералогического музея им. А. Е. Ферсмана, в фондах которого хранится 170 тыс. образцов горных пород и минералов.

Максим Еремёнко, вице-президент, директор Департамента развития технологий искусственного интеллекта и машинного обучения Сбербанка:
«Определить какой минерал находится перед геологом, — сложная и трудоёмкая задача. Анализ пробы занимает от 30 минут до нескольких дней. Ситуация осложняется тем, что не все породы изучены одинаково хорошо. В природе существует более пяти тысяч минералов, а подробно описаны лишь несколько сотен. Сбер вместе с ведущими учеными страны поставил перед собой непростую задачу: создать систему распознавания необработанных минералов. Также, MineralImage5k привязан к коллекции Минералогического музея, поэтому любой образец можно дополнительно изучить, используя накопленную о нем информацию. Таким образом, мы не только помогаем минерологам ускорять их работу, но и исследуем как эффективно адаптировать искусственный интеллект для большого круга задач. Мы не собираемся останавливаться на достигнутом и продолжим расширять набор данных».