Content-Review.com

МИФИ собрал систему для анализа научных данных

В МИФИ разработали систему для анализа больших массивов научных и технических документов: статей, патентов, отчётов и данных из других источников. Она разбирает такие материалы на связанные объекты – авторов, организации, страны, физические величины, таблицы, подписи к рисункам, цитируемые работы и темы – а затем собирает из этого базу знаний. С помощью такой системы можно искать связи между исследованиями, участниками и результатами.

В диссертационных материалах автора системы приводится кейс с ВНИИА им. Н. Л. Духова: за три месяца система обработала больше 40 тысяч публикаций по облучённым реакторным материалам и нашла около 8700 числовых значений, описывающих их свойства. По оценке разработчиков, человеку на это понадобилось бы больше года, а с помощью системы удалось сократить этот срок до трёх месяцев.

Такая платформа полезна там, где важно быстро понять состояние научной области: какие свойства материалов уже изучены, где остаются пробелы, какие организации работают над темой и кто с кем связан. Это может пригодиться в атомной энергетике, медицине, анализе патентов и госпрограммах технологического лидерства. Позже в МИФИ хотят глубже встроить в систему современные нейросети, чтобы она лучше различала собственные результаты экспериментов, цитирование чужих работ и скрытые связи в данных.

//