Дипфейк на собеседовании и ферма ноутбуков: в США нашли мошенников из Северной Кореи Дипфейк на собеседовании и ферма ноутбуков: в США нашли мошенников из Северной Кореи Нить, которая двигается от электричества, может стать основой умной одежды Нить, которая двигается от электричества, может стать основой умной одежды 1,8 миллиона россиян получили интернет. Вышки тащили на вертолетах и вездеходах 1,8 миллиона россиян получили интернет. Вышки тащили на вертолетах и вездеходах Беспилотные КАМАЗы проехали 6 миллионов километров Беспилотные КАМАЗы проехали 6 миллионов километров

Нейросети Яндекса помогут найти сведения о предках и исторических событиях в справочниках XIX–XX веков

Россия 1 мин
Иллюстрация предоставлена пресс-службой Яндекса

В Поиск по архивам добавили новый тип документов — справочники из фондов Национальной электронной библиотеки и Российской государственной библиотеки. Нейросеть Яндекса расшифровала почти 600 книг или 275 тысяч страниц с адресами, списками государственных служащих и информацией о недвижимости. Историки, социологи, демографы и журналисты смогут получить доступ к новым сведениям об исторических событиях и личностях, а обычные люди — ещё больше узнать о своих предках.

В новых источниках в Поиске по архивам можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово-промышленных справочников — каким делом занимались. Историков, искусствоведов и других специалистов может также заинтересовать реклама прошлых веков, размещённая в таких документах. Кроме того, в справочниках содержится информация о регионах, ранее не представленных в Поиске по архивам, например: о Санкт-Петербурге, Орловской, Воронежской и Калужской губерниях.

Благодаря сотрудничеству с Национальной электронной библиотекой и Российской государственной библиотекой ранее в Поиске по архивам впервые появились периодические издания: полные архивы «Советского спорта» и «Вечерней Москвы». В дальнейшем оцифрованных справочников станет ещё больше: нейросети Яндекса продолжат распознавать подобные документы и другие книги.

Как нейросети Яндекса распознают рукописные и печатные тексты

Технология расшифровки в Поиске по архивам основана на оптическом распознавании символов. Нейросеть узнаёт утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности.