«Яндекс» запустил функцию распознавания текста на изображениях

«Яндекс» объявила о запуске функции, которая позволит пользователям сервиса «Яндекс.Диск» распознавать текст на изображениях, хранящихся в облаке. С ее помощью можно легко находить нужные изображения форматов JPEG, GIF и PNG, содержащие текст поискового запроса.

yandex-photo-1

«Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро», – говорится в заявлении «Яндекса».

В основе поиска текстов на изображениях лежит технология оптического распознавания символов, способная распознавать текст на разных по виду, содержанию и качеству картинках.

Система включает в себя классификатор картинок и модуль распознавания. Сначала классификатор анализирует все изображения, отбирая те, на которых обнаруживается текст. Когда изображения с текстом отобраны, алгоритм находит на них линии, предположительно содержащие текст, а затем отбираются только те линии текста, в которых алгоритм уверен.

На следующем этапе модуль распознавания разбивает линии текста на отдельные символы. Для каждого символа выбирается несколько наиболее вероятных вариантов распознавания. После этого в дело вступает языковая модель – алгоритм принимает решение, какой из символов-кандидатов подходит лучше всего.

yandex-photo-2

Языковая модель опирается на словари и учитывает не только сходство символов с теми, что знает система, но и контекст. Если из нескольких вероятных символов складывается известное системе слово, то она принимает решение, что на картинке написано именно оно, даже в том случае, если некоторые символы-кандидаты в этом слове менее вероятны.

В сообщении отмечается, что точность распознавания текста зависит от типа изображения, его четкости, фона, на котором находится текст, и многих других факторов. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями – 63,2%, а для скриншотов приближается к 100%. Помимо русского языка система также распознает английский, украинский и турецкий.

Источник: MacDigger.ru


1 комментарий