Обновленное Руководство по товарным знакам 2024 от наших экспертов.
Получить бесплатно →
Патент
Прекратил действие
Изобретение № 2251737

СПОСОБ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ЯЗЫКА РАСПОЗНАВАЕМОГО ТЕКСТА ПРИ МНОГОЯЗЫЧНОМ РАСПОЗНАВАНИИ

Правообладатель: АБИ Девелопмент, Инк. (US) Авторы: Анисимович К.В. (RU), Терещенко В.В. (RU), Рыбкин В.Ю. (RU)
Формула изобретения

1. Способ автоматического распознавания текста, содержащего фрагменты, написанные на нескольких языках по информации растрового изображения, состоящий из следующих этапов: разбиение информации растрового изображения на множество фрагментов, изображающих символы текста, распознавание отдельных символов текста, объединение распознанных символов текста, в группы, предположительно составляющие слова, формирование, по крайней мере, одной гипотезы о языковой принадлежности группы символов как слова, принятие или отклонение гипотезы о языковой принадлежности группы символов как слова, причем этап формирования гипотезы о языковой принадлежности группы символов как слова, в свою очередь, состоит, по крайней мере, из следующих действий: выбор перечня используемых лингвистических моделей, модельная оценка слова.2. Способ по п.1, в котором этап распознавания символов текста по фрагментам выполняют с помощью классификатора, содержащего признаки символов двух или более языков.3. Способ по п.1, в котором этап принятия или отклонения гипотезы о языковой принадлежности группы символов как слова дополнительно включает выбор перечня для окончательной проверки языковой принадлежности слова, оценку слова на соответствие выбранным языкам.4. Способ по п.3, в котором перечень языков для проверки языковой принадлежности текста выбирают автоматически.5. Способ по п.3, в котором перечень языков для проверки языковой принадлежности текста выбирают вручную.6. Способ по п.1, в котором этап принятия или отклонения гипотезы о языковой принадлежности группы символов как слова дополнительно включает вычисление комплексной оценки слова, включающей, по крайней мере, оценку качества распознавания символов, словарную оценку как часть модельной оценки слова.7. Способ по п.6, в котором комплексная оценка дополнительно включает специальный показатель, характеризующий согласованность символов и/или слов в тексте.8. Способ по п.7, отличающийся тем, что специальный показатель включает геометрическое согласование символов между собой в пределах слова.9. Способ по п.7, отличающийся тем, что специальный показатель включает геометрическую согласованность символов между собой в пределах строки.10. Способ по п.7, отличающийся тем, что специальный показатель включает языковую согласованность слова с соседними словами.11. Способ по п.7, отличающийся тем, что специальный показатель включает оценку правильности восстановления информации символов по растровому изображению при наличии помех.12. Способ по п.1, отличающийся тем, что объединение распознанных символов текста в группы, предположительно составляющие слова, выполняют с помощью моделей.

показать больше
Спасибо! Мы перезвоним вам в ближайшее время!