Новый прорыв: ИИ от российских ученых научился распознавать рукописные слова без языкового контекста

Российские исследователи обучили искусственный интеллект (ИИ) распознаванию рукописного слова “шиншилла” без учета языкового контекста. Это позволит уменьшить вероятность “галлюцинаций” – некорректной интерпретации нейросетью редких слов, и улучшит системы распознавания документов, как сообщили РИА Новости в компании Smart Engines.

“Специалисты Smart Engines разработали ИИ, способный распознавать сложночитаемые рукописные слова, такие как “шиншилла”, минуя языковой контекст. Новая нейросеть основывается исключительно на особенностях визуального представления букв на изображении, что значительно снижает риск галлюцинаций для редко встречающихся слов, включая собственные имена. Эта технология значительно повысила эффективность систем распознавания паспортов РФ, применяемых крупными банками, операторами сотовой связи и другими организациями страны,” – уточнили в компании.

Слово “шиншилла” служит едва ли не тестом Тьюринга для систем, распознающих рукописный текст на кириллице, пояснили специалисты Smart Engines. В условиях неаккуратного письма строчные формы букв “ш”, “л” и “и” становятся крайне трудно различимыми.

Разработчики натренировали нейросеть “Да Винчи” на основе 1,2 миллиона строк написанного текста, созданного с равномерным распределением буквенных сочетаний. Это помогает минимизировать риск возникновения галлюцинаций в ИИ, что является одной из основных проблем. Генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров, отметил, что в процессе работы с документами важно исключать галлюцинации, так как эти данные играют ключевую роль в скоринговых моделях и бизнес-процессах учетных систем.

“Наша главная задача заключалась в разработке метода ИИ, способного распознавать сложные рукописные слова, как “шиншилла”, без обращения к языковым нормативам. Это имеет критическое значение для точного считывания документов – паспортов, регистрационных штампов и прочих. В таких случаях важно осуществлять чтение именно так, как написано, а не так, как это правильно с точки зрения языка,” – добавил Арлазаров.