Том 13, № 3Страницы 43 - 58

Maximal Coordinate Discrepancy as Accuracy Criterion of Image Projective Normalization for Optical Recognition of Documents

I.A. Konovalenko, V.V. Kokhan, D.P. Nikolaev
Общепринято применение проективной нормализации (частный случай ортокоррекции и коррекции перспективы) к фотографиям документов для их последующего оптического распознавания. При этом неточности нормализации могут приводить к ошибкам распознавания. На сегодняшний день в литературе предложен ряд критериев точности нормализации, однако их соответствие качеству распознавания не исследуется. В данной работе для случая документа фиксированной структуры обосновывается равномерная вероятностная модель ошибок распознавания, в соответствии с которой вероятность верного распознавания символа скачком падает до нуля с ростом невязки координат этого символа. Для этой модели доказано, что критерий точности нормализации изображения, равный максимальной по текстовым полям документа невязке координат, монотонно связан с вероятностью верного распознавания всего документа. Показано, что задача вычисления максимальной невязки координат не сводится к ближайшей известной, т.е. задаче дробно-линейного программирования. Наконец, впервые получено аналитическое решение задачи вычисления максимальной невязки координат на объединении многоугольников.
Полный текст
Ключевые слова
ортокоррекция; коррекция перспективы; проективная нормализация изображений; оптическое распознавание символов; критерии точности; невязка координат; нелинейное программирование.
Литература
1. Kunina, I.A. Blind Radial Distortion Compensation from Video Using Fast Hough Transform / I.A. Kunina, A.P. Terekhin, S.A. Gladilin, D.P. Nikolaev // ICRMV 2016, SPIE. - 2017. - V. 1025308. - P. 1-7.
2. Шапиро, Л. Компьютерное зрение / Л. Шапиро, Д. Стокман, А.А. Богуславский, С.М. Соколов. - М.: БИНОМ. Лаборатория знаний, 2013.
3. Путятин, Е.П. Вопросы нормализации изображений при проективных преобразованиях / Е.П. Путятин, Д.О. Прокопенко, Е.М. Печеная // Радиоэлектроника и информатика. - 1998. - Т. 2, № 3. - С. 82-86.
4. Zeynalov, R. Восстановление формы страницы текста для коррекции геометрических искажений / R. Zeynalov, A. Velizhev, A. Konushin // Proceedings of the 19 International Conference GraphiCon-2009. - M., 2009. - С. 125-128.
5. Zhukovsky, A. Segments Graph-Based Approach for Document Capture in a Smartphone Video Stream / A. Zhukovsky, D. Nikolaev, V. Arlazarov, V. Postnikov, D. Polevoy, N. Skoryukina, T. Chernov, J. Shemiakina, A. Mukovozov, I. Konovalenko // ICDAR 2017, IEEE Computer Society. - 2018. - V. 1. - P. 337-342.
6. Болотова, Ю.А. Обзор алгоритмов детектирования текстовых областей на изображениях и видеозаписях / Ю.А. Болотова, В.Г. Спицын, П.М. Осина // Компьютерная оптика. - 2017. - Т. 41, № 3. - С. 441-452.
7. Шемякина, Ю.А. Исследование алгоритмов вычисления проективного преобразования в задаче наведения на планарный объект по особым точкам / Ю.А. Шемякина, А.Е. Жуковский, И.А Фараджев // Искусственный интеллект и принятие решений. - 2017. - Т. 2017, № 1. - С. 43-49.
8. Skoryukina, N. Document Localization Algorithms Based on Feature Points and Straight Lines / N. Skoryukina, J. Shemiakina, V.L. Arlazarov, I. Faradjev // ICMV 2017, SPIE. - 2018. - V. 106961H. - P. 1-8.
9. Povolotskiy, M.A. Russian License Plate Segmentation Based on Dynamic Time Warping / M.A. Povolotskiy, E.G. Kuznetsova, T.M. Khanipov // Proceedings ECMS 2017. - 2017. - P. 285-291.
10. Skoryukina, N.S. Snapscreen: TV-Stream Frame Search with Projectively Distorted and Noisy Query / N.S. Skoryukina, T.S. Chernov, K.B. Bulatov, D.P. Nikolaev, V.L. Arlazarov // ICMV 2016, SPIE. - 2017. - V. 103410Y. - P. 1-5.
11. Youye Xie. Geometry-Based Populated Chessboard Recognition / Youye Xie, Gongguo Tang, W. Hoff // Tenth International Conference on Machine Vision (ICMV 2017). - 2018. - V. 1069603. - P. 1-5.
12. Arvind, C.S. Vision Based Speed Breaker Detection for Autonomous Vehicle / C.S. Arvind, R. Mishra, K.Vishal, V. Gundimeda // Tenth International Conference on Machine Vision (ICMV 2017). - 2018. - V. 106960E, - P. 1-9.
13. Dubuisson, M.P. A Modified Hausdorff Distance for Object Matching / M.P. Dubuisson, A.K. Jain // Proceedings of 12th International Conference On Pattern Recognition. - 1994. - V. 1. - P. 566-568.
14. Sim, D.G. Object Matching Algorithms Using Robust Hausdorff Distance Measures / D.G. Sim, O.K. Kwon, R.H. Park // IEEE Transactions on Image Processing. - 1999. - V. 8, № 3. - P. 425-429.
15. Orrite, C. Shape Matching of Partially Occluded Curves Invariant Under Projective Transformation / C. Orrite, J.E. Herrero // Computer Vision and Image Understanding. - 2004. - V. 93, № 1. - P. 34-64.
16. Николаев, П.П. Проективно инвариантное описание неплоских гладких фигур. 1. Предварительный анализ задачи / П.П. Николаев // Сенсорные системы. - 2016. - Т. 30, № 4. - С. 290-311.
17. Балицкий, А.М. О проективно инвариантных точках овала с выделенной внешней прямой / А.М. Балицкий, А.В. Савчик, Р.Ф. Гафаров, И.А. Коноваленко // Проблемы передачи информации. - 2017. - Т. 53, № 3. - С. 84-89.
18. Савчик, А.В. Метод проективного сопоставления для овалов с двумя отмеченными точками / А.В. Савчик, П.П. Николаев // Информационные технологии и вычислительные системы. - 2018. - Т. 2018, № 1. - С. 60-67.
19. Катаманов, С.Н. Автоматическая привязка изображений геостационарного спутника MTSAT-1R / С.Н. Катаманов // Современные проблемы дистанционного зондирования Земли из космоса. - 2007. - Т. 1, № 4. - С. 63-68.
20. Karpenko, S. UAV Control on the Basis of 3D Landmark Bearing-Only Observations / S. Karpenko, I. Konovalenko, A. Miller, B. Miller, D. Nikolaev // Sensors. - 2015. - V. 15, № 12. - P. 29802-29820.
21. Холопов, И.С. Алгоритм коррекции проективных искажений при маловысотной съёмки / И.С. Холопов // Компьютерная оптика. - 2017. - Т. 41, № 2. - С. 284-290.
22. Legge, G.E. Psychophysics of Reading. I. Normal Vision / G.E. Legge, D.G. Pelli, G.S. Rubin, M.M. Schleske // Vision Research. - 1985. - V. 25, № 2. - P. 239-252.
23. Кунина, И.А. Слепая компенсация радиальной дисторсии на одиночном изображении с использованием быстрого преобразования Хафа / И.А. Кунина, С.А. Гладинин, Д.П. Николаев // Компьютерная оптика. - 2016. - Т. 40, № 3. - С. 395-403.
24. Arlazarov, V.V. Modelling the Flow of Character Recognition Results in Video Stream / V.V. Arlazarov, O.A.E. Slavin, A.V.E. Uskov, I.M. Janiszewski // Вестник ЮУрГУ. Серия: Математическое моделирование и программирование. - 2018. - Т. 11, № 2. - С. 14-28.
25. Avriel, M. Nonlinear Programming: Analysis and Methods / M. Avriel . - North Chelmsford: Courier Corporation, 2003.
26. Charnes, A. Programming with Linear Fractional Functionals / A. Charnes, W.W. Cooper // Naval Research Logistics Quarterly. - 1962. - V. 9, № 3, 4. - P. 181-186.
27. Boyd, L. Convex optimization / L. Boyd. - Cambridge: Cambridge University Press, 2004.
28. Biswas, A. Optimality and Convexity Theorems for Linear Fractional Programming Problem / A. Biswas, S. Verma, D.B. Ojha // International Journal of Computational and Applied Mathematics. - 2017. - V. 12, № 3. - P. 911-916.
29. Юдин, Д.Б. Математические методы управления в условиях неполной информации / Д.Б. Юдин. - М.: Издательская группа URSS, 2010.
30. Рокафеллар, Р. Выпуклый анализ / Р. Рокафеллар - М.: Мир, 1973.