Распознавание текста под Arch Linux/Ubuntu

Под Linux существуют следующие движки для оптического распознавания текста (OCR), которые представлены консольными утилитами:

  • tesseract - свободная компьютерная программа для распознавания текстов, созданная HP, купленная Google и используется как база для распознавания в Google Docs, заявлена поддержка множества языков;
  • cuneiform - разработка российской компании Cognitive Technologies, заявлена поддержка множества языков;
  • ocrad - последние обновление 10 января 2011, не поддерживает русский язык (источник);
  • gocr - последние обновление 5 марта 2013, не поддерживает русский язык (источник);

Графические интерфейсы:

  • yagf - умеет работать с cuneiform и tesseract. Написана с использованием QT. Выглядит убого. Нету возможности изменить размеры выделенной области.
  • ocrfeeder - GUI к cuneiform, tesseract, gocr и ocrad. Написана с использованием GTK. Выглядит получше чем yagf. Есть возможность менять выделенную область. Немного не удобно представлен распознанный текст, вкладкой справа, внизу.
  • gimagereader - GUI к tesseract, будет функциональней двух первых и выглядит лучше. Написана с использованием GTK.

Установим cuneiform и ocrfeeder в качестве графической среды

# ubuntu
sudo apt-get install cuneiform ocrfeeder

# arch linux
yaourt -S cuneiform ocrfeeder

Хотя cuneiform давненько не обновлялся (последние изменения датированы 19 апреля 2011 года, по информации с wikipedia) результат полученный после распознавания вполне удовлетворительный.

Онлайн-сервисы для оптического распознавания текста

Дополнительное чтиво

blog comments powered by Disqus