Распознавание текста под Arch Linux/Ubuntu Linux 08.03.2013

Под Linux существуют следующие движки для оптического распознавания текста (OCR), которые представлены консольными утилитами:

  • tesseract - свободная компьютерная программа для распознавания текстов, созданная HP, купленная Google и используется как база для распознавания в Google Docs, заявлена поддержка множества языков;
  • cuneiform - разработка российской компании Cognitive Technologies, заявлена поддержка множества языков;
  • ocrad - последние обновление 10 января 2011, не поддерживает русский язык (источник);
  • gocr - последние обновление 5 марта 2013, не поддерживает русский язык (источник);

Графические интерфейсы:

  • yagf - умеет работать с cuneiform и tesseract. Написана с использованием QT. Выглядит убого. Нету возможности изменить размеры выделенной области.
  • ocrfeeder - GUI к cuneiform, tesseract, gocr и ocrad. Написана с использованием GTK. Выглядит получше чем yagf. Есть возможность менять выделенную область. Немного не удобно представлен распознанный текст, вкладкой справа, внизу.
  • gimagereader - GUI к tesseract, будет функциональней двух первых и выглядит лучше. Написана с использованием GTK.

Установим cuneiform и ocrfeeder в качестве графической среды

# ubuntu
sudo apt-get install cuneiform ocrfeeder

# arch linux
yaourt -S cuneiform ocrfeeder

Хотя cuneiform давненько не обновлялся (последние изменения датированы 19 апреля 2011 года, по информации с wikipedia) результат полученный после распознавания вполне удовлетворительный.

Онлайн-сервисы для оптического распознавания текста

Дополнительное чтиво

Цитата
Невозможно — это всего лишь громкое слово, за которым прячутся маленькие люди. Им проще жить в привычном мире, чем найти в себе силы что-то изменить. Невозможное — это не факт. Это только мнение. Невозможное — это не приговор. Это вызов. Невозможное — это шанс проявить себя. Невозможно — это не навсегда. Невозможное возможно
Мухаммед Али
Категории
Архив