Распознавание текста под Arch Linux/Ubuntu Linux 08.03.2013
Под Linux существуют следующие движки для оптического распознавания текста (OCR), которые представлены консольными утилитами:
- tesseract - свободная компьютерная программа для распознавания текстов, созданная HP, купленная Google и используется как база для распознавания в Google Docs, заявлена поддержка множества языков;
- cuneiform - разработка российской компании Cognitive Technologies, заявлена поддержка множества языков;
- ocrad - последние обновление 10 января 2011, не поддерживает русский язык (источник);
- gocr - последние обновление 5 марта 2013, не поддерживает русский язык (источник);
Графические интерфейсы:
- yagf - умеет работать с cuneiform и tesseract. Написана с использованием QT. Выглядит убого. Нету возможности изменить размеры выделенной области.
- ocrfeeder - GUI к cuneiform, tesseract, gocr и ocrad. Написана с использованием GTK. Выглядит получше чем yagf. Есть возможность менять выделенную область. Немного не удобно представлен распознанный текст, вкладкой справа, внизу.
- gimagereader - GUI к tesseract, будет функциональней двух первых и выглядит лучше. Написана с использованием GTK.
Установим cuneiform и ocrfeeder в качестве графической среды
# ubuntu
sudo apt-get install cuneiform ocrfeeder
# arch linux
yaourt -S cuneiform ocrfeeder
Хотя cuneiform давненько не обновлялся (последние изменения датированы 19 апреля 2011 года, по информации с wikipedia) результат полученный после распознавания вполне удовлетворительный.
Онлайн-сервисы для оптического распознавания текста
Дополнительное чтиво