Interested Article - OCRFeeder

OCRFeeder — программа, предоставляющая графический интерфейс пользователя для систем оптического распознавания символов CuneiForm , Tesseract , и . OCRFeeder является свободно распространяемой программой для операционной системы Linux .

Функции

  • Графические форматы ввода данных: PNG , JPEG , BMP , TIFF , GIF , Portable anymap (PNM, PGM, PBM, PPM) и другие. Импорт PDF -файлов.
  • Форматы вывода данных: текстовый файл , ODT , HTML , PDF.
  • Обработка изображений для улучшения качества распознавания — фильтры шумов, чёрного цвета и оттенков серого; и другие виды обработок, доступных для Unpaper .
  • Ручное выделение блоков на странице.
  • Проверка орфографии .
  • Получение изображений со сканера посредством программы SANE .
  • Распознавание нескольких изображений по порядку за один проход (пакетное распознавание).

Используемые компоненты

  • PIL библиотека Python для работы с изображениями.
  • Unpaper — для обработки изображений.
  • ReportLab — для импорта PDF-файлов.
  • PyGTK и Libgnome — для графического интерфейса.
  • PyeEnchant («привязка» для Python ) и PyGtkSpell («привязка» для Python) — для проверки орфографии.

Примечания

  1. Дата обращения: 2 апреля 2012. 15 апреля 2012 года.
  2. Дата обращения: 2 апреля 2012. 25 июля 2012 года.
  3. 19 января 2012 года.
  4. Дата обращения: 2 апреля 2012. Архивировано из 29 февраля 2012 года.

Литература

  • Журнал Linux Format № 11 (150) Ноябрь 2011 — Тимур Мубаракшин рассматривает приложения OCR для Linux: Сuneiform-Qt, GOCR, Tesseract, OCRFeeder, ABBYY FineReader и YAGF.

Ссылки

Источник —

Same as OCRFeeder