Руководство пользователя gImageReader 3.4.1

Содержание

О программе

gImageReader — графический интерфейс для tesseract-ocr, написанный на C++.

Возможности

Обновления

Подробный список изменений доступен в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.3.1 (28 июля 2019 г.):
* hOCR: распространение атрибутов на добавленные вручную элементы (@foghawk)
* hOCR: улучшение написания слов, пишущихся через дефис (@foghawk)
* hOCR: улучшение написания слов со специальными символами (@foghawk)
* hOCR: возможность указывать количество точек на дюйм для источников изображений при экспорте в PDF (@foghawk)
* hOCR: возможность выбирать, следует ли очищать знаки переноса при экспорте в PDF
* hOCR: сопоставление кодов языков 639-2 и ISO 639-1 для установки языка проверки орфографии
* Возможность указывать запрещённые / разрешённые символы для распознавания
* Различные исправления ошибок
* Обновления перевода
* Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.3.0 (26 сентября 2018 г.):
* Поддержка tesseract-4.0.0
* Обновления перевода
* Описание всех прочих изменений возможностей программы с момента выхода предыдущей стабильной версии доступно в журналах изменений 3.2.9x
* Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.2.99 (24 февраля 2018 г.):
* gImageReader 3.3 beta
* Добавление поддержки чтения документов DJVU
* Добавление поддержки зашифрованных файлов PDF
* Редактор hOCR переписан; его функциональность значительно расширена
  - Возможность отображения вероятностей в дереве hOCR
  - Возможность использовать щелчок по холсту для перехода к соответствующему элементу в дереве hOCR
  - Поддержка массового редактирования атрибутов дочернего элемента hOCR из родительского элемента
  - Применение атрибутов семейства шрифтов, если это возможно
  - Применение и возможность переключения атрибутов полужирного и курсивного начертания
  - Корректное применение направляющей
  - Добавление поддержки поиска / замены и списка замен
  - Добавление режима предварительного просмотра при редактировании
  - Возможность вручную добавлять линии, слова и абзацы
  - Возможность обмена элементов
  - Автоматическая настройка родительских ограничительных рамок при изменении размера и удалении дочерних элементов
  - Добавление панели инструментов навигации для облегчения навигации по дереву hOCR
  - Использование относительных путей к исходным файлам в документе hOCR HTML, если исходные файлы находятся на том же уровне или ниже файла hOCR
  - Добавление экспорта в текст
  - Добавление экспорта в ODT
  - Возможность выбора формата бумаги при экспорте в PDF
  - Возможность настройки метаданных документа при экспорте в PDF
  - Возможность установки шифрования при экспорте в PDF
  - [Qt] Возможность использования QPrinter в качестве метода экспорта в PDF (обеспечивает улучшенную поддержку сложных начертаний шрифтов)

gImageReader 3.2.3 (1 июля 2017 г.):
* Исправление неработающего экспорта в hOCR
* Добавление параметра для добавления имени исходного файла / страницы к результатам распознавания

gImageReader 3.2.2 (30 июня 2017 г.):
* Использование исходного изображения для вывода в формате PDF
* Возможность сворачивания / развёртывания ветвей дерева hOCR с помощью контекстного меню
* Распознавание угловых кавычек как символов кавычек
* Исправление аварийного завершения программы при добавлении источников без страниц
* Исправление возможного аварийного завершения программы при быстром переключении документов
* [Gtk] Исправление восстановления расположения панели результатов
* [Gtk] Исправление аварийного завершения программы при ошибке отрисовки изображения
* [Gtk] Исправление отсутствия значков при использовании последних версий Gtk
* [Qt] Устранение отображения пустого изображения в случае, если не удаётся отрисовать уменьшенное изображение

gImageReader 3.2.1 (10 февраля 2017 г.):
* Добавление возможности поворота отдельных страниц многостраничных документов
* Обеспечение загрузки совместимых определений языков tesseract менеджером tessdata
* Добавление параметра сжатия по алгоритму CCITT Group4 для экспорта в монохромный PDF 
* Возможность выбора между диффузным и пороговым алгоритмами сглаживания для экспорта в монохромный PDF
* Предварительный просмотр качества сжатия JPEG в предварительном просмотре вывода в формате PDF
* Изменение яркости / контрастности / разрешения влияет на все выбранные источники
* [Qt] Поддержка многостраничных изображений с помощью QImageReader (Qt5.9+ будет поддерживать многостраничные документы TIFF)
* [Gtk] Исправление зависания программы при сохранении выделенного фрагмента
* [Qt] Исправление возможной взаимоблокировки при быстром переключении источников
* Обновлённые переводы

gImageReader 3.2.0 (23 ноября 2016 г.):
 * Стабильная версия gImageReader 3.2.0
 * Добавление горячих клавиш PageUp / PageDown для просмотра многостраничных документов
 * Описание всех прочих изменений возможностей программы с момента выхода предыдущей стабильной версии доступно в журналах изменений 3.1.9x
 * Многочисленные исправления ошибок с момента выхода версии 3.1.99 — особая благодарность Daniel Plakhotich
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.1.99 (13 октября 2016 г.):
 * Версия-кандидат gImageReader 3.2
 * Общие улучшения:
   - Нахождение критических ошибок tesseract, которые в противном случае приводят к аварийному завершению программы
   - Улучшение логики автоматической установки орфографических словарей
   - Возможность выбора между хранением языковых файлов (определения языков, орфографические словари) в системных или пользовательских локальных каталогах
 * Улучшения режима простого текста:
   - Возможность распознавания заданных пользователем областей на нескольких страницах
   - Также обрабатывать символ «\u2014» как дефис
   - Корректная обработка конечных пробелов функцией «Сохранять абзацы»
 * Улучшения редактора hOCR:
   - Добавление действий «Добавить в словарь» и «Игнорировать слово» в меню проверки орфографии редактора hOCR
   - Исключение символов, которые не образуют слова, из проверки орфографии
   - Возможность объединения соседних элементов слов
   - Возможность настройки ограничительных рамок элементов документа путем изменения размера выделения на холсте
   - Возможность удаления произвольных элементов из дерева документов
   - Возможность задания пользовательских графических областей с помощью контекстного меню соответствующей страницы
 * Улучшения экспорта в PDF:
   - Добавление возможности предварительного просмотра
   - Принятие во внимание информации о направляющей для лучшего расположения слов в сгенерированном PDF
   - Добавление параметров для выбора цветового формата и сжатия изображений, записываемых в PDF (позволяет значительно уменьшить размер PDF)
   - Корректная обработка параметров размера страницы и количества точек на дюйм
   - Улучшение логики для уравнивания интервалов между строками и словами
   - Обеспечение использования корректного символа дефиса (позволяет приложениям для работы с PDF правильно находить слова, которые пишутся через дефис)
 * Новые и обновлённые переводы
 * Различные исправления ошибок
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.1.91 (3 мая 2016 г.):
 * gImageReader 3.2 beta 2
 * Исправление аварийного завершения программы при редактировании элементов в редакторе hOCR
 * Исправление сборки в Ubuntu 14.04
 * Обновлённый перевод на чешский язык
 * Исправление нескольких опечаток
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.1.90 (28 апреля 2016 г.):
 * gImageReader 3.2 beta 1
 * Добавление начальной реализации редактора hOCR, с возможностью сохранения в формате hOCR HTML, PDF с невидимым наложенным текстом или PDF, восстановленного из извлеченного текста и графики
 * Возможность выбора и работы с несколькими источниками одновременно
 * Добавление менеджера tessdata для удобства управления определениями языков tesseract непосредственно из программы
 * Отображение индикатора хода выполнения при распознавании, добавление кнопки отмены
 * Модернизированный интерфейс Gtk
 * Поддержка определения ориентации и начертания шрифта
 * Возможность панорамирования с помощью перетаскивания с нажатой средней кнопкой мыши
 * Устранение необходимости указывать код языка и региональных параметров в пользовательских определениях языков и использование встроенного сопоставления языка и региональных параметров для поиска орфографических словарей
 * Различные исправления ошибок
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.1.2 (30 июня 2015 г.):
 * Исправление некорректного поведения функции «Добавить к текущему тексту» при работе с несколькими областями распознавания
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.1.1 (11 июня 2015 г.):
 * Исправление отсутствия заголовка при развёртывании окна в Gnome 3
 * Новые переводы: китайский (Гонконг), китайский (Тайвань)
 * Обновлённые переводы: русский, португальский

gImageReader 3.1 (1 мая 2015 г.):
 * Добавление возможности отображать пробелы
 * Возможность поиска и замены только в выделенной части выходного текста
 * Добавление функции постобработки «Сохранять абзацы»
 * Возможность открывать файлы с помощью перетаскивания
 * Улучшение отрисовки некоторых файлов PDF в интерфейсе Qt
 * Исправление неработающего сканирования при использовании некоторых сканеров в Windows
 * Поддержка автоматической установки орфографических словарей в Windows
 * Возможность сохранения результатов сканирования в форматах, отличных от PNG
 * Исправление нескольких ошибок
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.0.1 (4 января 2015 г.):
 * Исправление ошибки в интерфейсе Qt при загрузке списка замен из файла
 * Улучшение поведения функции удаления разрывов строк при наличии нескольких разрывов строк
 * Небольшие улучшения интерфейса пользователя
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 3.0 (12 декабря 2014 г.):
 * Стабильная версия gImageReader 3.0
 * Новый интерфейс Qt4/5 в качестве альтернативы интерфейсу Gtk
 * Исправление сканирования в Windows
 * Запоминание параметров изображения (яркость, контрастность и так далее) при переключении изображений
 * Поиск вперёд и назад, функция «Заменить всё», чувствительный к регистру поиск
 * Многочисленные исправления ошибок
 * Обновления перевода
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 2.93 (30 апреля 2014 г.):
 * gImageReader 3.0 beta 4
 * Добавление возможности выбора нескольких языков распознавания
 * Добавление кнопки для показа / скрытия панели результатов
 * Исправление аварийного завершения программы при загрузке отсканированного документа
 * Возможность переключения проверки орфографии с помощью контекстного меню
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 2.92 (19 марта 2014 г.):
 * gImageReader 3.0 beta 3
 * Добавление функции списка замен, позволяющей пользователю указать список замен для выполнения в распознанном тексте
 * Исправление сохранения результатов, приводившего к созданию пустых файлов
 * Исправление аварийного завершения программы при отрисовке файлов PDF
 * Сохранение разрывов строк, если им предшествует разрыв строки
 * Исправление неработающей локализации в Windows
 * Подробности в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 2.91 (20 февраля 2014 г.):
 * gImageReader 3.0 beta 2
 * Улучшение автоопределения структуры страницы путем слияния перекрывающихся областей
 * Использование собственных диалогов выбора файлов в Gnome / KDE / Windows
 * Возможность выполнения многостраничного распознавания с автоопределением структуры страницы
 * Исправление ошибки поиска / замены, которая вызвала аварийное завершение программы
 * Добавление пакетов Win64
 * Исправление некоторых других ошибок, подробности доступны в журнале фиксации: https://github.com/manisandro/gImageReader/commits/master

gImageReader 2.90 (11 февраля 2014 г.):
 * Первая бета-версия масштабно изменившейся программы gImageReader:
   - Поддержка множественного выбора (с помощью клавиши CTRL). Щелчок правой кнопкой мыши по выделению открывает контекстное меню, которое позволяет:
     - Удалять и изменять порядок отдельных выделений.
     - Распознавать выделенный текст (в буфер обмена или в панель результатов).
   - Базовое автоматическое определение структуры страницы.
   - Панель результатов теперь поддерживает отмену и повтор.
   - Конфигурация теперь автоматическая.
   - Корректное произвольное вращение изображений.
   - Обнаружение удалённых / переименованных файлов.
   - Более простой интерфейс пользователя.
   - Портирование на Gtk+3, переписывание на C++ с помощью привязок Gtkmm.

Использование

Открытие и импорт изображений

Просмотр и настройка изображений

Подготовка к распознаванию

Распознавание и постобработка в режиме «Простой текст»

Распознавание и постобработка в режиме «hOCR, PDF»

Параметры программы

Установка определений языков tesseract

Установка орфографических словарей

Участие

Чтобы принять участие в развитии программы, пожалуйста, разместите ваше обращение и/или создайте запрос на включение внесённых вами изменений на странице проекта на сайте GitHub или свяжитесь со мной по адресу manisandro@gmail.com. Я был бы особенно рад переводам — вот основные шаги для создания перевода:

  1. Загрузите последний архив с исходными файлами.
  2. Откройте папку po.
  3. Чтобы создать новый перевод, скопируйте файл gimagereader.pot в файл <язык>.po (например, файл de.po для немецкого языка). Чтобы отредактировать существующий перевод, просто выберите соответствующий файл.
  4. Переведите строки в файле <язык>.po.
  5. Отправьте файл .po по адресу manisandro@gmail.com. Спасибо!

Отладка и поддержка

Если вы нашли ошибку или у вас есть предложение, пожалуйста, разместите ваше обращение в системе отслеживания ошибок gImageReader или свяжитесь со мной напрямую по адресу manisandro@gmail.com. Не забудьте также ознакомиться с FAQ. Если программа аварийно завершается или зависает, пожалуйста, также попробуйте включить в ваше обращение или письмо следующую информацию:


Авторское право © Sandro Mani, 2009—2019, редакция: чт., 25 июля 2019 г.