Příručka k aplikaci gImageReader 3.4.1
Obsah
gImageReader je grafická nadstavba pro engine tesseract-ocr.
- Možnost ručně označit části obrázku, které mají být rozpoznány, případně nechat rozpoznat celou plochu obrázku.
- Samočinné rozpoznání rozvržení strany.
- Otevírání obrázků a PDF dokumentů, dále import obrázků ze skenovacích zařízení, ze schránky a zachycených snímků obrazovky.
- Rozpoznaný text je možné nechat zobrazit hned vedle zdrojového obrázku, případně nasměrovat do schránky.
- Rozpoznání vícejazyčného textu.
- Základní úpravy výstupního textu, včetně funkce vyhledání/nahrazení a odebrání konců řádků.
- Kontrola výstupního textu na překlepy ve zvoleném jazyce, pokud je nainstalován příslušný slovník.
- Upozornění uživatele na chybějící slovníky a navržení jejich instalace.
Podrobný seznam změn je k dispozici v protokolu úprav: https://github.com/manisandro/gImageReader/commits/master
gImageReader 3.1.2 (30. červen 2015):
- Opravuje nesprávné chování funkce „Připojit ke stávajícímu textu“ v případech, kdy je rozpoznáváno z vícero oblastí textu
- Podrobnosti viz protokol úprav: https://github.com/manisandro/gImageReader/commits/master
gImageReader 3.1.1 (11. červen 2015):
- Opraveno zobrazování titulku maximalizovaného okna aplikace v prostředí Gnome 3
- Přidány nové překlady: čínština – honkongský a taiwanský dialekt
- Aktualizovány překlady: ruský a portugalský
gImageReader 3.1 (1. květen 2015):
- Přidána volba zvýrazňování prázdných míst
- Umožňuje omezit oblast nahrazování textu pouze na označenou část výstupního textu
- Do následného zpracování přidána volba pro zachování odstavců
- Soubory je nyní možné otevírat i jejich přetažením do okna aplikace
- Zlepšeno vykreslování některých PDF souborů v Qt variantě uživatelského rozhraní
- V systému MS Windows opraveno nefunkční skenování s některými modely skenerů
- V systému MS Windows již podporována automatická instalace slovíků pro kontrolu překlepů
- Naskenované obrázky je možné ukládat i v jiných datových formátech, než png
- Opraveno vícero dalších chyb
gImageReader 3.0.1 (4. leden 2015):
- Opravena chyba v Qt variantě uživatelského rozhraní, projevující se při načítání souboru se seznamem pro nahrazování textu
- Zlepšeno chování funkce odebírání konců řádků v případě vícero po sobě jdoucích konců řádků
- Provedena drobná vylepšení uživatelského rozhraní
- Podrobnosti viz protokol úprav: https://github.com/manisandro/gImageReader/commits/master
gImageReader 3.0 (12. prosinec 2014):
- gImageReader 3.0 konečné
- Přidáno nové, alternativní uživatelské rozhraní, založené na jiných softwarových knihovnách – Qt4/5, namísto Gtk
- Opravaveno skenování při provozování v operačním systému Microsoft Windows
- Při přepínání mezi obrázky si aplikace již pamatuje nastavení obrazu pro konkrétní obrázek (světlost, kontrast, atd)
- Vyhledávání textu je nyní možné směrem ke konci i začátku, lze nahrazovat všechny výskyty vyhledaného, při vyhledávání (volitelně) rozlišovat mezi malými a velkými písmeny
- Opraveno mnoho dalších chyb
- Zaktualizovány překlady textů rozhraní aplikace do ostatních jazyků
- Podrobnosti viz protokol úprav: https://github.com/manisandro/gImageReader/commits/master
gImageReader 2.93 (30. duben 2014):
- gImageReader 3.0 test 4
- Přidána možnost rozpoznávání ve vícero jazycích naráz
- Přidáno tlačítko pro zobrazení/skrytí podokna s výstupním textem
- Zapínání / vypínání kontroly překlepů je nyní možné z kontextové nabídky
- Opraven pád při načítání naskenovaného dokumentu
gImageReader 2.92 (19. březen 2014):
- gImageReader 3.0 test 3
- Přidána funkce seznamu nahrazování, umožňující uživatelům vytvářet seznamy nahrazení, která mají být provedena v rozpoznaném textu
- Opravena chyba v ukládání, mající za následek prázdné soubory
- Opraveny pády aplikace při vykreslování obsahu PDF souborů
- Konce řádků, kterým předchází konec řádku, jsou nyní zachovávány
- Ve verzi pro systém Microsoft Windows opraveno zobrazení textů rozhraní v překladech do ostatních jazyků
gImageReader 2.91 (20. únor 2014):
- gImageReader 3.0 test 2
- Zlepšeno samočinné rozpoznávání rozvržení strany díky spojení překrývajících se oblastí
- Proveden přechod na standardní dialog pro otevírání souborů z daného desktopového prostředí / operačního systému (Gnome/KDE / Microsoft Windows)
- Zprovozněno rozpoznávání více stran i se samočinným rozpoznáváním rozvržením strany
- Opravena funkce vyhledávání/nahrazování, která dříve způsobovala pády aplikace
- Přidána verze pro 64bit verzi systému Windows
gImageReader 2.90 (11. únor 2014):
- gImageReader 3.0 test 1
- Přidána možnost vytvořit výběry vícero oblastí k rozpoznání (druhý a další výběry přidržením klávesy CTRL). Dále přibyla kontextová nabídka, vyvolávaná kliknutím pravým tlačítkem myši na výběru. Z této nabídky lze:
- Mazat a přeuspořádávat jednotlivé výběry
- Nechat rozpoznat text v označené oblasti – buď do schránky, nebo do podokna s výstupním textem
- Přidáno základní samočinné rozpoznávání rozvržení strany
- V podokně s výstupním textem přibyla funkce Zpět a Znovu
- Nastavení nyní probíhá samočinně
- Natáčení obrázků o libovolný úhel nyní funguje tak, jak má
- Přidáno zjišťování (externě) smazaných/přejmenovaných souborů
- Zpřehledněno uživatelské rozhraní
- Rozhraní aplikace přeneseno na knihovny Gtk+ verze 3, a její zdrojové kódy přepsány do jazyka C++ s použitím můstků Gtkmm
- Obrázky lze otevírat/importovat prostřednictvím podokna Zdroje, na které se dostanete kliknutím na tlačítko vlevo nahoře na hlavní liště.
- Obrázek či PDF dokument otevřete kliknutím na tlačítko Otevřít na panelu Obrázky.
- K zachycení snímku obrazovky, vložení obrázku ze schránky, či otevření nedávno používaného souboru, slouží šipka vedle tlačítka otevřít.
- Seznam otevřených obrázků je možné spravovat pomocí tlačítek, následujících za tím pro otevírání souborů. Dočasné soubory (jako jsou snímky obrazovky a data ze schránky) jsou při ukončení aplikace samočinně smazány.
- Přímo ze skenovacího zařízení získáte obrázek kliknutím na panel Získat v podokně Zdroje.
- Tlačítka na hlavní liště slouží k přibližování a oddalování, dále k pootočení obrázku o libovolný úhel. Změny přiblížení je možné dosáhnout též umístěním ukazatele na obrázek, stisknutím klávesy CTRL a otáčením kolečkem myši.
- Nástroje pro základní úpravy obrázku se nacházejí na liště Úpravy obrázku, která se zapíná klikutím na tlačítko Úpravy obrázku, nacházejícím se na hlavní liště. Mezi nástroje, které jsou zde v současnosti k dispozici, patří úprava jasu a kontrastu a změna rozlišení (pomocí interpolace).
- Oblasti, ve kterých má být rozpoznán text, lze označit natažením (kliknutí levým tlačítkem + pohyb myší) obdélníku nad příslušnou částí obrázku. Takových výběrů je možné vytvořit více, jen je třeba při vytváření dalších přidržet klávesu CTRL.
- Alternativně je možné použít tlačítko Samočinné rozpoznání rozvržení strany, které se nachází na hlavní liště. Aplikace se tak pokusí samočinně určit přislušné oblasti k rozpoznání a případně srovnat řádky pootočením obrázku.
- Výběry mohou být mazány a přeuspořádávány prostřednictvím kontextové nabídky, která se objeví poté, co na ně kliknete pravým tlačítkem. Je též možné změnit velikost výběru tažením za rohy obdélníku, který jej označuje.
- Jazyk rozpoznávaného textu se vybírá z rozbalovací nabídky tlačítka Rozpoznat, nacházejícího se na hlavní liště. Je-li nainstalován příslušný slovník pro kontrolu překlepů, je též možné volit mezi dostupnými místními variantami daného jazyka. Toto ovlivňuje pouze kontrolu překlepů v rozpoznaném textu. Nerozpoznané jazykové definice pro tesseract se objeví pod předponou názvu souboru, uživatelsky je ale možné naučit aplikaci tyto soubory rozpoznávat určením příslušných pravidel v nastavení aplikace (viz níže). Rozpoznávání ve vícero jazycích naráz je možné určit v podnabídce Vícejazyčné rozbalovací nabídky.
- Rozpoznávání označených části obrázku (nebo celého obrázku, pokud nebyl proveden výběr oblastí) zahájíte kliknutím na tlačítko Rozpoznat na hlavní liště. Případně, jednotlivé oblasti mohou být rozpoznány též kliknutím pravého tlačítka myši na požadovaný výběr. Z této kontextové nabídky je též možné rozpoznaný text nasměrovat do schránky, namísto do podokna výstupu.
- Jakmile je rozpoznán, text se objeví v podokně výstupního textu (pokud nebyl přesměrován do schránky).
- Je-li k dispozici slovník pro kontrolu překlepů pro rozpoznávaný jazyk, bude rozpoznaný text takto zkontrolován. Jaký slovník bude ve výsledku použit, je možné změnit buď z nabídky jazyka vedle tlačítka Rozpoznat, nebo z nabídky, která se objeví po kliknutí pravým tlačítkem myši na oblasti textu.
- Při rozpoznávání dalšího textu, může tento být buď připojen, vložen na pozici kurzoru, nebo může zcela nahradit stávající rozpoznaný text. Záleží dle režimu, zvoleného v nabídce Režim připojování, která se nachází na liště podokna výstupního textu.
- Mezi další nástroje pro následné zpracování textu patří odebírání konců řádků, rušení prázdného místa a další (dostupné od druhého tlačítka dále na liště podokna výstupního textu). Dále lze v textu vyhledávat a nahrazovat. Seznam pravidel nahrazování lze vytvořit kliknutím na tlačítko Najít a nahradit
na liště podokna výstupního textu a poté kliknutím na tlačtko Dosazování.
- Změny, provedené na rozpoznaném textu, mohou být brány zpět a též opakovány, pomocí příslušných tlačítek na liště podokna výstupního textu.
- Rozpoznaný text je možné uložit do souboru kliknutím na tlačítko Uložit na liště podoka výstupního textu.
- Podokno výstupu lze skrýt klikutím na tlačítko úplně vpravo na liště podokna výstupu. Pozor, tato operace též vymaže dosavadní rozpoznaný text, takže o něj přijdete, pokud jste ho mezitím např. neuložili do souboru.
- Nastavení jsou dostupná z nabídky Aplikace, dostupné jako tlačítko úplně vpravo na hlavní liště. Pokud je aplikace provozována v prostředí Gnome 3, nabídka Aplikace je součástí horní lišty tohoto prostředí.
- Co je možné nastavit: písmo v podokně výstupního textu, zda má aplikace hlásit chybějící slovníky pro kontrolu překlepů, hlášení vydání nových verzí aplikace.
- V případě Gtk+ varianty uživatelského rozhraní aplikace, je součástí nastavení též orientace podokna výstupního textu (svislá zabere pravou stranu okna aplikace, vodorovná spodní). U Qt varianty rozhraní může být pozice podokna výstupu libovolná, stačí přetáhnout jeho titulní lištu.
- Dále, je možné vytvořit vlastní pravidla pro párování jazykových definic engine tesseract a jazyka (data pro tesseract tuto informaci žel neobsahují). Seznam předurčených pravidel se nachází v sekci Předurčené jazykové definice. Další definice lze přidat kliknutím na tlačítko Přidat, které se nachází níže. Pravidla pro určení jazyka se sestávají z těchto tří polí:
- Předpona názvu souboru: Název souboru s jazykovými daty pro tesseract má podobu <predpona>.traineddata, tj. pro češtinu, je soubor nazýván cs.traineddata a předpona je cs.
- Kód dle normy ISO: Jedná se o kombinaci kódu jazyka dle normy ISO 639-1 a kódu země dle normy ISO 3166-2, oddělené podtržítkem (tj. cs_CZ). Tato informace je nezbytná pro určení slovníku pro kontrolu překlepů v daném jazyce. Volba země má význam pro samočinnou instalaci slovníků pro kontrolu překlepů, kde je nutná nalezení příslušného balíčku se slovníky. V případě, že žádná z kombinací v normách nevyhovuje, lze použít kód smyšlený, jen pak nebude možné určit odpovídající slovník pro kontrolu překlepů.
- Obecný název jazyka: Člověkem používaný název jazyka, který slouží jako označení položky pro daný jazyk v nabídce Jazyk.
- V systému GNU/Linux stačí spustit správce balíčků a nainstalovat ty, které obsahují požadované jazykové definice (balíčky nejspíš budou nazvány ve stylu tesseract-langpack-<jazyk>).
- V systému Microsoft Windows je třeba si stáhnout definice požadovaných jazyků ze stránek projektu, jejich soubory (<jazyk>.traineddata) pak umístit tam, kam odkazuje (nabídka) Start→Všechny programy→gImageReader→Jazykové definice pro Tesseract.
- Aby se instalace nových jazykových definic projevila, je třeba buď aplikaci ukončit a spustit znovu, nebo použít v nabídce aplikace kliknout na Znovu zkontrolovat přítomnost jazykových dat.
- V systému GNU/Linux, pokud daná distribuce podporuje technologii PackageKit, aplikace v případě potřeby nabídne samočinnou instalaci nezbytných slovníků. A pokud snad samočinná instalace z nějakého důvodu nefunguje, můžete slovníky nainstalovat pomocí správce balíčků v systému (balíčky budou nazvané něco jako hunspell-<jazyk> nebo aspell-<jazyk>).
- V systému MS Windows, se aplikace pokusí automaticky stáhnout příslušný slovník pro kontrolu překlepů z http://cgit.freedesktop.org/libreoffice/dictionaries/tree. Slovníky též mohou být nainstalovány ručně: pro příslušný jazyk (tj. např. cs_CZ), stáhněte soubory s příponami .dic a .aff a umístěte je tam, kam odkazuje (nabídka) Start→Všechny programy→gImageReader→Slovníky pro kontrolu překlepů.
Pro své návrhy a příspěvky všeho druhu, vyplňte formulář a nebo požadavek na začlenění na stránce projektu na portálu GitHub, nebo napište na manisandro@gmail.com. Zvláště ceněny jsou překlady textů uživatelského rozhraní aplikace. Jak takový překlad vytvořit (v bodech):
- Stáhněte si nejnovější zdrojové kódy.
- Přejděte do složky po.
- Pokud překlad do příslušného jazyka ještě nebyl založen, vytvořte kopii souboru gimagereader.pot a nazvěte ji <standardni_zkratka_jazyka>.po (tj. např. de.po pro němčinu). V již existujícím překladu pokračujte upravováním příslušného souboru.
- Doplňte překlad řetězců v <jazyk>.po.
- Výsledný po soubor pošlete na manisandro@gmail.com. Díky!
Pokud narazíte na problém či máte nějaký nápad na zlešení aplikace, vyplňte prosím formulář v systému správy hlášení chyb pro gImageReader, nebo napište přímo na manisandro@gmail.com.
Pokud se setkáváte s pády aplikace či tím, že přestává reagovat, pokuste se do svého hlášení zahrnout též následující údaje:
- Pokud se objeví komponenta pro obsluhu chyby, připojte do své zprávy též ladicí informace, které vypíše. Aby tyto informace byly úplné, je v případě provozování pod systémem GNU/Linux třeba, aby byl nainstalován ladicí nástroj gdb a příslušné ladicí symboly. Balíček, obsahující ladicí symboly bývá obvykle nazván <nazevbalicku>-debuginfo nebo <nazevbalicku>-dbg. V případě verze pro systém Microsoft Windows jsou ladicí symboly přítomny již ve výchozí instalaci.
- Pokud aplikaci provozujete v systému Microsoft Windows, připojte ke zprávě soubory protokolů %ProgramFiles%\gImageReader\gimagereader.log a %ProgramFiles%\gImageReader\twain.log.
- Pokud aplikaci provozujete v systému GNU/Linux, spusťte ji z emulátoru terminálu a ke zprávě připojte cokoli, co se v terminálu objevilo.
- Pokuste se co možná nejlépe popsat, co jste s aplikací dělali a zda se daří situaci navodit opakovaně.
Copyright ©2009-2015 Sandro Mani, revize: pondělí, 20. duben 2015