djvutxt (DjVuLibre)

Z DCEwiki
Skočit na navigaci Skočit na vyhledávání

Název

djvutxt - je konzolový nástroj pro rychlou extrakci skryté textové vrstvy

Použití

djvutxt [volby] djvusoubor [výstup]

Popis

Utilita djvutext je určena především pro rychlé vyhledávání v rámci textového obsahu vícestránkových djvu dokumentů. Výstup lze buď ukládat do souboru, nebo rourou předávat k dalšímu zpracování.

Volby

--page=<rozsah>

Nastavením rozsahu lze vymezit stránky se kterými se má pracovat. Stránky jsou určeny pořadovým číslem a odděleny čárkou ('1,3,5). Pokud má být zpracován souvislejší rozsah stránek, pak je mezi pořadovými čísly místo čárky pomlčka (6-10). Pořadí zpracování stránek lze obrátit tím, že se rozsah uvede v obráceném pořadí, tedy 10-1, bude zpracovávat stránky od desáté k první.

--detail=[page|column|region|para|line|word|char]

Není-li uveden žádný jiný --detail, automaticky se předpokládá že se mají vypsat znaky, bez specifikace oblasti. Tudíž výsledek je stejný jako by bylo pro detail uvedeno klíčové slovo char. V ostatních případech se kromě textu vypíše v S-syntaxi i vymezení příslušné oblasti

--escape

Tímto parametrem lze ovlivnit výstup, jak mají být zobrazovány netisknutelné znaky, které jsou ve výchozím stavu uloženy jako UTF-8

Příklady