Difference between revisions of "jb2unify"

From DCEwiki
Jump to: navigation, search
m
m
Line 2: Line 2:
 
[[djvutool]] | [[minidjvu]] |
 
[[djvutool]] | [[minidjvu]] |
 
}}[[Kategorie:DjVu]]</noinclude><includeonly>=== jb2unify ===</includeonly>
 
}}[[Kategorie:DjVu]]</noinclude><includeonly>=== jb2unify ===</includeonly>
 +
Tuto utilitu naprogramoval na konci dubna 2005 Yan Vernier<ref>Jak o tom [https://sourceforge.net/p/djvu/discussion/103286/thread/7ee1ba44/ informoval v diskuzi]</ref>.
 +
 +
[https://en.wikipedia.org/wiki/Léon_Bottou Léon Bottou], správce [[DjVuLibre]], ji však do kódu nezařadil, protože chtěl, aby byla podpora pro sdílení tvarů implementována přímo do [[cjb2 (DjVuLibre)|cjb2]] enkodéru. Tj. aby se slovníkem pracovalo rovnou při tvorbě '''Sjbz''' masky. Kromě toho měl obavu, aby někdo právně nenapadl kód [[DjVuLibre]] kvůli postupu, kterým '''jb2unify''' dělá primární selekci tvarů<ref>Obával se US patentu č. 5303313, který obsahuje následující větu:<blockquote>''Na základě aplikace vynálezu jsou všechny symboly, o velikosti menší než je určitá prahová hodnota (například čtyři), při procesu identifikace symbolu eliminovány.''</blockquote>
 +
Z textu je zřejmé, že jde o zcela obecný princip, který popisuje obecný způsob vykonávání činnosti (viz [http://vynalez-patent.cz/co-nelze-patentovat Co nelze patentovat?]) – když třídíme kamení, také nás nezajímá písek.
 +
 +
Kromě toho, podle [http://www.google.com/patents/US5303313 informací na google.com], platnost US patentu č. 5303313 vypršela v uplynulém r. 2017.</ref>.
 +
 +
Byla to sice pěkná myšlenka, ovšem z praktického hlediska to nedává smysl, protože sdílení tvarů se vyplatí pouze tam, kde DjVu svazek obsahuje velké množství identických tvarů. To je ale v případě naskenovaných dokumentů spíš výjimečná situace.
 +
 +
I kdybychom aplikovali sofistikovanější srovnávací mechanismus, bylo zlepšení kompresního poměru mizivé ve srovnání s režijními náklady na vyhledání podobných tvarů.
 +
 +
Tato utilita pracuje s porovnáním tvarů 1:1. U DjVu dokumentů generovaných přímo z vektorových souborů svůj účel i tak splní. U ostatních typů DjVu dokumentů by nahrazování tvarů na základě podobnosti mělo velice sporný přínos, protože by výsledek ve většině případů působil nepřirozeně.
 +
 +
 +
To byl pravděpodobně také důvod, proč Yan Vernier v implementaci podpory '''Djbz ''' do nástrojů [[DjVuLibre]] dál nepokračoval.
 +
 
https://github.com/velwant/jb2unify
 
https://github.com/velwant/jb2unify
 
==== Použití ====
 
==== Použití ====

Revision as of 10:08, 9 January 2018

Tuto utilitu naprogramoval na konci dubna 2005 Yan Vernier[1].

Léon Bottou, správce DjVuLibre, ji však do kódu nezařadil, protože chtěl, aby byla podpora pro sdílení tvarů implementována přímo do cjb2 enkodéru. Tj. aby se slovníkem pracovalo rovnou při tvorbě Sjbz masky. Kromě toho měl obavu, aby někdo právně nenapadl kód DjVuLibre kvůli postupu, kterým jb2unify dělá primární selekci tvarů[2].

Byla to sice pěkná myšlenka, ovšem z praktického hlediska to nedává smysl, protože sdílení tvarů se vyplatí pouze tam, kde DjVu svazek obsahuje velké množství identických tvarů. To je ale v případě naskenovaných dokumentů spíš výjimečná situace.

I kdybychom aplikovali sofistikovanější srovnávací mechanismus, bylo zlepšení kompresního poměru mizivé ve srovnání s režijními náklady na vyhledání podobných tvarů.

Tato utilita pracuje s porovnáním tvarů 1:1. U DjVu dokumentů generovaných přímo z vektorových souborů svůj účel i tak splní. U ostatních typů DjVu dokumentů by nahrazování tvarů na základě podobnosti mělo velice sporný přínos, protože by výsledek ve většině případů působil nepřirozeně.


To byl pravděpodobně také důvod, proč Yan Vernier v implementaci podpory Djbz do nástrojů DjVuLibre dál nepokračoval.

https://github.com/velwant/jb2unify

Použití

Volby

Příklady použití

  1. Jak o tom informoval v diskuzi
  2. Obával se US patentu č. 5303313, který obsahuje následující větu:

    Na základě aplikace vynálezu jsou všechny symboly, o velikosti menší než je určitá prahová hodnota (například čtyři), při procesu identifikace symbolu eliminovány.

    Z textu je zřejmé, že jde o zcela obecný princip, který popisuje obecný způsob vykonávání činnosti (viz Co nelze patentovat?) – když třídíme kamení, také nás nezajímá písek.

    Kromě toho, podle informací na google.com, platnost US patentu č. 5303313 vypršela v uplynulém r. 2017.