Přenosný formát dokumentů

Portable Document Format (PDF) je otevřený standardní formát souborů, který je vlastnictvím společnosti Adobe Systems a který slouží k reprezentaci dvourozměrných dokumentů ve formátu nezávislém na zařízení a rozlišení. Každý soubor PDF obsahuje kompletní popis 2D dokumentu (a s příchodem aplikace Acrobat 3D i vložených 3D dokumentů), který zahrnuje text, písma, obrázky a 2D vektorovou grafiku, z nichž se dokument skládá. Důležité je, že soubory PDF nezakódují informace, které jsou specifické pro aplikační software, hardware nebo operační systém použitý k vytvoření nebo zobrazení dokumentu. Tato vlastnost zajišťuje, že platný soubor PDF se bude vykreslovat naprosto stejně bez ohledu na jeho původ nebo určení. PDF je také otevřený standard v tom smyslu, že kdokoli může vytvářet aplikace, které čtou a zapisují soubory PDF, aniž by musel platit licenční poplatky společnosti Adobe Systems; společnost Adobe vlastní řadu patentů týkajících se formátu PDF, ale poskytuje k nim bezplatné licence pro použití při vývoji softwaru, který je v souladu se specifikací PDF.

Soubory PDF se nejvhodněji používají k zakódování přesného vzhledu dokumentu způsobem nezávislým na zařízení. Formát PDF může popisovat velmi jednoduché jednostránkové dokumenty, lze jej však použít i pro mnohostránkové, složité dokumenty, které používají různá písma, grafiku, barvy a obrázky.

K dispozici jsou čtečky pro mnoho platforem, a to jak bezplatné (např. Xpdf), tak proprietární (např. Adobe Reader), a front-endy pro mnoho platforem pro Ghostscript.

PDF je formát souboru, nikoli programovací jazyk, a proto jej není třeba interpretovat. Například příkazy řízení toku, jako jsou if a loop, jsou odstraněny, zatímco grafické příkazy, jako je lineto, zůstávají.

To znamená, že proces přeměny souboru PDF zpět na grafiku spočívá v pouhém přečtení popisu, nikoli ve spuštění programu v interpretu jazyka PostScript. Celý svět PostScriptu, pokud jde o písma, rozvržení a měření, však zůstává nedotčen.

Když se na začátku 90. let objevil formát PDF, pomalu se prosazoval. V té době stál peníze nejen jediný nástroj pro tvorbu PDF (Acrobat), ale i software pro prohlížení a tisk souborů PDF. První verze formátu PDF neměly podporu externích hypertextových odkazů, což snižovalo jeho užitečnost na webu. Navíc existovaly konkurenční formáty, jako Envoy, Common Ground Digital Paper, DjVu a dokonce i vlastní formát souborů PostScript (.ps) společnosti Adobe. Společnost Adobe začala bezplatně distribuovat program Acrobat Reader (nyní Adobe Reader) a pokračovala v podpoře formátu PDF během jeho pomalého několikaletého náběhu. Konkurenční formáty nakonec zanikly a PDF se stal dobře přijímaným standardem.

Doporučujeme:  Lesbismus

V roce 2005 představila společnost Microsoft konkurenční formát XPS. XPS je založen na XAML a je šířen na základě bezplatné licence. Podpora formátu XPS má být zahrnuta do systému Microsoft Windows Vista.

Jako „nativní“ formát metasouborů pro Mac OS X byl zvolen formát PDF, který nahradil formát PICT z dřívějších verzí Mac OS. Zobrazovací model grafické vrstvy Quartz systému Mac OS X je založen na modelu společném pro Display PostScript a PDF a někdy se poněkud matoucím způsobem označuje jako Display PDF. Díky podpoře operačního systému mohou všechny aplikace OS X automaticky vytvářet dokumenty PDF, pokud podporují příkaz „print“.

PDF může být přístupné i osobám se zdravotním postižením. Současné formáty souborů PDF mohou obsahovat značky (v podstatě XML), textové ekvivalenty, titulky a zvukové popisy a další prvky přístupnosti. Některé softwary, například Adobe InDesign, mohou automaticky vytvářet tagované soubory PDF. Přední odečítače obrazovky, včetně Jaws, Window-Eyes a Hal, mohou číst označené soubory PDF; současné verze programů Acrobat a Acrobat Reader mohou také číst soubory PDF nahlas. Označené soubory PDF lze navíc přetavit a zvětšit pro čtenáře se slabým zrakem.

Přetrvává však mnoho problémů, z nichž v neposlední řadě je obtížné přidávat značky do stávajících nebo „starších“ souborů PDF; například pokud jsou soubory PDF generovány z naskenovaných dokumentů, značky přístupnosti a přeformátování nejsou k dispozici a musí být vytvořeny buď ručně, nebo pomocí technik OCR. Rovněž tyto procesy samy o sobě jsou často nepřístupné lidem, kteří by je mohli využívat. Přesto mohou být dobře vytvořené soubory PDF platnou volbou jako dlouhodobě přístupné dokumenty. (Pracuje se na variantě PDF založené na PDF 1.4. PDF/A nebo PDF-Archive je speciálně zmenšený pro archivační účely).

Dokumenty aplikace Microsoft Word lze převést do přístupného PDF, ale pouze v případě, že je dokument aplikace Word napsán s ohledem na přístupnost – například s použitím stylů, správného značení odstavců a alternativního textu u obrázků atd.

Dokumenty popsané značkovacími jazyky, jako je HTML/XHTML, přenášejí odpovědnost za mnohá rozhodnutí o zobrazení na vykreslovač. To znamená, že dokument XHTML se může na různých platformách webových prohlížečů vykreslovat zcela odlišně. Zatímco zobrazení dokumentu XHTML koncovým uživatelem se může výrazně lišit v závislosti na prohlížeči, platformě a rozlišení obrazovky, u souboru PDF lze rozumně očekávat, že bude vypadat pro každého prohlížeče naprosto stejně. Snaha o větší kontrolu nad uživatelským prostředím vedla mnoho autorů k používání formátu PDF pro publikování online obsahu. To platí zejména pro objednávkové formuláře, katalogy, brožury a další dokumenty, které jsou primárně formátovány pro tisk. Všudypřítomnost aplikace Adobe Reader a široká firemní dostupnost snadno použitelného WYSIWYG PDF authoringu dále přiměly mnoho (většinou firemních) autorů webových stránek publikovat širší škálu informací ve formátu PDF.

Doporučujeme:  Vestibulární žárovky

Vyhledávání textu v kolekci souborů

Aplikace Adobe Acrobat Reader 6.0 a vyšší umožňuje prohledávat kolekci souborů PDF.

Při použití vyhledávacího programu k vyhledávání textu v kolekci souborů různých typů může, ale nemusí být možné v závislosti na programu prohledávat také soubory PDF. Je to proto, že text je uložen v kódované podobě a program, který hledá nějaký text, musí kód interpretovat a vyhledat výsledek, nikoli pouze prohledat kód.

Mezi vyhledávací programy, které nefungují, patří vyhledávací program systému Windows XP (funguje však po instalaci programu PDF iFilter od společnosti Adobe) a program Agent Ransack. Pro vyhledávání na webu však některé vyhledávače, například Google a Yahoo!, zahrnují soubory PDF do vyhledávání. Běžně se také nabízí možnost zobrazit PDF ve formátu HTML (tento převod nezahrnuje obrázky).

Systém Mac OS X, jehož základním prvkem je PDF, plně podporuje vyhledávání v souborech PDF pomocí aplikace Preview, která slouží k prohlížení souborů PDF. Funkce Spotlight v Mac OS X v10.4 rozšiřuje tuto možnost na celý operační systém a umožňuje vyhledávat informace v souborech PDF z jediného vyhledávacího pole.

Na platformě Windows lze text v souborech PDF prohledávat pomocí služby Google Desktop a také Windows Desktop Search, pokud je nainstalován příslušný iFiltr dostupný od společnosti Adobe Systems.

Na platformách Linux a Unix (a experimentálních portech pro Windows) poskytuje Beagle funkce podobné Spotlightu od společnosti Apple, včetně vyhledávání textu v obsahu souborů PDF. Související program Dashboard (nezaměňovat s Dashboardem pro OS X od Apple) také prohledává soubory PDF.

Ve formátu PDF lze vyhledávat pouze tehdy, pokud byl vytvořen z existujícího elektronického dokumentu (Word, Excel atd.) obsahujícího text nebo pokud byl naskenovaný dokument zpracován pomocí optického rozpoznávání znaků (OCR), kterému se někdy říká „zachycené“, protože se tak nazývají součásti a produkty společnosti Adobe.

Doporučujeme:  Migranti

Některé soubory PDF neobsahují žádnou rastrovou grafiku. Například viz Faktografická příručka.
mapu Arktidy.

Existují nástroje, jako je pdfimages (dodávaný s Xpdf), které umožňují extrahovat rastrové obrázky ze souboru PDF. To může být velmi užitečné, pokud je soubor PDF pouhou sbírkou naskenovaných stránek.

V pozdějších verzích PDF dokumentů mohou být v dokumentu PDF také odkazy (uvnitř dokumentu nebo webové stránky), formuláře, JavaScript (zpočátku k dispozici jako zásuvný modul pro Acrobat 3.0) nebo jiné typy vloženého obsahu, které lze zpracovat pomocí zásuvných modulů.

Omezení používání a monitorování

Soubory PDF mohou být zašifrovány tak, že k zobrazení nebo úpravě obsahu je nutné heslo. V Referenčním dokumentu PDF je definováno 40bitové i 128bitové šifrování, přičemž obě využívají složitý systém RC4 a MD5. PDF Reference také definuje způsoby, jakými mohou třetí strany definovat své vlastní šifrovací systémy pro použití v PDF.

Soubory PDF mohou také obsahovat vložená digitální omezení, která zajišťují další kontroly omezující kopírování, úpravy nebo tisk. Omezení kopírování, úprav nebo tisku závisí na tom, zda je dodržuje čtecí software, takže zabezpečení, které poskytují, je velmi omezené. Dokumenty, které lze vytisknout, lze vytisknout pomocí nástroje Microsoft Office Document Image Writer, který vytváří soubory .mdi. Aplikace Image Writer má možnost převodu OCR do aplikace Microsoft Word, která zřejmě zachovává tabulky a poskytuje soubory, které lze upravovat.

Technické podrobnosti naleznete v dokumentu PDF Reference nebo v přehledu pro koncové uživatele. Stejně jako soubory HTML mohou soubory PDF odesílat informace na webový server. To může být použito ke sledování IP adresy klientského počítače, což je proces známý jako telefonování domů.

S rostoucí oblibou PDF podporují některé tiskárny také přímý tisk PDF, který dokáže interpretovat data PDF bez externí pomoci. V současné době všechny tiskárny podporující PDF podporují také PostScript, ale ne naopak.