Formát přenosného dokumentu

Portable Document Format (PDF) je otevřený standardní formát souborů, vlastněný společností Adobe Systems, pro reprezentaci dvourozměrných dokumentů ve formátu nezávislém na zařízení a nezávislém na rozlišení. Každý soubor PDF obsahuje kompletní popis 2D dokumentu (a s příchodem Acrobatu 3D i vložených 3D dokumentů), který zahrnuje text, písma, obrázky a 2D vektorovou grafiku, která dokument tvoří. Důležité je, že soubory PDF nekódují informace, které jsou specifické pro aplikační software, hardware nebo operační systém použitý k vytvoření nebo zobrazení dokumentu. Tato funkce zajišťuje, že platné PDF bude vykreslovat naprosto stejně bez ohledu na svůj původ nebo cíl. PDF je také otevřený standard v tom smyslu, že kdokoliv může vytvářet aplikace, které čtou a píší soubory PDF, aniž by musel platit licenční poplatky společnosti Adobe Systems; Adobe má řadu patentů týkajících se formátu PDF, ale licencuje je na základě licenčních poplatků pro použití při vývoji softwaru, který je v souladu se specifikací PDF.

Soubory PDF se nejvhodněji používají ke kódování přesného vzhledu dokumentu způsobem nezávislým na zařízení. Formát PDF sice dokáže popsat velmi jednoduché dokumenty o jedné stránce, ale může být použit i pro mnoho stránek, složitých dokumentů, které používají různé fonty, grafiku, barvy a obrázky.

K dispozici jsou čtečky pro mnoho platforem, a to jak zdarma (například Xpdf), tak i proprietárně (například Adobe Reader) a frontendy pro mnoho platforem ke Ghostscriptu.

PDF je formát souboru místo programovacího jazyka a z toho důvodu nemusí být interpretován. Například příkazy řízení toku jako if a loop jsou odstraněny, zatímco grafické příkazy jako lineto zůstávají.

To znamená, že proces přeměny PDF zpět na grafiku je záležitostí prostého přečtení popisu, spíše než spuštění programu v interpretu PostScriptu. Celý svět PostScriptu, pokud jde o písma, rozvržení a měření, však zůstává nedotčen.

Když PDF poprvé vyšlo na začátku 90. let, bylo pomalé se uchytit. V té době stály peníze nejen jediné nástroje pro tvorbu PDF té doby (Acrobat), ale také software pro prohlížení a tisk souborů PDF. Rané verze formátu PDF neměly podporu externích hypertextových odkazů, což snižovalo jeho užitečnost na webu. Navíc existovaly konkurenční formáty jako Envoy, Common Ground Digital Paper, DjVu a dokonce i vlastní formát PostScript souborů (.ps) od Adobe. Adobe začalo distribuovat program Acrobat Reader (nyní Adobe Reader) bez nákladů a pokračovalo v podpoře PDF prostřednictvím jeho pomalého víceletého náběhu. Konkurenční formáty nakonec vymřely a PDF se stalo dobře přijímaným standardem.

V roce 2005 Microsoft představil konkurenční formát pojmenovaný XPS. XPS je založen na XAML a je distribuován v rámci licence bez licenčních poplatků. Podpora XPS je naplánována jako součást Microsoft Windows Vista.

PDF bylo vybráno jako „nativní“ formát metasouboru pro Mac OS X, který nahradil formát PICT dřívějšího Mac OS. Zobrazovací model grafické vrstvy Quartz pro Mac OS X je založen na modelu běžném pro Display PostScript a PDF a je někdy poněkud matoucím způsobem označován jako Display PDF. Díky podpoře OS mohou všechny aplikace OS X vytvářet dokumenty PDF automaticky, pokud podporují příkaz „print“.

PDF může být přístupné osobám se zdravotním postižením. Současné formáty souborů PDF mohou obsahovat tagy (v podstatě XML), textové ekvivalenty, popisky a zvukové popisy a další funkce usnadnění. Některý software, například Adobe InDesign, může automaticky vypisovat označené soubory PDF. Přední čtečky obrazovky, včetně Jaws, Window-Eyes a Hal, mohou číst označené soubory PDF; současné verze programů Acrobat a Acrobat Reader mohou také číst soubory PDF nahlas. Označené soubory PDF mohou být navíc znovu načítány a zvětšovány pro čtečky se zhoršeným viděním.

Přetrvává však mnoho problémů, v neposlední řadě potíže s přidáváním tagů k existujícím nebo „starším“ PDF; například pokud jsou PDF generovány z naskenovaných dokumentů, tagy přístupnosti a opětovné načítání jsou nedostupné a musí být vytvořeny buď ručně nebo pomocí OCR technik. Také tyto procesy samotné jsou často nedostupné pro lidi, kteří by z nich měli prospěch. Nicméně dobře vytvořené PDF mohou být platnou volbou jako dlouhodobě přístupné dokumenty. (Pracuje se na variantě PDF založené na PDF 1.4. PDF/A nebo PDF-Archiv je speciálně zmenšen pro archivní účely.)

Dokumenty aplikace Microsoft Word mohou být převedeny do přístupných PDF, ale pouze v případě, že dokument aplikace Word je napsán s ohledem na přístupnost – například pomocí stylů, korektní značky odstavců a „alt“ (alternativní) text pro obrázky a tak dále.

Dokumenty popsané ve značkovacích jazycích, jako je HTML/XHTML, přenášejí odpovědnost za mnohá rozhodnutí o zobrazení na renderer. To znamená, že XHTML dokument může vykreslovat zcela odlišně napříč různými platformami webových prohlížečů. Zatímco zkušenosti koncových uživatelů s XHTML dokumentem se mohou výrazně lišit v závislosti na prohlížeči, platformě a rozlišení obrazovky, u PDF souboru lze rozumně očekávat, že bude vypadat úplně stejně pro každého diváka. Touha po větší kontrole uživatelských zkušeností vedla mnoho autorů k tomu, aby používali formát PDF k publikování online obsahu. To platí zejména pro objednávkové formuláře, katalogy, brožury a další dokumenty, které jsou primárně formátovány pro tisk. Všudypřítomnost Adobe Readeru a široká korporátní dostupnost snadno použitelného WYSIWYG PDF authoringu dále nalákaly mnoho (většinou korporátních) webových autorů k publikování širší škály informací jako PDF.

Hledání textu v kolekci souborů

Adobe Acrobat Reader 6.0 a vyšší umožňují prohledávat sbírku PDF souborů.

Pomocí vyhledávacího programu pro hledání textu v kolekci souborů různých typů, může, ale nemusí být možné prohledávat i soubory PDF, v závislosti na programu. Je to proto, že text je uložen v kódované podobě a program, který hledá nějaký text, musí interpretovat kód a hledat výsledek, ne jen hledat kód.

Vyhledávací programy, které nefungují, zahrnují programy Windows XP (nicméně fungují, jakmile je nainstalován PDF iFilter od Adobe) a Agent Ransack. Nicméně, pro vyhledávání na webu, některé vyhledávače, jako Google a Yahoo!, zahrnují soubory PDF do vyhledávání. Možnost zobrazit PDF ve formátu HTML je také běžně nabízena (tato konverze nezahrnuje obrázky).

Mac OS X, který má PDF jako základní prvek operačního systému, plně podporuje vyhledávání PDF souborů pomocí aplikace Preview, která slouží k prohlížení PDF souborů. Funkce Spotlight v Mac OS X v10.4 rozšiřuje tuto schopnost napříč celým operačním systémem, což umožňuje vyhledat informace v PDF souborech z jediného vyhledávacího pole.

Na platformě Windows lze text v souborech PDF vyhledávat pomocí Google Desktop a také Windows Desktop Search při instalaci s příslušným iFiltrem dostupným od Adobe Systems.

Na platformách Linux a Unix (a experimentálních Windows portech) poskytuje Beagle funkcionalitu podobnou Apple Spotlight, včetně textového vyhledávání v obsahu PDF. Související program Dashboard (nezaměňovat s Apple OS X Dashboard) se také dívá dovnitř PDF.

PDF může být prohledávatelné pouze tehdy, pokud bylo vytvořeno buď z existujícího elektronického dokumentu (Word, Excel, atd.) obsahujícího text, nebo pokud byl naskenovaný dokument zpracován optickým rozpoznáváním znaků (OCR), někdy nazývaným „zachytil“ kvůli názvům komponent a produktů od společnosti Adobe.

Některá PDF nemají vůbec žádnou rastrovou grafiku. Viz například Factbookova
mapa Arktidy.

Existují nástroje, jako je pdfimages (v balíku s Xpdf) pro extrakci rastrových obrázků z PDF souboru. To může být velmi užitečné, pokud je PDF pouze sbírka naskenovaných stránek.

V pozdějších PDF revizích může PDF dokument také podporovat odkazy (uvnitř dokumentu nebo webové stránky), formuláře, JavaScript (zpočátku dostupný jako plugin pro Acrobat 3.0) nebo jiné typy vloženého obsahu, které mohou být zpracovány pomocí plug-inů.

Omezení použití a monitorování

PDF mohou být šifrovány tak, že pro zobrazení nebo editaci obsahu je potřeba heslo. Odkaz PDF definuje 40bitové i 128bitové šifrování, obojí s využitím komplexního systému RC4 a MD5. Odkaz PDF také definuje způsoby, kterými mohou třetí strany definovat své vlastní šifrovací systémy pro použití v PDF.

Soubory PDF mohou také obsahovat vestavěná digitální omezení, která poskytují další kontroly, které omezují kopírování, úpravy nebo tisk. Omezení kopírování, úprav nebo tisku závisí na tom, zda je čtecí software dodržuje, takže zabezpečení, které poskytují, je velmi omezené. Dokumenty, které jsou tisknutelné, lze vytisknout pomocí aplikace Microsoft Office Document Image Writer pro vytváření souborů .mdi. Aplikace Image Writer má možnost převodu OCR do aplikace Microsoft Word, která zřejmě zachovává tabulky a poskytuje soubory, které lze upravovat.

Odkaz PDF má technické detaily nebo se podívejte na přehled koncových uživatelů. Stejně jako HTML soubory, i PDF soubory mohou odesílat informace na webový server. To by mohlo být použito ke sledování IP adresy klientského PC, což je proces známý jako telefonování domů.

S rostoucí popularitou PDF podporují některé tiskárny také přímý tisk PDF, který dokáže interpretovat PDF data bez externí pomoci. V současné době podporují všechny tiskárny schopné PDF také PostScript, ale ne naopak.