Interested Article - Portable Document Format

Portable Document Format ( PDF ) — межплатформенный открытый формат электронных документов, изначально разработанный фирмой Adobe Systems в 1992 году с использованием ряда возможностей языка PostScript . В первую очередь предназначен для представления полиграфической продукции в электронном виде. Для просмотра существует множество программ, а также официальная бесплатная программа Adobe Reader . Значительное количество современного профессионального печатного оборудования имеет аппаратную поддержку формата PDF, что позволяет производить печать документов в данном формате без использования какого-либо программного обеспечения. Традиционным способом создания PDF-документов является виртуальный принтер , то есть документ как таковой готовится в своей специализированной программе — графической программе или текстовом редакторе , САПР и т. д., а затем экспортируется в формат PDF для распространения в электронном виде, передачи в типографию и т. п.

PDF с 1 июля 2008 года является открытым стандартом ISO 32000 .

Формат PDF позволяет внедрять необходимые шрифты (построчный текст), векторные и растровые изображения, формы и мультимедиа вставки. Поддерживает RGB , CMYK , Grayscale , Lab , , Bitmap , несколько типов сжатия растровой информации. Имеет собственные технические форматы для полиграфии: PDF/X-1a , PDF/X-3. Включает в себя механизм электронных подписей для защиты и проверки подлинности документов. В этом формате распространяется большое количество сопутствующей документации.

Общие сведения

Чаще всего PDF-файл является комбинацией текста с растровой и векторной графикой , реже — текста с формами , сценариями на языке JavaScript , 3D-графикой и другими типами элементов.

Информационные объёмы двух одинаково выглядящих на экране PDF-документов могут значительно различаться в зависимости от:

Для создания документа минимального объёма необходимо использовать векторную графику и «безопасные» шрифты. Всего имеется 14 таких шрифтов:

  • Times (v3) (обычный, курсив, полужирный и полужирный курсив)
  • Courier (обычный, наклонный, полужирный и полужирный наклонный)
  • Helvetica (v3) (обычный, наклонный, полужирный и полужирный наклонный)
  • Symbol

Эти шрифты можно использовать без внедрения в документ, так как их должны правильно отображать все программы. Любые другие шрифты, которые не были внедрены в документ производителем и отсутствуют в системе у зрителя, будут заменены одним из имеющихся, что может стать причиной неправильного отображения страниц, количества символов в строке и других ошибок отображения, связанных с .

Существует технология MRC (Mixed Raster Content), которая приближает возможности PDF к возможностям формата DjVu по хранению сканированных изображений с текстом .

Редактирование PDF

Существуют специальные программы, позволяющие редактировать PDF-файлы, однако их выбор значительно меньше, чем программ для создания или просмотра PDF-документов. Inkscape , начиная с версии 0.46, позволяет редактировать PDF благодаря использованию на промежуточном этапе программы Poppler . В 2017 году функциональность по редактированию PDF была поддержана в российской программе ABBYY FineReader , ранее специализировавшейся только на распознавании и конвертировании PDF в другие форматы .

История

В первое время существования данный формат был крайне непопулярен:

  • программное обеспечение компании Adobe для чтения и создания PDF было платным;
  • в PDF отсутствовала поддержка внешних ссылок, что делало его практически бесполезным во всемирной паутине;
  • PDF-документы были большего размера по сравнению с обычным текстом, что означало более длительную загрузку на медленных модемах, широко использовавшихся в те времена;
  • на слабых машинах отображение PDF-документов осуществлялось с заметными задержками;
  • существовало несколько конкурирующих форматов, таких, как , , ; даже собственный PostScript являлся конкурентом.

После того как Adobe выпустила бесплатную версию Acrobat Reader (позднее переименованную в Adobe Reader ) для чтения PDF-документов, популярность этого формата стала возрастать. Формат PDF-файлов несколько раз изменялся и продолжает эволюционировать. Существует несколько спецификаций формата, последовательно расширяющих друг друга. Для каждой новой спецификации создаются новые версии программного обеспечения из пакета Adobe Acrobat . Ниже показана таблица соответствий версий документов и версий программ, в которых впервые была введена поддержка этих документов. Версию любого PDF-документа можно узнать по первым восьми байтам, открыв этот документ в текстовом режиме, например в блокноте.

Версии Adobe PDF

год версия документа новые возможности версия ПО
1993 PDF 1.0 Acrobat 1.0
1994 PDF 1.1 пароли , ссылки , потоки , независимая от устройства цветопередача Acrobat 2.0
1996 PDF 1.2 интерактивные элементы, обработка событий мыши, мультимедийные типы, Юникод , улучшенное представление цвета и графики Acrobat 3.0
1999 PDF 1.3 цифровые подписи , цветовые пространства ICC и , JavaScript Acrobat 4.0
2001 PDF 1.4 JBIG2 , прозрачность, текстовый слой OCR Acrobat 5.0
2003 PDF 1.5 JPEG 2000 , связанное мультимедиа, объектные потоки, перекрестные потоки, слои Acrobat 6.0
2005 PDF 1.6 внедренное мультимедиа, 3D, XML -формы, AES -шифрование Acrobat 7.0
2006 PDF 1.7 Acrobat 8.0
2008 PDF 1.7, AEL3 AES -шифрование 256-битным ключом Acrobat 9.0
2009 PDF 1.7, AEL5 XFA 3.0 Acrobat 9.1
2011 PDF 1.7, AEL8 Acrobat X (10)

Программы для работы с PDF

Создание

Чтение

Свободные :

Проприетарные :

Редактирование

Свободные:

Проприетарные:

Библиотеки для работы с PDF

C

Свободные:

  • Haru

Проприетарные:

  • Adobe PDF Library SDK

C++

Свободные:

Java

Свободные:

  • — создание документов, слияние или разделение документа(ов), извлечения текста или другого контента из документа, печать, электронная подпись .
  • ICEpdf — просмотр и печать документов, преобразование в изображение, извлечения контента, поиск в документе.
  • IText — это библиотека классов для генерации, анализа и изменения документов в форматах PDF, а также XML , HTML и RTF .

Проприетарные:

  • — просмотр и обработка документов, извлечения контента.

Perl

Свободные модули:

  • — этот модуль может создавать, модифицировать и просматривайте файлы PDF.
  • — этот модуль позволяет создавать PDF-документы с использованием ряда примитивов. Результатом является PDF-файл или поток.
  • — этот модуль читает и записывает любой документ, соответствующий спецификации PDF, предоставленной Adobe.
  • — этот модуль позволяет напрямую взаимодействовать с существующими файлами PDF.
  • — этот модуль очень легкий (ограниченный) анализатор PDF.
  • — библиотека для доступа к PDF и управления им в Perl.
  • и многие другие .

PHP

Свободные:

  • — библиотека PHP для синтаксического анализа PDF файлов и извлечения таких элементов, как текст.
  • — это библиотека PHP, которая создает PDF-файлы из HTML-кода UTF-8.
  • — это библиотека, которая преобразует документ XML в документ PDF или графические файлы.

Примечания

  1. от 20 февраля 2008 на Wayback Machine lenta.ru
  2. от 14 ноября 2017 на Wayback Machine (англ.)
  3. . Дата обращения: 27 октября 2011. 3 ноября 2011 года.
  4. Bah, T. Inkscape: Guide to a Vector Drawing Program. — Prentice Hall, 2011. — ISBN 9780132764148 .
  5. . 3DNews - Daily Digital Digest . из оригинала 24 октября 2018 . Дата обращения: 24 октября 2018 .

Ссылки

Источник —

Same as Portable Document Format