Apache Java Инструмент для редактирования PDF


PDFBox, инструмент Java с открытым исходным кодом для работы с PDF-документами, был выпущен Apache.

Apache PDFBox-это библиотека Java, которая может использоваться для создания и редактирования PDF-документов, а также для извлечения их содержимого для внешнего использования. Вы также можете использовать его для цифровой подписи, печати и проверки файлов в соответствии со стандартом PDF/A-1b. Утилита включает в себя ряд утилит командной строки, которые могут быть вызваны для шифрования и дешифрования, наложения, объединения, отладки, преобразования текста в PDF и PDF в изображение.

PDFBox был первоначально создан в 2002 году Беном Личфилдом. Он был взят в качестве проекта инкубатора Apache в 2008 году и стал проектом верхнего уровня Apache в 2009 году. Этот последний выпуск представляет собой обновленную версию с улучшенной визуализацией и извлечением текста. Он предлагает поддержку unicode для создания PDF-файлов и имеет лучшую поддержку интерактивных форм.

Также была улучшена поддержка подписи и шифрования PDF-файлов, а также парсер. Теперь у этого есть «механизм самовосстановления», который попытается восстановить искаженные или поврежденные PDF-файлы.

Другие улучшения включают более низкое использование памяти и других ресурсов, улучшенный модуль предполетной подготовки для проверки соответствия PDF/A-1b и перестроенную структуру пакета, позволяющую использовать меньшие среды выполнения.

В библиотеке есть некоторые важные изменения. Ряд вызовов API был удален, и другие изменения API включают удаление getCOSDictionary() — getCOSObject теперь возвращает соответствующий подтип COSBase. PDXObjectForm был переименован в PDFormXObject, чтобы больше соответствовать спецификации PDF, и аналогично PDXObjectImage был переименован в PDImageXObject.

Заключительным прорывным изменением является упрощение:

PDPage.getContents().createInputStream()в PDPage.getContents().


Добавить комментарий