PDF格式(.pdf)

背景和上下文

    • MIME类型:应用程序/pdf
    • Adobe Acrobat格式。
    • 交换和归档多页文档的标准格式。
    • PDF是可移植文档格式的缩写。
    • 二进制文件格式。
    • 在设备中存储文本、字体、图像和二维矢量图形和分辨率独立方式。
    • 还可以存储嵌入的光栅图像。
    • 支持多种有损和无损压缩方法。

导入和导出

  • 导入["文件.pdf“]导入PDF文件,返回每页的光栅化图像列表。
  • 导入["文件.pdf“,元素]从PDF文件导入指定元素。
  • 导入["文件.pdf“,{元素,附属的,附属的b条,}]导入子元素。
  • 可以使用指定导入格式导入["文件",“PDF”]导入["文件",{“PDF”,元素,}].
  • 导出["文件.pdf“,快递]从任意表达式、单元格或笔记本对象创建PDF文件。
  • 导出["文件.pdf“,快递,元素]通过处理创建PDF文件快递作为指定元素元素.
  • 导出["文件.pdf“,{快递1,快递2,},{{元素1,元素2,}}]分别对待快递指定相应的元素.
  • 导出["文件.pdf“,快递,选择1->val值1,]出口快递其中指定的选项元素被认为具有指定的值。
  • 导出["文件.pdf“,{元素1->快递1,元素2->快递2,},“规则”]使用规则指定要导出的元素。
  • 导出["文件.pdf“,快递]有效渲染快递就像打印到默认打印机一样。如果快递不是笔记本,它将有效地创建一个与执行评估的笔记本具有相同属性的笔记本,或者如果评估没有在笔记本中开始,则创建一个默认笔记本。前端打印样式环境选项用于选择打印环境。
  • Wolfram语言试图尽可能保留内容的矢量描述,但需要PDF不支持的现代渲染方法的内容将被光栅化。这包括所有具有透明度、颜色渐变、纹理或着色的3D图形和2D内容。
  • 有关完整的一般信息,请参阅以下参考页:
  • 导入, 导出从文件导入或导出到文件
    云导入, CloudExport(云导出)从云对象导入或导出到云对象
    导入字符串, 导出字符串从字符串导入或导出到字符串
    导入字节数组, 导出字节数组从字节数组导入或导出到字节数组

笔记本界面

  • 另存为将活动笔记本导出为PDF文件。
  • 将所选内容另存为将笔记本的选定部分导出为PDF。

导入元素

  • 概述导入元素:
  • “元素”此文件中可用的元素和选项列表
    “摘要”文件摘要
    “规则”所有可用元素的规则列表
  • 结构元素:
  • “内容图表”文档目录的图形
    “内容起始页”给出目录名称和页码的规则列表
    “页数”页数
    “摘要”文件摘要
  • 整个PDF文档的数据表示元素:
  • “纯文本”给出整个文档文本内容的字符串
    “格式化文本”整个文档的格式化文本序列
  • 以列表形式给出的数据表示元素表示文档的每一页:
  • “页面格式化文本”格式化文本列表,每个代表一个页面
    “页面图形”列表绘图物体,每个代表一个页面
    “页面图像”列表图像物体,每个代表一个页面
    “页面纯文本”字符串列表,每个代表页面的明文
    “页面定位文本”列表文本包含文字坐标的对象
  • 导入默认情况下使用“页面图像”元素。
  • 元数据元素:
  • “作者”文件的作者
    “创建日期”文档的创建日期,作为日期对象
    “创建者”创建内容的程序
    “关键字”文档中的关键字
    “修改日期”文件的修改日期,作为日期对象
    “元信息”作为字符串和日期对象提供的元数据
    “制作人”将数据转换为PDF的程序
    “主题”文件的主题
    “标题”文件标题
    “版本”文件的PDF规范版本
  • 超链接、批注和表单域元素:
  • “FormFieldRules”页码和给出表单字段名称和值的规则列表的关联
    “突出显示的文本”每一页上每个突出显示的文本部分的页码和字符串列表的关联
    “超链接”页码和列表的关联超链接每个页面上每个链接的对象
    “文本注释”页码和注释文本的关联
    “URL”页码和列表的关联统一资源定位地址每个页面上每个链接的对象
  • 嵌入式图像元素:
  • “嵌入式图像计数”页码和图像数量的关联
    “嵌入的图像”每个页面的页码和嵌入图像的关联
  • 附件元素:
  • “附件计数”附件数量
    “附件列表”作为表达式的已处理附件列表
    “附件名称”附件名称列表
    “附件详细信息”提供附件内容和元数据的关联列表
    “原始附件列表”以字节数组列表形式给出的附件
    “附件数据”提供原始附件数据和元数据的关联列表
  • 元素“附件详细信息”是为每个附件提供关联的列表。每个关联通常具有以下键:
  • “姓名”分配给附件的名称
    “内容”导入的内容
    “创建日期”为附件记录的创建日期
    “修改日期”为附件记录的修改日期
    “字节计数”附件中的字节数
  • 元素“附件数据”是为每个附件提供关联的列表。每个关联通常具有以下键:
  • “姓名”分配给附件的名称
    “原始内容”原始内容作为字节数组
    “创建日期”为附件记录的创建日期
    “修改日期”为附件记录的修改日期
    “字节计数”附件中的字节数
  • 对于包含多个部分的元素,在{元素,第页,指数}{元素,指数}形式,其中第页指数可以是以下任一项:
  • n个n个第个项目
    -n个从末尾开始计数
    n个;;n个通过
    n个;;;;n个通过步骤为
    {n个1,n个2,}特定项目n个
  • 使用{“FormFieldRules”,第页,姓名}导入与字段对应的表单值姓名.

选项

  • 导入选项:
  • 图像分辨率$ImageResolution(图像分辨率)用于光栅化的dpi图像分辨率
    图像大小自动
  • 打印机点的最终显示图像大小
  • “密码”以字符串形式给出的文档密码
    光栅尺寸自动光栅化的光栅尺寸(像素)
    “呈现元素”全部要呈现的文档的一部分“页面图像”
  • 的可能设置“呈现元素”:
  • “批注”批注,例如突出显示或附加文本框
    “表单域”来自已填写表单字段的数据
    全部呈现文档中的所有元素
    不呈现文档中的其他元素
  • 导出选项:
  • 图像大小自动整体图像大小
    图像分辨率72dpi中光栅化的图像分辨率
    “允许光栅化”自动是否光栅化需要高级版本PDF的图形
  • 的可能设置“允许光栅化”:
  • 自动光栅化包含需要高级版本PDF才能渲染的透明度或渐变等功能的图形
    真的始终栅格化图形
    False(错误)始终使用矢量图形,在必要时部署高级PDF功能以实现忠实渲染

示例

全部打开全部关闭

基本示例  (4)

导入PDF文件的页面:

将PDF导入为纯文本:

将图像导出为PDF:

将排版数学公式导出为与分辨率无关的PDF:

范围  (3)

导入  (3)

导入PDF文件的第一页:

以明文形式导入PDF的第一页:

导入一些元数据:

导入元素  (26)

可用元素  (1)

可用元素列表:

结构元素  (3)

“内容图表”  (1)

导入文件目录的图形:

获取图形边的名称:

“内容起始页”  (1)

导入每个节开始的页面:

“页面计数”  (1)

导入文档中的页数:

数据表示  (6)

“纯文本”  (1)

从整个文档导入文本:

“格式化文本”  (1)

从文档中的表单字段导入名称和值:

“页面图形”  (1)

将文档的第一页导入为矢量图形:

“页面图像”  (1)

导入文档每页的图像列表:

“页面纯文本”  (1)

将文档每页中的文本作为列表导入:

“页面定位文本”  (1)

将文档每页中的文本作为列表导入:

元数据  (9)

“作者”  (1)

导入文档作者:

“创建日期”  (1)

导入文档的创建日期:

“创建者”  (1)

导入创建文档的程序:

“关键字”  (1)

从文档导入关键字:

“修改日期”  (1)

导入文档的修改日期:

“制作人”  (1)

导入转换文档的程序:

“主题”  (1)

导入文档主题:

“标题”  (1)

导入文档标题:

“版本”  (1)

导入文档的PDF版本:

批注和表单域  (5)

“FormFieldRules”  (1)

从文档中的表单字段导入名称和值:

“突出显示的文本”  (1)

导入文档中突出显示的文本的明文:

“超链接”  (1)

导入文档中的超链接:

“文本注释”  (1)

导入文档中文本批注的明文:

“URL”  (1)

导入文档中的URL:

嵌入式图像  (2)

“嵌入式图像计数”  (1)

导入文档每页的嵌入图像数:

“嵌入的图像”  (1)

从文档的每个页面导入嵌入图像:

导入选项  (3)

图像分辨率  (1)

以适合FHD屏幕的分辨率导入PDF:

使用适合HiDPI屏幕的分辨率导入PDF:

光栅尺寸  (1)

从PDF中渲染一个非常小的图像:

从PDF中渲染更大的图像:

“呈现元素”  (1)

导入文档图像而不呈现批注:

与带有呈现批注的文档进行比较: