HTML格式(.html,.htm)

背景和上下文

    • 已注册的MIME类型:文本/html
    • HTML标记语言和文件格式。
    • 创建网页的主要语言。
    • HTML是源自超文本标记语言的缩写。
    • 纯文本格式。
    • 描述网页外观的结构和方面。
    • 1993年首次作为互联网工程特别工作组(IETF)工作草案出版。
    • 自1996年以来由万维网联盟(W3C)维护。
    • 最新版本是4.01,于1999年作为W3C推荐发布。
    • 国际标准ISO/IEC 15445:2000。
    • XHTML的前身。

导入和导出

  • 导入["文件.html“]给出了HTML文件的纯文本表示。
  • 导入["文件.html“,“数据”]从HTML中提取表格数据。
  • 导出["文件.html“,快递]创建的HTML版本快递.
  • 导出["目录",快递]翻译快递将输出保存在指定的目录中。
  • 导入["文件.html“]返回一个字符串,将文件的文本内容表示为带格式的纯文本。
  • 导出["文件.html“,快递]将笔记本、单元格、单元格列表或其他笔记本元素导出为HTML。
  • 导出总是创建一个完整的HTML文档,而不仅仅是一个HTML片段。
  • 输出由一个或多个HTML文件和两个目录组成,即HTMLFiles和HTMLLinks。
  • 默认情况下,Wolfram语言在导出为HTML时将排版表达式转换为GIF图像。
  • Wolfram语言可以导出工具提示超链接表达式转换为HTML,必要时创建HTML图像映射。
  • 导入["文件.html“,元素]从HTML文件导入指定的元素。
  • 导入["文件.html“,{元素,附属的,附属的b条,}]导入子元素。
  • 导入["文件.html“,{{元素1,元素2,}}]导入多个元素。
  • 可以使用指定导入格式导入["文件",“HTML”]导入["文件",{“HTML”,元素,}].
  • 导出["文件.html“,快递, 元素]通过处理快递作为指定元素元素.
  • 导出["文件.html“,{快递1,快递2,},{{电子束1,元素2,}}]每种食物快递指定相应的元素.
  • 导出["文件.html“,快递,选择1->val值1,]出口快递指定的选项元素具有指定的值。
  • 导出["文件.html“,{元素1->快递1,元素2->快递2,},“规则”]使用规则指定要导出的元素。
  • 有关完整的一般信息,请参阅以下参考页:
  • 导入, 导出从文件导入或导出到文件
    云导入, 云导出从云对象导入或导出到云对象
    导入字符串, 导出字符串从字符串导入或导出到字符串
    导入字节数组, 导出字节数组从字节数组导入或导出到字节数组

笔记本界面

  • 将所选内容另存为将笔记本的选定部分导出为网页。
  • 另存为将整个笔记本导出为网页。

导入元素

  • 概述导入元素:
  • “元素”此文件中可用的元素和选项列表
    “摘要”文件摘要
    “规则”所有可用元素的规则列表
  • 导入元素:
  • “数据”HTML表和列表元素中的文本和数字内容
    “完整数据”完整的表格内容,包括空HTML表和列表元素
    “超链接”超链接,以字符串列表形式给出
    “图像”HTML文档中嵌入的图像
    “纯文本”格式化为文本的HTML文档
    “来源”原始HTML源作为单个字符串
    “标题”HTML页面标题
    “图像链接”嵌入图像的URL
    “XML对象”整个文档的符号XML表示
  • 导入默认情况下使用“纯文本”元素。
  • 将纯HTML文档导入为“XML对象”,Wolfram语言将尝试将其转换为格式良好的XHTML并导入生成的XML文件。
  • 导出元素:
  • “笔记本”笔记本表达
    “笔记本对象”笔记本对象表达
    “表达式”任意的Wolfram语言表达式

选项

  • 导入选项:
  • 字符编码自动导入文件时使用的原始字符编码
    “数字”真的如果可能,是否将数据字段导入为数字
  • 如果HTML文件中未指定文件的字符编码,导入使用指定的编码字符编码。可能编码的完整列表如下所示$字符编码.
  • 使用字符编码->自动,导入使用HTML文件中指定的编码。如果未指定,则使用“UTF8”编码。如果文件中存储的任何字节序列无法在“UTF8”,“ISOLatin1”使用。
  • Wolfram语言在导出到HTML时始终使用UTF-8编码。
  • 导出选项:
  • “内容”False(错误)是否导出MathML内容元素
    “转换规则”自动指定来自Wolfram系统的映射 HTML元素的单元格样式,包括标记的内联版本和块级版本
    “ConvertClosed”(转换关闭)真的是否导出前向关闭的单元格组
    “ConvertLinked笔记本”False(错误)是否将链接的笔记本转换为HTML
    “ConvertReverseClosed”False(错误)是否导出反向闭合的单元格组
    “CSS”自动要使用或链接到的CSS样式表
    “完整文档”真的是否导出完整的HTML文档
    “图形3DOutput”自动如何表示三维图形表达式
    “图形输出”“GIF”如何表示图形表达式
    “标题属性”{}要在HTML中插入的属性<头部>标签,作为规则列表给出
    “标题元素”{}HTML的子元素<头部>标签
    “操纵输出”“CDF”如何表示操纵表达
    “数学输出”“GIF”如何表示排版表达式
  • 的可能设置“图形输出”,“图形3DOutput”,“操纵输出”、和“数学输出”是:
  • “CDF”将目标表达式转换为嵌入式CDF
    “显示窗体”将目标表达式转换为其外观的ASCII近似值
    “GIF”将目标表达式转换为GIF
    “输入表单”将目标表达式转换为输入表单
    “巴布亚新几内亚”将目标表达式转换为PNG
    “JPEG”将目标表达式转换为JPEG
    “SVG”将目标表达式转换为SVG
  • “数学输出”->“数学建模语言”将所有排版表达式转换为MathML。
  • “Graphics3DOutput”->自动使用为指定的相同方法转换三维图形“图形输出”.
  • 用于输出转换的选项的选择基于单元格顶层的对象类型。例如,仅包含2D图形的单元格将使用“图形输出”,而包含嵌入排版或代码中的二维图形的单元格将使用“数学输出”.
  • 的可能设置“CSS”是:
  • 自动从Wolfram System样式表创建CSS样式表
    不创建样式表文件或内联CSS样式
    "文件.css“使用样式表文件
  • 允许的设置“ConvertClosed”(转换关闭)“ConvertReverseClosed”是:
  • False(错误)不导出关闭的组
    真的导出所有单元格组
    “链接页面”将每个转发关闭的组导出到单独的页面

示例

全部打开全部关闭

基本示例  (3)

从网页导入所有图像:

以纯文本形式读取HTML文件:

显示导入此文件中可用的元素:

从此文件导入表格内容:

这会将数学表达式导出到HTML:

显示保存到“HTML文件”目录:

导入光栅化排版表达式:

范围  (5)

这意味着单元格表达式转换为HTML:

Wolfram语言可以使用嵌入的工具提示和超链接将图形导出到HTML图像映射:

Wolfram System样式元素到HTML的映射可以指定为“转换规则”:

将格式化表格导出为HTML:

创建HTML片段: