写点什么

什么是 Office Open XML 文件格式

作者:Jerry Wang
  • 2022 年 8 月 07 日
  • 本文字数:685 字

    阅读完需:约 2 分钟

什么是 Office Open XML 文件格式

Office Open XML是一种基于 XML 的文件格式,已发布为 ECMA-376。 它被 Microsoft Office 2007/2010 用作默认文件格式。


有计划在 OpenOffice.org 中支持这种文件格式,以便与 Microsoft Office 2007/2010 进行互操作。


格式有 3 种主要类型,2 种次要类型作为重要补充:


  • WordprocessingML - 用于文字处理器文档(文件扩展名可能是 docx、docm)


一个例子见下图:



  • SpreadsheetML - 用于电子表格文档(文件扩展名可能是 xlsx、xlsm)

  • PresentationML - 用于演示文档(文件扩展名可能是 pptx、pptm)

  • DrawingML - 被其他标记语言用来表示图形数据。

  • VML - 遗留的矢量标记。

Packaging Conventions

OpenXML 文档是由parts 的平面集合组成的包。 每个 part 都有一个不区分大小写的部分名称,该名称由斜线 (/) 分隔的段名称序列组成,例如/pres/slides/slide1.xml


在大多数情况下,ZIP 压缩用于打包部件,在这种情况下,术语“包”是指 ZIP 存档,而部件是指存档在其中的单个文件。 在这种情况下,部件名称是存档中的文件路径。


part 名称如下图 partname 所示:



每个 part 也有一个内容类型,[Content_Types.xml 提供存档中每个部分的内容类型。


Part 的 Content-Type 例子如下:


Relationships

包和部件可以包含与其他部件以及外部资源的显式关系。 每个显式关系都有一个 ID 和一个类型,并且关系类型使用 URI 命名。一个例子如下图所示:



每个包或部件的显式关系集存储在关系部件中,其名称(或路径)遵循特定约定,例如 称为“/a/b/c.xml”的部分的关系部分称为“/a/b/_rels/c.xml.rels”。 作为一个特例,包作为一个整体的关系部分称为“/_rels/.rels”。


这个特殊的 relationship 如下图所示:



发布于: 刚刚阅读数: 3
用户头像

Jerry Wang

关注

🏆InfoQ写作平台-签约作者🏆 2017.12.03 加入

SAP成都研究院开发专家,SAP社区导师,SAP中国技术大使。2007 年从电子科技大学计算机专业硕士毕业后加入 SAP 成都研究院工作至今。工作中使用 ABAP, Java, JavaScript 和 TypeScript 进行开发。

评论

发布
暂无评论
什么是 Office Open XML 文件格式_xml_Jerry Wang_InfoQ写作社区