PyPDF2 DocumentInformation类
classPyPDF2.DocumentInformation
基类:
DictionaryObject
表示 PDF 文件中提供的基本文档元数据的类。可以通过PdfReader.metadata
访问此类。
文档元数据的所有文本属性都有 两个属性,例如。author
和 author_raw
。
非原始属性将始终返回一个TextStringObject
,这使得它非常适合显示元数据的情况。
如果 PyPDF2 无法解码字符串的文本编码,raw
属性有时会返回一个ByteStringObject
;
这需要调用者的额外安全性,因此不经常访问。
属性 author: Optional[str]
访问文档作者的只读属性。
返回一个 unicode 字符串 ( TextStringObject
) 或者None
如果没有指定作者。
属性 author_raw: Optional[str]
作者的“原始”版本;可以返回一个ByteStringObject
属性 creation_date: Optional[datetime]
访问文档创建日期的只读属性。
属性 creation_date_raw: Optional[str]
创建日期的“原始”版本;可以返回一个ByteStringObject
.
通常采用 D:YYYYMMDDhhmmss[+-]hh'mm 格式,其中后缀是与 UTC 的偏移量。
属性 creator: Optional[str]
访问文档创建者的只读属性。
如果文档是从另一种格式转换为 PDF,则这是创建原始文档的应用程序(例如 OpenOffice)的名称。返回一个 unicode 字符串 ( TextStringObject
) 或者None如果没有指定创建者。
属性 creator_raw: Optional[str]
creator 的“原始”版本;可以返回一个ByteStringObject
.
getText(key: str)→ Optional[str]
指定键的文本值或None
。
1.28.0 版后已弃用:使用属性(例如title
/ author
)。
indirect_reference: Optional[IndirectObject]
属性 modification_date: Optional[datetime]
访问文档修改日期的只读属性。
最近修改文档的日期和时间。
属性 modification_date_raw: Optional[str]
修改日期的“原始”版本;可以返回一个ByteStringObject
.
通常采用 D:YYYYMMDDhhmmss[+-]hh'mm 格式,其中后缀是与 UTC 的偏移量。
属性 producer: Optional[str]
访问文档的producer的只读属性。
如果文档是从另一种格式转换为 PDF,则这是将其转换为 PDF 的应用程序的名称(例如,OSX Quartz)。返回一个 unicode 字符串 ( TextStringObject
) 或者None
如果未指定生产者。
属性 producer_raw: Optional[str]
生产者的“原始”版本;可以返回一个ByteStringObject
.
属性 subject: Optional[str]
访问文档主题的只读属性。
返回一个 unicode 字符串 ( TextStringObject
) 或None
如果未指定主题。
属性 subject_raw: Optional[str]
主题的“原始”版本;可以返回一个ByteStringObject
.
属性 title: Optional[str]
访问文档标题的只读属性。
返回一个 unicode 字符串 ( TextStringObject
) 或者None 如果没有指定标题。
属性 title_raw: Optional[str]
标题的“原始”版本;可以返回一个ByteStringObject
.
更多建议: