>>> from docx import Document
>>> word=Document(r'F:\word练习\qq.docx')
>>> for 段落 in word.paragraphs:
print(段落.text)
标题一
我是二级标题
今天下午下雨,但是我还是觉得好热
我是一级标题
我是二级标题
今天星期三,晚上的时候写了英语作文
#获取所有标题一
>>> for i in word.paragraphs:
if i.style.name=='Heading 1':
print(i.text)
标题一
我是一级标题
#获取所有标题
>>> import re
>>> for i in word.paragraphs:
if re.match('^Heading \d+$',i.style.name):
print(i.text)
标题一
我是二级标题
我是一级标题
我是二级标题
#只获取正文内容
>>> for i in word.paragraphs:
if i.style.name=='Normal':
print(i.text)
今天下午下雨,但是我还是觉得好热
今天星期三,晚上的时候写了英语作文
#查看名称
>>> for i in word.paragraphs:
print(i.style.name)
Heading 1
Heading 2
Normal
Normal
Normal
Normal
Normal
Heading 1
Heading 2
Normal
Normal