使用Python將Word表格嵌入Excel中

今日需求

使用Python將Word表格嵌入Excel中

其實就是把Word中的表格轉到Excel中,順便做一個調整。這個需求在實際工作中,很多人還是經常碰到的!

如果單單是兩個表格,那隻要簡單的複製黏貼即可,但如果上百了呢?那就得考慮自動化了。好在今天碰到的需求中的原檔案格式是比較有規律的,那直接來嘗試一下。

# 首先要pip install python-docx# 如果原檔案是doc格式,那就先轉成docxfrom docx import Documentimport pandas as pdpath = “。/word表格轉excel。docx”docx = Document(path)table_s = docx。tables # 返回一個Table物件的列表len(table_s) ——> 2 # 返回值是2,因為原檔案中只有兩個表格list_ = [] # 初始化一個空列表,用來裝後面的dict_for table in table_s: # 迴圈所有的表格列表 dict_ = {} dict_[‘名稱’] = table。cell(0, 1)。text # 表格的索引是從(0行,0列)開始 dict_[‘身份’] = table。cell(0, 3)。text dict_[‘簡介’] = table。cell(1, 1)。text for i in range(3, len(table。rows)): # 後續的內容格式不固定,所以迴圈獲取 dict_[table。cell(i, 0)。text] = table。cell(i, 1)。text list_。append(dict_)

當完成上述操作後,list_就會是一個字典列表。

使用Python將Word表格嵌入Excel中

接下來,將列表轉為DataFrame進行操作即可。

df = pd。DataFrame(list_)# 先將前三列作為索引,然後逆透視其他列,其實這就是個一維錶轉二維表的過程df = df。set_index([‘名稱’, ‘身份’, ‘簡介’])。stack(level=0)。to_frame()# 重新設定一下行列索引的名字df。index。names = [‘名稱’, ‘身份’, ‘簡介’, ‘物質’]df。columns = [‘現狀’]

此時的df就跟需求結果相差不大了。

使用Python將Word表格嵌入Excel中

最後將DataFrame匯出,稍作美化即可完成需求。

# 匯出的時候一定要設定index=True不然只會保留一列Seriesdf。to_excel(“data3。xlsx”, index=True, merge_cells=True)

完整程式碼

# 首先要pip install python-docx# 如果原檔案是doc格式,那就先轉成docxfrom docx import Documentimport pandas as pdpath = “。/word表格轉excel。docx”docx = Document(path)table_s = docx。tables # 返回一個Table物件的列表list_ = [] # 初始化一個空列表,用來裝後面的dict_for table in table_s: # 迴圈所有的表格列表 dict_ = {} dict_[‘名稱’] = table。cell(0, 1)。text # 表格的索引是從(0行,0列)開始的 dict_[‘身份’] = table。cell(0, 3)。text dict_[‘簡介’] = table。cell(1, 1)。text for i in range(3, len(table。rows)): # 迴圈獲得後面的內容 dict_[table。cell(i, 0)。text] = table。cell(i, 1)。text list_。append(dict_)df = pd。DataFrame(list_)# 先將前三列作為索引,然後逆透視其他列,就是個一維錶轉二維表的過程df = df。set_index([‘名稱’, ‘身份’, ‘簡介’])。stack(level=0)。to_frame()# 重新設定一下行列索引的名字df。index。names = [‘名稱’, ‘身份’, ‘簡介’, ‘物質’]df。columns = [‘現狀’]# 匯出的時候一定要設定index=True不然只會保留一列Seriesdf。to_excel(“data3。xlsx”, index=True, merge_cells=True)