stmtkブログ

Python中心の技術ブログです。

【Python】Wordから全テキストを取得する

機能

Wordから全テキストを取得するPythonプログラムです。

Word内のテキストを読み取って、クリップボードにコピーします。

実行前

実行後

サンプル動画

youtu.be

プログラム

#! python3
# 機能
#  Wordから全テキストを取得する
# 使い方
#  1.Pythonを実行する
# 実行コマンド
#  python doc_reader.py ファイル名
#  python doc_reader.py input.docx

import sys
import docx
import pyperclip

# Wordからテキストを取得する関数
def get_text(file_name):
    doc = docx.Document(file_name)
    text = []
    for para in doc.paragraphs:
        text.append(para.text)
    return "\n".join(text)


if len(sys.argv) != 2:
    sys.exit("使い方:python doc_reader.py ファイル名")

# Wordからテキスト取得、クリップボードにコピー
output = get_text(sys.argv[1])
pyperclip.copy(output)
print("クリップボードにコピーしました。")

使い方

  1. Pythonを実行する

実行コマンド

python doc_reader.py ファイル名
python doc_reader.py input.docx

docxとpyperclipをインストールしていない場合は以下のコマンドでインストールして下さい。

pip install python-docx
pip install pyperclip

参考文献

www.oreilly.co.jp