2019年5月24日金曜日

Dockerでpython3.7とpython-docxをインストールしたコンテナ(Alpine3.9ベース)を作成する

python-docxを使用して、ワードファイルの読み取りや生成・編集などを行うことができます。

以下のコマンドとDockerfileを使用してpython3.7とpython-docxがインストールされたイメージを作成する事ができます。
docker build -t pythondocx:1.0 .
Dockerfile
FROM python:3.7-alpine3.9
FROM python:3.7-alpine3.9
RUN apk --no-cache add libstdc++ \
    libxml2 \
    libxslt \
  && apk --no-cache --virtual pydeps add gcc \
    g++ \
    python3-dev \
    musl-dev \
    cython \
    libxml2-dev \
    libxslt-dev \
  && pip install python-docx \
  && apk del --purge pydeps
CMD ["/bin/sh"]

適当なエクセルファイルtest1.docxを準備して、以下のコマンドでサンプルコードを実行してワードファイルの内容にアクセスできます。
docker run -v `pwd`:/tmp --rm -it pythondocx:1.0 /usr/local/bin/python3 /tmp/test.py

test.py
import docx

doc = docx.Document("/tmp/test1.docx")
text = []
for para in doc.paragraphs:
  text.append(para.text)
print('\n'.join(text))

0 件のコメント:

コメントを投稿