Wordに貼り込まれた画像のコンタクトシートを作成するなどの目的で,画像を抽出したい場合があります.
このページでは,画像抽出方法を記しています.

目次

  1. Wordから画像抽出する方法
  2. PowerPointについてシェルスクリプトで同じことを試みるサンプル

Wordから画像抽出する方法

ファイルの名前を変えることにより,ファイルの拡張子をdocxからzipに変えます.
そのファイルをzipファイルとみなして展開を試みます.
元のWordのファイルの要素が分解され,その中に画像をまとめたフォルダがあります.

PowerPointについてシェルスクリプトで同じことを試みるサンプル

ファイル数が多いときのため,シェルスクリプトを書いています.
PowerPointの例です.
Wordと同様にzipを展開する方針をとっています.

カレントディレクトリにある「パワポ集」ディレクトリ内のプレゼンテーションを処理します.

input_dir="./pptx_box"
output_dir="./ph_from_pptx_box"

cd $input_dir; find . -name "* *" | rename 's/ /_/g'; cd ../
mkdir $output_dir

for f in `find $input_dir -name '*.pptx'`
do
mybn=`basename "$f"`
myfn=${mybn%.*}
ifn="$input_dir"/"$myfn"
ofn="$output_dir"/"$myfn"

cp "$f" "$ifn".zip
unzip "$ifn".zip -d "$ifn"
mkdir "$ofn"
cp -R "$ifn"/ppt/media/* "$ofn"
rm -rf "$ifn" "$ifn".zip
done