今更ながらphpでword(docx)を読み込んでplain textを得る

word(docx)ファイルを出力する、とかのサンプルやライブラリは結構あるんですが、 今回はそもそもただ単に中身のプレーンテキストが欲しいという場合の話。docx(確かword2007以降)は実はzipアーカイブなので、unzipとかで解凍できる。 その中にword/document.xmlというのがあって、それにテキストの情報が入っている。 …