์๋์ฐ ํ๊ฒฝ์์ DOC์ DOCX๋ก ๋ฐ๊พธ๋ ์ฝ๋
DOC๊ณผ DOCX์ ์ฐจ์ด์
์๋์์ ์ฌ์ฉํ๋ ๋ฌธ์ ํ์ผ์ .doc๊ณผ .docx์ ๋๊ฐ์ง ํ์์ด ์๋ค.
์ผ๋จ ๋์ ๊ฐ์ฅ ๋จ์ํ ์ฐจ์ด๋ ๊ตฌํ๊ณผ ์ ํ์ด๋ผ๋ ์ ์ด๋ค. .doc๋ 2003๋ ์ด์ ์ ์๋ ๋ฌธ์ ํ์์ด๊ณ , .docx๋ 2007๋ ์ดํ์ ์๋ ๋ฌธ์ ํ์์ด๋ค.
๊ตฌ์ฒด์ ์ธ ์ฐจ์ด์ ์ doc๋ ๋ฐ์ด๋๋ฆฌ ํ์ผ, docx๋ XML(์์ถ๋ ZIP ํ์ผ)์ด๋ผ๋ ์ ์ด๋ค. ๋ฐ์ด๋๋ฆฌ๋ ์ฌ๋์ด ์ฝ์ ์ ์๋ ํํ์ 0๊ณผ 1์ ์กฐํฉ์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ผ๋ฉฐ, ๋ด๋ถ ๊ตฌ์กฐ๊ฐ ๋ณต์กํด์ ํ์ผ์ด ์์๋๋ฉด ๋ณต๊ตฌ๊ฐ ์ด๋ ต๋ค๋ ๋จ์ ์ด ์๋ค. ๋ฐ๋ฉด XML์ eXtensible Markup Language์ ์ฝ์๋ก, ๋ฌธ์์ ํ ์คํธ ์์ ์ด๋ฏธ์ง๊ฐ XML ํ์ผ๋ก ๋๋์ด ์ ์ฅ๋๋ฉฐ ์ด๊ฒ์ ZIP์ผ๋ก ์์ถํ๋ ํํ์ด๋ค. ๋ฌธ์ ๋ด์ฉ์ด ๋ณ๋์ XML ํ์ผ๋ก ์ ์ฅ๋๊ธฐ ๋๋ฌธ์ ๊ตฌ์กฐ์ ์ผ๋ก ์ ๋ฆฌ๊ฐ ๋์ด์์ผ๋ฉฐ, ZIP์ผ๋ก ์์ถ์ ํ๊ธฐ ๋๋ฌธ์ ํ์ผ ํฌ๊ธฐ๊ฐ ์๊ณ ์ฒ๋ฆฌ ์๋๋ ๋น ๋ฅด๋ค. ์์๋ ๊ฒฝ์ฐ์๋ ๊ฐ๋ณ XML ํ์ผ์ ๋ณต๊ตฌ ๊ฐ๋ฅํด์ ๋ณต๊ตฌ ๊ฐ๋ฅ์ฑ์ด ๋์ ์ฅ์ ์ด ์๋ค.
DOC์ DOCX๋ก ๋ณ๊ฒฝํด์ผํ๋ ๊น๋ญ์ ์ต์ ๋ฒ์ ์๋์์ ํธํ์ฑ์ ํ๋ณดํ๊ธฐ ์ํด์, ํ์ผ ํฌ๊ธฐ๋ฅผ ๊ฐ์ํ๊ธฐ ์ํด์, ๋ค์ํ ์์๊ณผ ๊ธฐ๋ฅ์ ํ๋ณดํ๊ธฐ ์ํด์ ํ์ํ ์ ์๋ค. ๋๋ chatGPT์์ GPTs ๊ธฐ๋ฅ์ ํ์ฉํ๊ณ ์ถ์๋๋ฐ, doc ํ์ผ์ ์ธ์์ ๋ชปํด์ ๋ณํ์ ํ๊ฒ ๋์๋ค.
DOC์ DOCX๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ
๋ณํํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ค ์์ฃผ ๋จ์ํ๋ค. ํ์ผ์ ์๋๋ก ๋ค์ด๊ฐ์ ๋ค๋ฅธ์ด๋ฆ์ผ๋ก ์ ์ฅํ๊ธฐ๋ฅผ ๋๋ฅธ๋ค ํ์์ docx๋ก ๋ณ๊ฒฝํ๋ฉด ๋์ด๋ค.
๊ทธ๋ฌ๋, ๋์ฒ๋ผ 1000๊ฐ์ doc ํ์ผ์ docx๋ก ๋ณํํด์ผํ๋ ๊ฒฝ์ฐ ์ด๊ฒ์ด ์กฐ๊ธ ๊ณค๋ํ ์ ์๋ค. ๊ทธ๋ฐ ๊ฒฝ์ฐ python ์ฝ๋๋ก microsoft word๋ฅผ ์ง์ ์ ์ดํ๋ ๋ฐฉ์์ ํตํด์ ์๋์ผ๋ก ์๋๋ฅผ ์กฐ์ํ๋ฉด ๋๋ค.
์ด๋ ์ฌ์ฉํ๋ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ pywin32์ด๋ค!
pywin32๋ ์๋์ฐ์ Microsoft Office ํ๋ก๊ทธ๋จ์ ์๋์ผ๋ก ์กฐ์ํ ์ ์๊ฒ ํด์ฃผ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ด๋ค.
์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ์ฐ๋ฆฌ๊ฐ ์๋์์ ์ค์ ๋ก ๋ค๋ฅธ์ด๋ฆ์ผ๋ก ํ์ผ๋ช ์ ์ ์ฅํ๋ฏ ์ฝ๋๋ฅผ ๊ตฌํํ๋ฉด ๋๋ค.
๋๋ต์ ์ธ ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค. ์์ ์ฝ๋ ์ ๋ฌธ์ ๋ฐ์๋์ด ์์ผ๋ ๋ณต์ฌํด์ ์ฌ์ฉํ๋ฉด ๋ ๊ฒ ๊ฐ๋ค!
- win32com.client.Dispatch("Word.Application") → Word ํ๋ก๊ทธ๋จ์ ๋ฐฑ๊ทธ๋ผ์ด๋์์ ์คํ
- Documents.Open(ํ์ผ ๊ฒฝ๋ก) → .doc ํ์ผ ์ด๊ธฐ
- Documents.SaveAs(๋ณํ๋ ํ์ผ ๊ฒฝ๋ก, 16) → .docx๋ก ์ ์ฅ
- Documents.Close() → ํ์ผ ๋ซ๊ธฐ
- Word.Quit() → Word ํ๋ก๊ทธ๋จ ์ข ๋ฃ
์ด๋ณด์์ฉ ์ฝ๋ ์ค๋ช
ํ์ด์ฌ ์ฝ๋๋ฅผ ์ํํ๋ ๋ฐฉ๋ฒ๋ ๋ชฐ๋๋ ์์ ์ด ์ฌ์ค ์ผ๋ง ์ง๋์ง ์์๊ธฐ ๋๋ฌธ์, ๊ทธ๋ฐ ์ฌ๋๋ค์ ์ํ ์ด๋ณด ์ฝ๋ ์ค๋ช ๋ ๋ง๋ถ์ฌ๋ณด๊ฒ ๋ค.
1) ๊ฐ๋ฐํ๊ฒฝ์ ์ค๋นํด์ผํ๋ค.
A. Python ๋ค์ด๋ก๋: python.org ์์ ์ต์ ๋ฒ์ ์ Python์ ๋ค์ด๋ก๋ํ์ฌ ์ค์นํ๋ค.
โป ์ค์นํ ๋ "Add Python to PATH" ์ต์
์ ์ ํํ๋ฉด ๋ช
๋ น ํ๋กฌํํธ์์ Python์ ๋ฐ๋ก ์ฌ์ฉํ ์ ์๋ค.
B. ํ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์น: ํฐ๋ฏธ๋/๋ช ๋ น ํ๋กฌํํธ(cmd)๋ฅผ ์ด๊ณ ์๋ ์ฝ๋๋ฅผ ์ ๋ ฅํ๋ค.
pip install pywin32
pip install os
2) ์ฝ๋๋ฅผ ๋ถ์ฌ๋ฃ๊ณ ์คํํ๋ค.
A. ์ฝ๋๋ฅผ ์์ฑํ ๊ฒ์ ์ ํ์ผ๋ก ์ ์ฅ: ์๋ฅผ ๋ค์ด, ํ์ผ ์ด๋ฆ์ convert_doc_to_docx.py๋ผ๊ณ ํ๊ณ , ํ์ผ์ C:\myprojects ์ ์ ์ฅํ๋ค๊ณ ํ์.
B. ๋ช ๋ นํ๋กฌํํธ(cmd)๋ฅผ ์ด๊ณ ์ฝ๋๋ฅผ ์คํํ๋ค
- cmd ์ฐฝ์์ ๋ด ํ์ผ์ด ์๋ ํด๋๋ก ์ด๋ํ๋ค. cd C:\myprojects
- python convert_doc_to_docx.py
C. ๊ทธ๋ฌ๋ฉด ํ๋ก๊ทธ๋จ์ด ์คํ๋๋ฉด์ ํฐ๋ฏธ๋์ ๋ค์๊ณผ ๊ฐ์ ๋ฉ์์ง๊ฐ ์ถ๋ ฅ๋๋ค.
- ๐ ๋ณํํ ํด๋ ๊ฒฝ๋ก๋ฅผ ์ ๋ ฅํ์ธ์ :
- ์ฌ๊ธฐ์ .doc ํ์ผ๋ค์ด ๋ค์ด์๋ ํด๋์ ๊ฒฝ๋ก๋ฅผ ์ ๋ ฅํ๋ค.
D. ๋ค์์ผ๋ก๋ ์ ์ฅํ ํด๋์ ๊ฒฝ๋ก๋ฅผ ์ ๋ ฅํ๋ฉด ๋๋ค.
- ๐ ๋ณํ๋ ํ์ผ ์ ์ฅํ ํด๋ ๊ฒฝ๋ก ์ ๋ ฅํ์ธ์:
- ๊ฐ ํ์ผ์ด ์ฑ๊ณต์ ์ผ๋ก ๋ณํ๋๋ฉด ๋ฉ์์ง๊ฐ ์ถ๋ ฅ๋๋ค!

์ด๋ ๊ฒ DOC ํ์ผ์ ํ๋ฒ์ DOCX๋ก ๋น ๋ฅด๊ฒ ๋ณํํ๋ ๋ฐฉ๋ฒ์ ๋ํด์ ์์๋ณด์๋ค!