作者:不正經(jīng)的kimol君
https://blog.csdn.net/kimol_justdo/article/details/109267805
前言
想必小伙伴都經(jīng)歷過,當(dāng)你想要把PDF轉(zhuǎn)為WORD時(shí),自己打字赫赫甩在你眼前:
不充錢就想白嫖??想得美~
然而,博主是不會退縮的,畢竟迎難而上是傳統(tǒng)美德。于是,今天的主題出來了:用python寫一個PDF轉(zhuǎn)WORD的小工具(基于某網(wǎng)站接口)。
一、思路分析
網(wǎng)上一搜,你可以發(fā)現(xiàn)很多PDF轉(zhuǎn)換的工具,其中不乏在線轉(zhuǎn)換的網(wǎng)站,比如這樣的:
那么,通過網(wǎng)站提供的測試接口,我們便可以通過爬蟲模擬的方式實(shí)現(xiàn)轉(zhuǎn)換。
沒有錯了~思路就是如此的簡單明了,今天的主角便是:
通過抓包分析,知道這是一個POST請求,接下來用requests庫模擬即可。
二、我的代碼
正所謂一萬個coders,就有一萬種codes,以下為我的代碼,僅供參考。
導(dǎo)入相關(guān)庫:
定義PDF2Word類:
執(zhí)行主函數(shù):
注意:convertPDF函數(shù)有兩個參數(shù),第一個為需要轉(zhuǎn)換的PDF,第二個參數(shù)為轉(zhuǎn)換后的目錄。
run一下,一鍵入魂,".docx"文件已經(jīng)躺在了我的目錄中,舒服了~
分享或在看是對我最大的支持
聯(lián)系客服