Skip to content

gumblex/wqxt_pdf

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

“文泉学堂”PDF下载

文泉学堂

  1. 安装 requirements.txt 里的依赖
  2. 找到你要的书,看地址栏的数字为 id
  3. 运行 python3 crawl_wqxt.py <id>

服务器生成图片需要时间,可能出现 not loaded,会稍候重试。若一直出现 not loaded(第二遍还是),请尝试重新运行,已下载的图片不会重新下载。

若需要清理缓存,请删除 wqxt.db 或自行更改其内容(SQLite 数据库)。

若需要登录,请自行在 crawl_wqxt.py 的 HEADERS(36行)里加 Cookie 等内容。

请合理使用服务器资源。版权问题概不负责。

imgautocompress.py 会对下载的图片判断是否为灰度、是否为黑白,并转成相应格式,减少图片大小。

要类似地减少其他扫描版 PDF 文件大小,可以使用 pdfreduce。要添加 OCR 层,可使用 ocrmypdf

About

WQXT PDF Downloader

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages