网站地址:https://www.douyacun.com/image/ocr-to-docx
功能特点:
- 识别图片上的文字
- 按照图片文字样式进行格式化
- 导出为word文档
- 2算法实现:googel-tesseract-ocr / easyocr
- 借助开源库实现,功能免费
使用:
tesseract 导出为word
python tesseract.py hocr_to_docx a.png a.docx
easyocr 导出为word
python easy.py ocr_to_docx a.png a.docx