您的位置:首页 > 新闻 > 热点要闻 > OCR识别小模型:GOT-OCR2

OCR识别小模型:GOT-OCR2

2025/1/3 0:18:48 来源:https://blog.csdn.net/weixin_42357472/article/details/142256639  浏览:    关键词:OCR识别小模型:GOT-OCR2

参考:
https://huggingface.co/ucaslcl/GOT-OCR2_0

模型:

export HF_ENDPOINT=https://hf-mirror.comhuggingface-cli download --resume-download --local-dir-use-symlinks False ucaslcl/GOT-OCR2_0 --local-dir got_ocr

安装:

!pip install verovio megfile -i https://pypi.tuna.tsinghua.edu.cn/simple

使用:

from transformers import AutoModel, AutoTokenizertokenizer = AutoTokenizer.from_pretrained('/ai/got_ocr', trust_remote_code=True)
model = AutoModel.from_pretrained('/ai/got_ocr', trust_remote_code=True, low_cpu_mem_usage=True, device_map='cuda', use_safetensors=True, pad_token_id=tokenizer.eos_token_id)
model = model.eval().cuda()# input your test image
image_file = 'image1.jpg'# plain texts OCR
res = model.chat(tokenizer, image_file, ocr_type='ocr')res
# format texts OCR:
res = model.chat(tokenizer, image_file, ocr_type='format')
res

原图
在这里插入图片描述
结果:
在这里插入图片描述
在线latex查看:

https://arachnoid.com/latex/
在这里插入图片描述

公式render,打开html

# render the formatted OCR results:
image_file = 'image1.jpg'
res = model.chat(tokenizer, image_file, ocr_type='format', render=True, save_render_file = './demo.html')print(res)

在这里插入图片描述

image_file = 'road.png'# plain texts OCR
res = model.chat(tokenizer, image_file, ocr_type='ocr')res

原图
在这里插入图片描述

结果
在这里插入图片描述

image_file = 'simles1.jpg'
# format texts OCR:
res = model.chat(tokenizer, image_file, ocr_type='format')
res

在这里插入图片描述

在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com