前言trt简介摘自Ultralytics。总而言之就是能极大程度的提高模型速度,正文部分主要记录部署流程和排坑日志。 TensorRT是由NVIDIA 开发,专为高速深度学习推理而设计的SDK,该SDK可针对NVIDIA GPU优化深度学习模型,从而实现更快、更高效的操作。将深度学习模型转换为Ten
前文简单介绍过间隙·树·排序算法以及其更改过的可视化过程。但是由于算法本身是对纯文本块进行排序,当遇到较为复杂的图像结构时,由于缺少原始图像信息,存在丢失图片类型数据、无法理解表格等问题。 此算法的跟进版目标在于对排序算法的后续操作提供更为精确的版面恢复,故名称沿用自间隙·树·排序算法(项目地址:h
环境准备服务器· OS: CentOS7.9· GPU: RTX3090 24G*2· CUDA: 11.7· CUDNN: 8.9.2 飞桨· paddlepaddle: paddlepaddle-gpu==2.4.2(cudatoolkit=11.7,建议conda安装)1conda insta
做文档翻译的OCR程序时,会遇到这样一个场景,因为通常OCR模型的输出都是按文本块逐行返回,当结果进入翻译模型时会丢失行与行之间的信息。为了解决这个问题,需要对OCR结果进行进一步的版面分析,将文本块合并成段落,再输入到翻译模型中去。 算法间隙·树·排序算法 参考链接:https://github.
环境准备版本:python3.9 + surya-ocr 0.4.15 模型准备:检测模型:surya_det3 识别模型:surya_rec 版面模型:surya_layout3 源码修改因首次使用下载模型被墙,提前将模型收录至模型文件夹并修改源码导入部分: (源码位置:...Python39/L
Thanks For Visit! (阿汤宝~汤阿宝~ ^^)