
近日,百度考究对外发布新一代文档识别模子PaddleOCR-VL-1.6。据官方公布的评测数据,该模子在多项巨擘基准测试中刷新业界最优(SOTA)纪录,空洞性能置身众人第一,激励业内庸俗眷注。

1、评测收货亮眼,多项观点相当海外主流模子
在现时OCR规模公认的巨擘评测集OmniDocBench v1.6上,PaddleOCR-VL-1.6赢得96.33%的总分,高出谷歌Gemini-3-Pro、OpenAI GPT-5.2、MinerU-2.5-Pro及国内的GLM-OCR等主流大模子与专用OCR决议,空洞排行众人第一。
在面向真正复杂场景贪图的Real5-OmniDocBench评测中,该模子一样发达杰出,总道路达到93.19%,尊龙凯时中国官网入口较Gemini-3-Pro擢升约4个百分点,在扫描件、弯折文档、屏幕拍照、光照变化及歪斜文档五类真正场景下均保抓发轫。
赛马投注中国app官方版下载据了解,PaddleOCR系列在文本、公式、表格等中枢识别能力上终了全面升级,表格结构收复、古籍笔墨辨别与荒野字识别等复杂任务的准确率较上一代模子均有权贵擢升;钤记识别、图表分解及笔墨定位(Spotting)等多项能力亦同步强化。

2、轻量架构不变,建立者可无缝迁徙
值得眷注的是,亚博·体育世界杯(中国)官方网站PaddleOCR-VL-1.6在保留上一代0.9B轻量化参数范围的前提下终显着性能跃升,通过模子入手的数据构建机制与渐进式查验优化完成能力迭代。由于新旧两代模子结构保抓一致,已在分娩环境中部署PaddleOCR-VL-1.5的建立者和企业用户,无需额外适配即可平滑迁徙至新版块,镌汰了升级老本。
PaddleOCR系列模子基于百度文心大模子查验而来,是文心多模态能力的迫切构成部分,现在复古高出100种道话识别,用户群体褪色众人170余个国度和地区。自技俩开源以来,PaddleOCR在GitHub上的Star数已冲破79,200,相当谷歌旗下老牌开源技俩Tesseract OCR,成为众人最受建立者眷注的开源OCR技俩之一。
3、即刻可用,代码与权重全面怒放
PaddleOCR-VL-1.6现在已考究上线PaddleOCR官方网站(paddleocr.com),复古网页端在线体验及API调用;模子代码与权重文献已同步开源至GitHub(github.com/PaddlePaddle/PaddleOCR)及Hugging Face(huggingface.co/PaddlePaddle/PaddleOCR-VL-1.6),面向众人建立者免费怒放。
跟着文档数字化需求的抓续增长,高精度、强鲁棒性的OCR能力正成为企业智能化转型的关节底座。这次PaddleOCR-VL-1.6的发布亚博体育世界杯中国官网首页,或将进一步股东国产开源OCR工夫在众人范围内的秉承与落地。