PaddleOCR става най-популярният OCR проект в GitHub, надминавайки Tesseract на Google

PaddlePaddle OCR инструментариумът на Baidu PaddleOCR се превърна в най-звездния OCR проект в GitHub, достигайки 73 300 звезди, надминавайки Tesseract OCR на Google.

С отворен код през 2020 г., PaddleOCR вече поддържа повече от 110 езика и се използва в 160 държави и региони.

Последните актуализации включват PP-OCRv5, олекотен модел само с 5 милиона параметъра, който постига точност, сравнима с моделите на визуален език с милиард параметри при стандартни бенчмаркове. Най-новият модел за парсиране на документи, PaddleOCR-VL-1.5, постигна 94,5% точност на бенчмарка OmniDocBench V1.5.

PaddleOCR е проектиран да работи заедно с големите модели ERNIE на Baidu, комбинирайки високо прецизно извличане на текст с разширено разбиране на документи.

Baidu също обяви, че безплатната му дневна квота за обработка на документи е увеличена от 10 000 на 20 000 страници.

Източник: QbitAI

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin