Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет» » Новости мира Интернет
Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет»
Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет»
Google научила Gemini 3.5 Flash управлять компьютером и мобильными приложениями - «Новости мира Интернет»
Google научила Gemini 3.5 Flash управлять компьютером и мобильными приложениями - «Новости мира Интернет»
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями - «Новости сети»
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями - «Новости сети»
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр - «Новости сети»
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр - «Новости сети»
Microsoft внезапно продлила поддержку Windows 10 ещё на год - «Новости сети»
Microsoft внезапно продлила поддержку Windows 10 ещё на год - «Новости сети»
ФАС рекомендовала российским операторам не рекламировать 5G, которого нет - «Новости сети»
ФАС рекомендовала российским операторам не рекламировать 5G, которого нет - «Новости сети»
Учёные создали пиксель, который научит дисплеи видеть - «Новости сети»
Учёные создали пиксель, который научит дисплеи видеть - «Новости сети»
Данные по часам в Мониторинге запросов — «Блог для вебмастеров»
Данные по часам в Мониторинге запросов — «Блог для вебмастеров»
Apple готовит крупное обновление: в линейке могут появиться складной iPhone, робот для дома и наушники с камерой - «Новости мира Интернет»
Apple готовит крупное обновление: в линейке могут появиться складной iPhone, робот для дома и наушники с камерой - «Новости мира Интернет»
Valve открыла предзаказы на Steam Machine и готовит SteamOS для обычных ПК - «Новости мира Интернет»
Valve открыла предзаказы на Steam Machine и готовит SteamOS для обычных ПК - «Новости мира Интернет»
Новости мира Интернет » Новости интернета » Mistral представила OCR 4 – ИИ для распознавания документов на 170 языках - «Новости мира Интернет»

Французская компания Mistral AI анонсировала новую систему распознавания документов OCR 4. Разработчики позиционируют ее как платформу для полноценного анализа структуры документов.



Модель поддерживает 170 языков и способна работать с PDF-файлами, презентациями, сканами, текстовыми документами. Помимо текста OCR 4 распознает заголовки, таблицы, формулы, подписи и сохраняет их расположение на странице. Все данные система структурирует: далее их можно использовать для наполнения корпоративных баз знаний, поисковых систем и ИИ-сервисов.



Модель реализуется на собственной инфраструктуре компании. По словам разработчиков, она достаточно компактна для запуска в одном контейнере, так что передача данных во внешнее облако не требуется.



В Mistral заявляют, что OCR 4 показывает лучшие результаты среди протестированных решений. В бенчмарке OlmOCRBench модель набрала 85,2%, а во внутреннем многоязычном тестировании достигла показателя 98%. Компания также сообщает, что в слепых сравнениях независимые оценщики чаще отдавали предпочтение результатам OCR 4, чем решениям конкурентов – GPT-5.5 Pro, Gemini 3.1 Pro, Azure Document Intelligence и AWS Textract. 



Новая система будет полезна для задач корпоративного поиска, RAG-платформ, автоматизации документооборота и агентных ИИ-сценариев. Стоимость обработки составляет 4 доллара за 1000 страниц через API, а при пакетной обработке цена снижается до 2 долларов.


Французская компания Mistral AI анонсировала новую систему распознавания документов OCR 4. Разработчики позиционируют ее как платформу для полноценного анализа структуры документов. Модель поддерживает 170 языков и способна работать с PDF-файлами, презентациями, сканами, текстовыми документами. Помимо текста OCR 4 распознает заголовки, таблицы, формулы, подписи и сохраняет их расположение на странице. Все данные система структурирует: далее их можно использовать для наполнения корпоративных баз знаний, поисковых систем и ИИ-сервисов. Модель реализуется на собственной инфраструктуре компании. По словам разработчиков, она достаточно компактна для запуска в одном контейнере, так что передача данных во внешнее облако не требуется. В Mistral заявляют, что OCR 4 показывает лучшие результаты среди протестированных решений. В бенчмарке OlmOCRBench модель набрала 85,2%, а во внутреннем многоязычном тестировании достигла показателя 98%. Компания также сообщает, что в слепых сравнениях независимые оценщики чаще отдавали предпочтение результатам OCR 4, чем решениям конкурентов – GPT-5.5 Pro, Gemini 3.1 Pro, Azure Document Intelligence и AWS Textract. Новая система будет полезна для задач корпоративного поиска, RAG-платформ, автоматизации документооборота и агентных ИИ-сценариев. Стоимость обработки составляет 4 доллара за 1000 страниц через API, а при пакетной обработке цена снижается до 2 долларов.

Цитирование статьи, картинки - фото скриншот - Rambler News Service.
Иллюстрация к статье - Яндекс. Картинки.
Есть вопросы. Напишите нам.
Общие правила  поведения на сайте.

Смотрите также

А что там на главной? )))



Комментарии )))