Header banner
Revain logoHome Page
John Pound photo
1 Уровень
1311 Отзывов
42 Карма

Отзыв о PyNLPl от John Pound

Revainrating 5 out of 5

Простой процесс извлечения и преобразования PDF-файлов

Мне больше всего понравилось, как легко это было, просто используя код Python, мы смогли извлечь текст из файлов PDF с высокой точностью (даже когда на некоторых страницах есть ошибки).

картинка 1 прикреплена к отзыву PyNLPl от John Pound

Это также позволило нам упростить добавление метаданных о каждом извлеченном файле. Пока нет ничего плохого, что мне не понравилось, но, возможно, больше функциональности было бы лучше, чем то, что они предоставляют на данный момент. Мы решили, какие документы должны или не должны быть отсканированы, потому что наше программное обеспечение может проверять их автоматически без вмешательства человека, если это необходимо.

Плюсы
  • Python SDK имеет встроенную интеграцию, отлично подходит для отладки
  • Исключительно точное извлечение результатов, несмотря на небольшие неточности, такие как обрезка и т. д.
  • Простое внедрение в существующие проекты/решения, требующие обработки изображений
Минусы
  • Незначительные проблемы