![]() |
#1 |
Участник
|
Считать инфо из пдф файла . Ax 2009
Здраствуйте,
Менеджеры просять сделать перевод из пдф файлов . Обычно они в таком формате получает заказы. Возможно такое ? Пока такой инфо ненашел и решил спросить здесь .. Заранее спасибо ! |
|
![]() |
#2 |
Moderator
|
Цитата:
![]() Дело в том, что строго говоря, PDF-формат является скорее графическим чем текстовым. Если я правильно понимаю - там внутри нечто вроде программы для абстрактного устройства вывода, с системой комманд, похожей на Forth-машину. Для удобства поиска, там внутри может содержаться и текст (который можно искать). А может и не содержаться, или быть уж слишком непривычно закодирован. Поэтому, для преобразования PDF в текстовый формат, нужна система распознования текста (например - Abbyy Transformer, но есть и другие). Часть из этих систем может иметь API для вызова извне. В теории, возможно вызывать эти программы, заставлять их преобразовать PDF в Word, потом попробовать почитать содержимое Word через Automation-интерфейс и тп, однако: 1. Заведомо будут ошибки распознования. При этом если язык документа не очень популярный - ошибок будет больше. 2. Лицензия на enterprise-версию распознавалки явно будет не очень дешевой. |
|
|
За это сообщение автора поблагодарили: Rimantas (1). |
![]() |
#3 |
Участник
|
Цитата:
Сообщение от fed
![]() Короткий ответ - возможно, но вряд ли это себя окупит
![]() Дело в том, что строго говоря, PDF-формат является скорее графическим чем текстовым. Если я правильно понимаю - там внутри нечто вроде программы для абстрактного устройства вывода, с системой комманд, похожей на Forth-машину. Для удобства поиска, там внутри может содержаться и текст (который можно искать). А может и не содержаться, или быть уж слишком непривычно закодирован. Поэтому, для преобразования PDF в текстовый формат, нужна система распознования текста (например - Abbyy Transformer, но есть и другие). Часть из этих систем может иметь API для вызова извне. В теории, возможно вызывать эти программы, заставлять их преобразовать PDF в Word, потом попробовать почитать содержимое Word через Automation-интерфейс и тп, однако: 1. Заведомо будут ошибки распознования. При этом если язык документа не очень популярный - ошибок будет больше. 2. Лицензия на enterprise-версию распознавалки явно будет не очень дешевой. ![]() |
|
![]() |
#4 |
Участник
|
У нас закупщики по одному серьезному поставщику тоже всегда сканы использовали и уверяли, что поставщик только так шлет.
Пока кто-то рангом повыше не запросил, а можно ли в формате Excel или xml - ответ пришел сразу - можно! ![]() Потом спросили, а можно нам получить ваши коды товаров и тогда мы вам будем свои заявки в ваших кодах слать, а вы нам счета с ними же присылать. Ответ - "а так можно? Конечно согласны!" И скорость работы возросла в десятки раз. |
|
|
За это сообщение автора поблагодарили: belugin (2). |
Теги |
pdf, импорт, формат файла |
|
Опции темы | Поиск в этой теме |
Опции просмотра | |
|