У меня есть несколько тысяч архивов с информацией по клиентам.В каждом архиве находится по 12 pdf файлов.Необходимо, чтобы все эти файлы объединялись в единый файл ексель. Такое можно реализовать?
У меня есть несколько тысяч архивов с информацией по клиентам.В каждом архиве находится по 12 pdf файлов.Необходимо, чтобы все эти файлы объединялись в единый файл ексель. Такое можно реализовать?hatter
Я бы поискал что-то из программ "pdf2txt", которыми можно конвертнуть в текст или сразу всю кучу, или которые можно "напрячь" в макросе. Конкретную не знаю, небыло такой задачи пока. Ну а далее макросом эти тексты парсим в Эксель - если конечно там будет приемлимый систематизированный текст. Или подожите - может кто-то работает с ридеровским API и сможет тянуть данные прямо из pdf.
Я бы поискал что-то из программ "pdf2txt", которыми можно конвертнуть в текст или сразу всю кучу, или которые можно "напрячь" в макросе. Конкретную не знаю, небыло такой задачи пока. Ну а далее макросом эти тексты парсим в Эксель - если конечно там будет приемлимый систематизированный текст. Или подожите - может кто-то работает с ридеровским API и сможет тянуть данные прямо из pdf.Hugo
С неделю назад столкнулся с этой проблемой При Copy текста из ридера текст получается в юникоде, и конвертируется в ascii онлайн переводчиком. При попытке считать файл целиком кодировка не определяется и на выходе кроказябры. Пришлось сочинить декодер (ну и макросик к нему)
[vba]
Код
Function codeUniToAscii(ByVal ss As String) As String Dim simv As Long, i As Long On Error Resume Next For i = 1 To Len(ss) simv = AscW(Mid(ss, i, 1)) Select Case simv Case 192 To 255 simv = simv + 848 Case 185 simv = 8470 Case 168 simv = 1025 Case 184 simv = 1105 Case Else simv = simv End Select codeUniToAscii = codeUniToAscii & ChrW(simv) Next End Function
[/vba]
Но если есть варианты прочитать сразу PDF, с удовольствием посмотрю
PS поскольку мой pdf - банковская выписка ....
С неделю назад столкнулся с этой проблемой При Copy текста из ридера текст получается в юникоде, и конвертируется в ascii онлайн переводчиком. При попытке считать файл целиком кодировка не определяется и на выходе кроказябры. Пришлось сочинить декодер (ну и макросик к нему)
[vba]
Код
Function codeUniToAscii(ByVal ss As String) As String Dim simv As Long, i As Long On Error Resume Next For i = 1 To Len(ss) simv = AscW(Mid(ss, i, 1)) Select Case simv Case 192 To 255 simv = simv + 848 Case 185 simv = 8470 Case 168 simv = 1025 Case 184 simv = 1105 Case Else simv = simv End Select codeUniToAscii = codeUniToAscii & ChrW(simv) Next End Function
[/vba]
Но если есть варианты прочитать сразу PDF, с удовольствием посмотрю
Они глубоко ошибаются. У каждого объекта файла ПДФ много свойств. На примере символа текста. Координаты Левый нижний X,Y Левый верхний X,Y Аналогично правые углы,параметры щрифта. Таблицу можно создать,но обратно получить невозможно.
Они глубоко ошибаются. У каждого объекта файла ПДФ много свойств. На примере символа текста. Координаты Левый нижний X,Y Левый верхний X,Y Аналогично правые углы,параметры щрифта. Таблицу можно создать,но обратно получить невозможно.doober
Онлайн-сервисом нельзя. Макрос должен автоматически обрабатывать Outlook, скачивать PDF файлы, конвертировать их в тхт, потом в xls, и после дальнейшая автоматическая обработка. Если это делать вручную (через онлайн-сервис), то смысл всей автоматизации теряется. P.S. решение данной проблемы уже нашел, и вся система уже работает.
Онлайн-сервисом нельзя. Макрос должен автоматически обрабатывать Outlook, скачивать PDF файлы, конвертировать их в тхт, потом в xls, и после дальнейшая автоматическая обработка. Если это делать вручную (через онлайн-сервис), то смысл всей автоматизации теряется. P.S. решение данной проблемы уже нашел, и вся система уже работает.XMbIPb