hirthwork
22.01.2012 11:50 mcabber
решил сконвертить одну pdf'ку в текст, дабы можно было без иксов ей пользоваться. самое логичное — pdf2html, и что вы думаете он сделал? отрендерил, блядь, каждую страницу в png и вставил в hmtl'ки. я хуею с простоты решения
Просто из любопытства: а текст из этой pdf копировался?
разумеется. я эту pdf'ку из tex'а сгенерил
Это совсем прекрасное.
Есть такие pdf, для которых запрещены копирование и редактирование текста; для них конвертирование в png логично. Но для тех, которым копирование не запрещено...
да, я знаю что есть такие, только я не знаю где их взять
для тех для которых копирование текста запрещено логично положить болт на такие ограничения ;)
Возможно. Но вдруг и той программе это недоступно?
Всякие документы с сайта федеральной службы бла-бла-бла, например.
насколько я понимаю, эти ограничения чисто искуственные, так что их должно быть проще НЕ реализовывать чем реализовывать
Возможно, я с пдф практически не работала, только изредка читала.