Pagina 6 di 6

Re: Consultazione offline

MessaggioInviato: 17/07/2013, 11:50
da Stemby
s3v ha scritto:Il problema più grosso è la codifica non UTF-8 . :(

Male...

Che cos'è che non supporta UTF-8?

Grazie!

Re: Consultazione offline

MessaggioInviato: 19/07/2013, 18:34
da s3v
Stemby ha scritto:Che cos'è che non supporta UTF-8?

Il programma htmldoc non supporta UTF-8.

Comunque il problema della mancata conversione per alcuni caratteri (es. lettere accentate) è dovuta alla codifica UTF-8 dei file.
Si risolve convertendo i file in iso-8859-1 con "iconv" e poi eseguendo:
Codice: Seleziona tutto
htmldoc --continuous --size a4 -t pdf14 -v --left 5mm --right 5mm --headfootsize 8 --footer ..1 --header . --fontsize 8 --charset iso8859-1 -f guide.pdf *.html

Leggermente cambiato per includere la codifica e il footer a destra.

L'output resta lungo, 2800 pagine per un file di quasi 15MB

Re: Consultazione offline

MessaggioInviato: 19/07/2013, 22:00
da Stemby
s3v ha scritto:
Stemby ha scritto:Che cos'è che non supporta UTF-8?

Il programma htmldoc non supporta UTF-8.

Vero :-\

In realtà un minimo supporto dovrebbe esserci dalla versione 1.9, leggendo qui, anche se sempre nella stessa pagina c'è scritto che lo sviluppo è fermo. Male...

Si risolve convertendo i file in iso-8859-1

Mmmm... che tristezza :(

Però meglio che niente.

Grazie!

Re: Consultazione offline

MessaggioInviato: 20/07/2013, 3:31
da s3v
In fondo caratteri visualizzati da UTF-8 ma non da iso8859-1 non dovrebbero esserci, vado a memoria.
E con la conversione si risolve il problema delle lettere accentate.
Resta l'impaginazione del TOC e dei template, abbastanza orribili. Oltre che i link del TOC che non vanno.

Con wkhtmltopdf si compie un notevole passo in avanti, tranne che, per un elevato numero di pagine,il programma si rifiuta di convertirle tutte. Inoltre l'impaginazione non è omogenea.
Stemby ha scritto:In realtà un minimo supporto dovrebbe esserci dalla versione 1.9, leggendo qui, anche se sempre nella stessa pagina c'è scritto che lo sviluppo è fermo. Male...

C'è una mailing list e una versione 1.9 beta.
Lo sviluppo sembra andare avanti. Piano, ma vanno.

Re: Consultazione offline

MessaggioInviato: 15/04/2019, 8:05
da Aki
Ci sono state evoluzioni dall'ultimo post della discussione in merito al download offline del contenuto di mediawiki anche in caso di eventuale futura migrazione o "fork" del mediawiki di debianizzati ?

Re: Consultazione offline

MessaggioInviato: 15/04/2019, 8:42
da s3v
Urca!
Come hai fatto a riesumare questo thread? :)
Me ne ero completamente dimenticato, e dire che all'epoca ci passai un sacco di tempo; appena posso rimetto in piedi la discussione con "nuove novità".

Re: Consultazione offline

MessaggioInviato: 12/05/2019, 9:59
da s3v
Con htmldoc si ottiene esattamente quello che si otteneva in precedenza.
Wkhtmltopdf ora permette di convertire solo un html alla volta però il risultato è bello:
Codice: Seleziona tutto
$ wkhtmltopdf percorso_file_html output.pdf

eseguito dalla directory "dump" del file di dump del nostro wiki (esempio).

Si dovrebbe capire come unire più pdf mantenendo i link all'interno del file e non farli puntare all'esterno.