Pagina 1 di 1

[RISOLTO] Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 9:51
da zacky
Buongiorno a tutti.
In rete ho trovato una pagina web aperta con dei file PDF da scaricare e Firefox mi fa vedere l'elenco di tutti i file.
Siccome sono un po tanti ho provato con il comando wget ma mi scarica solo un index.html che però nella directory non esiste neppure.
Ho dato un lettura alla pagina man di wget ma non ho trovato nessuna opzione specifica.
Come posso fare?
Grazie.

Re: Download HTML

MessaggioInviato: 03/11/2018, 10:01
da Aki
zacky ha scritto: ho trovato una pagina web aperta con dei file PDF da scaricare [..] ho provato con il comando wget ma mi scarica solo un index.html [..] Ho dato un lettura alla pagina man di wget ma non ho trovato nessuna opzione specifica.
Come posso fare?

wget ha alcune opzioni specifiche per questo; dalla pagina di manuale di wget:
Codice: Seleziona tutto
WGET(1)                            GNU Wget                            WGET(1)

NAME
       Wget - The non-interactive network downloader.

SYNOPSIS
       wget [option]... [URL]...
[..]
   Recursive Retrieval Options
       -r
       --recursive
           Turn on recursive retrieving.    The default maximum depth is 5.

       -l depth
       --level=depth
           Specify recursion maximum depth level depth.

Re: Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 10:06
da zacky
Ciao Aki
Grazie della risposta ma ho già provato queste due.
Mi conclude il comando scaricando un index.html che nella pagina web neanche esiste.

Re: Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 10:19
da Aki
zacky ha scritto:Grazie della risposta ma ho già provato queste due. Mi conclude il comando scaricando un index.html che nella pagina web neanche esiste.

Questo fa ipotizzare che la pagina html che stai cercando di scaricare non è una pagina html, ma altro. Puoi fornire il link a cui fai riferimento ?

Re: Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 13:12
da zacky

Re: Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 14:11
da Aki
Il link che hai indicato non è relativo ad una pagina html, ma ad una directory del server web ed al suo contenuto; per scaricarla, usa il comando:
Codice: Seleziona tutto
wget -r -l 1 --no-parent  https://www.raspberrypi.org/magpi-issues/

Re: Download ricorsivo di pagina HTML con contenuti

MessaggioInviato: 03/11/2018, 14:29
da zacky
Grazie Aki
non avevo capito il funzionamento del --no-parent.
Comunque se si aggiunge -c in caso di interruzione riprende da dove era rimasto.

Re: [RISOLTO] Download ricorsivo di pagina HTML con contenut

MessaggioInviato: 03/11/2018, 14:32
da Aki
Felice di esserti stato d’aiuto.