[RISOLTO] Download ricorsivo di pagina HTML con contenuti

Discussioni relative a Debian e Linux

[RISOLTO] Download ricorsivo di pagina HTML con contenuti

Messaggioda zacky » 03/11/2018, 9:51

Buongiorno a tutti.
In rete ho trovato una pagina web aperta con dei file PDF da scaricare e Firefox mi fa vedere l'elenco di tutti i file.
Siccome sono un po tanti ho provato con il comando wget ma mi scarica solo un index.html che però nella directory non esiste neppure.
Ho dato un lettura alla pagina man di wget ma non ho trovato nessuna opzione specifica.
Come posso fare?
Grazie.
Ultima modifica di zacky il 03/11/2018, 14:30, modificato 1 volta in totale.
Avatar utente
zacky
Full Member
Full Member
 
Messaggi: 131
Iscritto il: 15/02/2010, 14:26

Re: Download HTML

Messaggioda Aki » 03/11/2018, 10:01

zacky ha scritto: ho trovato una pagina web aperta con dei file PDF da scaricare [..] ho provato con il comando wget ma mi scarica solo un index.html [..] Ho dato un lettura alla pagina man di wget ma non ho trovato nessuna opzione specifica.
Come posso fare?

wget ha alcune opzioni specifiche per questo; dalla pagina di manuale di wget:
Codice: Seleziona tutto
WGET(1)                            GNU Wget                            WGET(1)

NAME
       Wget - The non-interactive network downloader.

SYNOPSIS
       wget [option]... [URL]...
[..]
   Recursive Retrieval Options
       -r
       --recursive
           Turn on recursive retrieving.    The default maximum depth is 5.

       -l depth
       --level=depth
           Specify recursion maximum depth level depth.
Aki
Global Moderator
Global Moderator
 
Messaggi: 8097
Iscritto il: 27/12/2007, 16:59

Re: Download ricorsivo di pagina HTML con contenuti

Messaggioda zacky » 03/11/2018, 10:06

Ciao Aki
Grazie della risposta ma ho già provato queste due.
Mi conclude il comando scaricando un index.html che nella pagina web neanche esiste.
Avatar utente
zacky
Full Member
Full Member
 
Messaggi: 131
Iscritto il: 15/02/2010, 14:26

Re: Download ricorsivo di pagina HTML con contenuti

Messaggioda Aki » 03/11/2018, 10:19

zacky ha scritto:Grazie della risposta ma ho già provato queste due. Mi conclude il comando scaricando un index.html che nella pagina web neanche esiste.

Questo fa ipotizzare che la pagina html che stai cercando di scaricare non è una pagina html, ma altro. Puoi fornire il link a cui fai riferimento ?
Aki
Global Moderator
Global Moderator
 
Messaggi: 8097
Iscritto il: 27/12/2007, 16:59

Re: Download ricorsivo di pagina HTML con contenuti

Messaggioda zacky » 03/11/2018, 13:12

Avatar utente
zacky
Full Member
Full Member
 
Messaggi: 131
Iscritto il: 15/02/2010, 14:26

Re: Download ricorsivo di pagina HTML con contenuti

Messaggioda Aki » 03/11/2018, 14:11

Il link che hai indicato non è relativo ad una pagina html, ma ad una directory del server web ed al suo contenuto; per scaricarla, usa il comando:
Codice: Seleziona tutto
wget -r -l 1 --no-parent  https://www.raspberrypi.org/magpi-issues/
Aki
Global Moderator
Global Moderator
 
Messaggi: 8097
Iscritto il: 27/12/2007, 16:59

Re: Download ricorsivo di pagina HTML con contenuti

Messaggioda zacky » 03/11/2018, 14:29

Grazie Aki
non avevo capito il funzionamento del --no-parent.
Comunque se si aggiunge -c in caso di interruzione riprende da dove era rimasto.
Avatar utente
zacky
Full Member
Full Member
 
Messaggi: 131
Iscritto il: 15/02/2010, 14:26

Re: [RISOLTO] Download ricorsivo di pagina HTML con contenut

Messaggioda Aki » 03/11/2018, 14:32

Felice di esserti stato d’aiuto.
Aki
Global Moderator
Global Moderator
 
Messaggi: 8097
Iscritto il: 27/12/2007, 16:59


Torna a Generale

Chi c’è in linea

Visitano il forum: Nessuno e 3 ospiti