Wget este un program de descărcare de rețea non-interactiv care este folosit pentru a descărca fișiere de pe server chiar și atunci când utilizatorul nu s-a conectat la sistem și poate funcționa în fundal fără a împiedica procesul curent.
- GNU wget este un utilitar gratuit pentru descărcarea non-interactivă a fișierelor de pe Web. Acceptă protocoalele HTTP, HTTPS și FTP, precum și preluarea prin proxy HTTP.
- wget este non-interactiv, ceea ce înseamnă că poate funcționa în fundal, în timp ce utilizatorul nu este conectat. Acest lucru vă permite să începeți o recuperare și să vă deconectați de la sistem, permițându-ne să termine lucrarea. În schimb, majoritatea browserelor web necesită prezența constantă a utilizatorului, ceea ce poate fi o piedică grozavă atunci când transferați o mulțime de date.
- wget poate urmări link-uri în pagini HTML și XHTML și poate crea versiuni locale ale site-urilor web la distanță, recreând complet structura de directoare a site-ului original. Aceasta este uneori denumită descărcare recursivă. În timp ce face asta, wget respectă Standardul de excludere a roboților (/robots.txt). wget poate fi instruit să convertească legăturile din fișierele HTML descărcate în fișierele locale pentru vizualizare offline.
- wget a fost proiectat pentru robustețe pe conexiuni de rețea lente sau instabile; dacă o descărcare eșuează din cauza unei probleme de rețea, va continua să reîncerce până când întregul fișier va fi preluat. Dacă serverul acceptă reluarea, acesta va instrui serverul să continue descărcarea de unde a rămas.
Sintaxa de baza:
Sintaxa de bază a comenzii Wget este următoarea:
cum se sortează o listă de matrice în java
wget [option] [URL]>
Aici
[options]> reprezintă diferite opțiuni de linie de comandă care modifică comportamentul Wget
[URL]> este adresa fișierului sau a site-ului web care urmează să fie descărcat.
Opțiuni:
Iată opțiunile disponibile în comanda wget în linux.
| Opțiune | Descriere | Sintaxă |
|---|---|---|
| -v / –versiune | Afișați versiunea de Wget instalată pe sistemul dvs. | $ wget -v |
| -h / –ajutor | Imprimați un mesaj de ajutor care afișează toate opțiunile disponibile din linia de comandă pentru Wget. | $ wget -h [URL] |
| -o fișier jurnal | Direcționați toate mesajele generate de sistem către fișierul jurnal specificat. Dacă nu este specificat niciun fișier jurnal, mesajele sunt redirecționate către fișierul jurnal implicit (‘wget-log’). | $ wget -o fișier jurnal [URL] |
| -b / –fond | Trimiteți procesul în fundal imediat ce începe, permițând altor procese să continue. Dacă nu este specificat niciun fișier de ieșire, ieșirea este redirecționată în mod implicit către „wget-log”. | $ wget -b [URL] |
| -A | Adăugați mesaje de ieșire la fișierul jurnal de ieșire curent fără a-l suprascrie. Aceasta păstrează jurnalul comenzilor anterioare, cu jurnalul curent atașat după ele. | $ wget -a fișier jurnal [URL] |
| -i | Citiți URL-uri dintr-un fișier. Dacă este specificat ca fișier, adresele URL sunt citite din intrarea standard. Dacă adresele URL sunt prezente atât în linia de comandă, cât și în fișierul de intrare, cele de pe linia de comandă au prioritate. Fișierul nu trebuie să fie un document HTML. | $ wget -i fișier de intrare $ wget -i fișier de intrare [URL] |
| -t număr / –încearcă=număr | Setați numărul de încercări de reîncercare. Specificați „0” sau „inf” pentru reîncercare infinită. Valoarea implicită este 20 de reîncercări, cu excepții pentru erori fatale, cum ar fi refuzul conexiunii sau linkul negăsit. | $ wget -t număr [URL] |
| -c | Reluați un fișier descărcat parțial dacă fișierul acceptă reluarea. Dacă reluarea nu este acceptată, descărcarea nu poate fi reluată. | $ wget -c [URL] |
| -În | Setați sistemul să aștepte numărul specificat de secunde între recuperări. Această opțiune ajută la reducerea încărcării serverului prin spațierea cererilor. Timpul poate fi specificat în secunde, minute (m), ore (h) sau zile (d). | $ wget -w număr_în_secunde [URL] |
| -r | Activați recuperarea recursivă a link-urilor specificate, chiar și în cazul unor erori fatale. Această opțiune urmărește recursiv link-urile din adresa URL dată. | $ wget -r [URL] |
Exemplu:
1. Pentru a descărca pur și simplu o pagină web:
Pentru a descărca un singur fișier dintr-o adresă URL, trebuie doar să specificați adresa URL după cum urmează:
sortarea în arraylist în java
wget http://example.com/sample.php>
2. Pentru a descărca fișierul în fundal
Rulați procesul de descărcare în fundal folosind-b>sau--background>opțiune:
wget -b http://www.example.com/samplepage.php>
3. Pentru a suprascrie jurnalul while al comenzii wget
Redirecționați mesajele de ieșire către un fișier jurnal utilizând-o>opțiune:
wget http://www.example.com/filename.txt -o /path/filename.txt>
4. Pentru a relua un fișier descărcat parțial
Dacă o descărcare este întreruptă, reluați-o folosind-c>opțiune:
wget -c http://example.com/samplefile.tar.gz>
5. Pentru a încerca un anumit număr de ori
Specificați numărul de încercări de reîncercare folosind--tries>opțiune:
wget --tries=10 http://example.com/samplefile.tar.gz>
6. Setați timpul de așteptare între recuperări:
Setați timpul de așteptare dintre recuperări folosind butonul-w>opțiunea (în secunde, minute, ore sau zile):
wget -w 10 http://example.com/large_file.zip>
7. Activați recuperarea recursive:
Activați regăsirea recursivă pentru a descărca un întreg site web folosind-r>opțiune:
wget -r http://example.com/>
8. Citiți URL-uri din fișier:
Citiți adresele URL dintr-un fișier și descărcați-le folosind-i>opțiune:
wget -i urls.txt>
Comanda Wget – Întrebări frecvente
Pentru ce este folosită comanda wget?
Comanda wget este un instrument puternic de linie de comandă folosit în sistemele bazate pe Linux și Unix pentru a prelua fișiere de pe internet prin protocoalele HTTP, HTTPS și FTP. Este util în special pentru descărcări non-interactive, site-uri web în oglindă și descărcări recursive.
Cum descarci un fișier folosind wget?
Pentru a descărca un singur fișier folosind wget, puteți pur și simplu să rulați comanda urmată de adresa URL a fișierului pe care doriți să-l descărcați.
De exemplu:
wget https://example.com/file.zip>
Cum pot descărca un întreg site web folosind wget?
Pentru a descărca recursiv un întreg site web, utilizați
-m>sau--mirror>opțiunea împreună cu-p>sau--page-requisites>opțiunea de a descărca toate fișierele necesare.cpld vs fpgaDe exemplu:
wget -m -p https://example.com>
Cum limitez viteza de descărcare sau lățimea de bandă când folosesc wget?
Puteți folosi
--limit-rate>opțiunea de a limita viteza de descărcare sau utilizarea lățimii de bandă.De exemplu: pentru a limita viteza de descărcare la 500KB/s, puteți rula:
wget --limit-rate=500k https://example.com/file.zip>
Cum pot continua o descărcare întreruptă folosind wget?
Dacă o descărcare este întreruptă, puteți utiliza
-c>sau--continue>opțiunea de a relua descărcarea de unde a rămas.cum se transformă șirul în intDe exemplu:
wget -c https://example.com/file.zip>
Concluzie
În acest articol am discutat despre comanda Wget, care este un instrument util în Linux pentru descărcarea fișierelor de pe internet fără a fi nevoie de interacțiunea utilizatorului. Funcționează liniștit în fundal, ceea ce înseamnă că puteți începe o descărcare și puteți face alte lucruri în timp ce funcționează. Wget poate gestiona diverse tipuri de adrese web și poate chiar copia site-uri web întregi. Este util pentru conexiunile la internet lente sau nesigure, deoarece continuă să încerce să descarce până când reușește. În plus, oferă funcții utile, cum ar fi reluarea descărcărilor întrerupte și setarea timpilor de așteptare între recuperări. Învățând comenzile și opțiunile sale simple, utilizatorii își pot gestiona eficient descărcările și pot economisi timp.