Outils du site

Outils pour utilisateurs


documentation:outils:wget (lu 445 fois)

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
documentation:outils:wget [le 03/09/2013 à 09h56]
111110101011 [Télécharger les mp3 d'un site web avec wget + script]
documentation:outils:wget [le 14/12/2015 à 20h18]
111110101011 supprimée
Ligne 19: Ligne 19:
  
 <code> <code>
-wget -mc "http://mfr3d.net/zik/"+wget -mc "http://rob1.j92.free.fr/Musique"
 </code> </code>
  
Ligne 102: Ligne 102:
 Bon le hic apparemment c'est que sur le terrier ça télécharge à 2 à l'heure... mais c'est pas grave, on aura nos mp3s ! Bon le hic apparemment c'est que sur le terrier ça télécharge à 2 à l'heure... mais c'est pas grave, on aura nos mp3s !
  
-=== Addendum 1 ===+=== Addendum 1 - sed appliqué à Le Terrier ===
  
 edmc73 nous fait part d'une commande qui remplace l'usage des ''cut'' et ''grep'' du script ci-dessus. edmc73 nous fait part d'une commande qui remplace l'usage des ''cut'' et ''grep'' du script ci-dessus.
 <code>sed -e '/url/!d' -e 's/^\s*{"url": "\(.*\)",/\1/' tracks.js</code> <code>sed -e '/url/!d' -e 's/^\s*{"url": "\(.*\)",/\1/' tracks.js</code>
 +
 +=== Addendum 2 - sed dans un cas plus général ===
 +
 +edmc73 [[http://forum.p2pfr.com/sutra145459.html|a encore frappé]], ce motif devrait convenir à bon nombre de cas d'extration d'URLs de MP3, éventuellement avec des adaptations mineures:
 +
 +Pour traiter une donnée ayant chaque ligne du type:
 +<code>dublablacodecode<a href="/chemin/bien/precis/fichier.xyz">OnSenFoutDuNom</a>dublablacode</code>
 +
 +... et en extraire la partie **fichier.xyz**, on pourra utiliser: 
 +<code>sed -r 's/.*href=".*[$/](.*)".*/\1/' tonFichier.html</code>
 +
 +Des explications simples sur sed sur [[http://wiki.edmc73.com/linux/sed|son wiki]].
  
 ===== Liens ===== ===== Liens =====
Ligne 111: Ligne 123:
   * Site officiel: https://www.gnu.org/software/wget   * Site officiel: https://www.gnu.org/software/wget
   * Wikipédia: [[wp>Wget]] (en), [[wpfr>GNU_Wget]] (fr)   * Wikipédia: [[wp>Wget]] (en), [[wpfr>GNU_Wget]] (fr)
 +  * Exemple d'utilisation avec le site archive.org (paramètre ''-e robots=off'' nécessaire): http://blog.archive.org/2012/04/26/downloading-in-bulk-using-wget/ ; idem ici: http://codenimbus.com/2010/08/02/override-robots-txt-with-wget/