Chemins d'accès

L'onglet Chemins d'accès dans la zone de dialogue Paramètres de déchargement permet d'indiquer les chemins d'accès qui doivent être repris ou exclus du déchargement. Dans ces cases de texte, mettez des URL absolus (des URL commençant par "http://" ou "https://") ou des expressions rationnelles, séparés par <Retour>.

Les paramètres de chemins d'accès fonctionnent en association avec le paramètre Option de déchargement sous l'onglet Général et le paramètre Inclure les fichiers secondaires sous l'onglet Avancé tab selon les règles suivantes :

  1. Si c'est l'URL original (l'URL indiqué dans la case de texte URL Web), SiteSucker ramène le fichier.
  2. Sinon, si l'URL commence par une des séquences (ou coïncide avec une des expressions rationnelles) de la case de texte Chemins à exclure, le fichier n'est pas ramené.
  3. Sinon, si l'URL rencontre les requis du paramètre Option de déchargement, le fichier est ramené.
  4. Sinon, si l'URL commence par une des séquences (ou coïncide avec une des expressions rationnelles) de la case de texte Chemins à inclure, SiteSucker ramène le fichier.
  5. Sinon, si le paramètre Inclure les fichiers secondaires est activé et l'URL référence un type de fichier non-HTML, SiteSucker ramène le fichier.
  6. Sinon, SiteSucker ne ramène pas le fichier.

SiteSucker permet d'utiliser les expressions rationnelles dans les séquences de chemin d'accès. Si l'option Utiliser les expressions rationnelles est cochée, tous les chemins sont interprétés comme expressions rationnelles. Par exemple, pour sélectionner les URL qui reprennent un blanc souligné, indiquez l'expression rationnelle suivante : ".*_.*". Les expressions sont interprétées selon ICU v3 (pour les détails, voir le guide utilisateur de ICU à Regular Expressions). Consulter Regular Expressions Reference pour plus de conseils sur l'utilisation des expressions rationnelles.