Les notes de Lionel

Notes, astuces et infos en tout genre

#51 - linux - How do I extract all the external links of a web page and save them to a file? - Super User

Pour vérifier les liens externes sur un site:


lynx -listonly -nonumbers -dump <url-du-site>
# or
lynx -listonly -dump <url-du-site>

Comme ce qui m'intéresse c'est juste la liste des liens, qu'ils soient visibles ou pas, je fais:

lynx -listonly -nonumbers -dump <url-du-site> | grep -vE 'Visible links|Hidden links|^$' | sort | uniq