Extraer URLs de la entrada estandard
2004-12-16 00:00:00
Un script que he escrito en un momento para sacar las urls que han ido saliendo en la web. Además, si hay un texto en title lo usa como explicación del enlace.
#!/usr/bin/perl
while (
{
$linea=$_;
while ($linea=~/(<a href="(http[^"]+?)" target="_blank" title="([^"]*?)">(.*?)<\/a>)/i )
{
$url=$2;
$titulo=$3;
$texto=$4;
if ( !$titulo )
{
$titulo=$texto;
}
print "<li><a href=\"$url\" target=\"_blank\" title=\"$titulo\">$titulo.\n";
$linea=~s/(<a href="(http[^"]+?)" target="_blank" title="([^"]*?)">(.*?)<\/a>)//i;
}
}
¿Como se podria hacer que de igual si el target está o no, o que no importe el orden?