Script en Perl para mantener listas de proxies abiertos

Los proxies abiertos (y encadenados) pueden ser útiles para manterner el anonimato en Internet, casi siempre no con muy "buenos" propósitos ;)
¿Cómo encontrar proxies abiertos? Es fácil si sabes cómo... No en serio, ya sabéis que hay un montón de listas disponibles en Internet. Por ejemplo, diariamente se publican listas en pastebin.com. Otros sitios están dedicados al negocio de la recopilación de enormes listas como www.freeproxylists.com o www.xroxy.com e incluso este último proporciona actualizaciones vía RSS (XML). Por supuesto, la mayoría de ellos proponen pagar por sus servicios...

La cuestión aquí es la fiabilidad de los proxies abiertos publicados. xroxy facilita un indicador de fiabilidad (0-100%), pero muchas veces los proxies no están disponibles o rechazan las conexiones.

Xavier Mertens ha publicado un pequeño script en Perl para mantener una lista de proxies abiertos fucnionales. El script se llama oplb (Open Proxies List Builder) y se basa en el agregador PHP de RSS de xroxy.com. Los proxies se almacenan en una base de datos SQLite y el script mediante un cron chequea regularmente su disponibidad mediante el módulo perl WWW:ProxyChecker. Si no quieres obtener nuevos proxies publicados por xroxy.com también tienes un modo manual para generar y mantener tu propia lista:


$ ./oplb.pl --help
Usage: ./oplb.pl [--debug] [--dump] [--force] [--help]
                 [--reliability=percent] [--ttl=seconds]
Where:
--debug : Produce verbose output
--dump : Generate a list of reliable proxies (stdout)
--force : Ignore TTL and force a check of the xroxy.com RSS feed
--reliability=x : Define minimum reliability for proxies
--ttl=x : TTL for xroxy.com RSS feed update (default: 3600)


Por ejemplo, puedes crear un crontab para buscar nuevos proxies cada hora con una fiabilidad mayor al 90%:

*/15 * * * * oplb.pl --reliability=90 --ttl=3600


Para volcar la lista de proxies fiables obtenidos:

$ ./oplb.pl --dump --reliability=90
122.72.28.19:80
122.72.33.138:80
122.72.33.139:80
219.159.105.180:8080
196.1.178.254:3128
192.162.150.77:8080
88.85.108.16:8080
202.112.117.202:3128
59.172.208.186:8080
41.191.27.226:80
114.79.159.2:8080


Sólo son mostrados los proxies chequeados al menos una vez durante los últimos 3 días, una lista preparada para ser utilizada por otras herramientas...


Fuente: Manage an Efficient List of Open Proxies
Script: https://github.com/xme/oplb/blob/master/oplb.pl

3 comentarios :

  1. Bien interesante el articulo; descargue el script pero el mismo da un error con un modulo de perl (WWW:ProxyChecker) que no esta instalado y en los repositorios de Debian 7 no viene, sabes de donde se puede obtener para descargarlo e instalarlo y probar ese poderoso script.... saludos.

    ResponderEliminar
  2. ¿Has probado con ppm? A mi me lo instala sin problemas:

    PPM> install WWW-ProxyChecker
    Install package 'WWW-ProxyChecker?' (y/N): y
    Installing package 'WWW-ProxyChecker'...
    Bytes transferred: 9076
    Installing \site\lib\Class\Data\Accessor.html
    Installing C:\strawberry\perl\site\lib\Class\Data\Accessor.pm
    Bytes transferred: 17483
    Installing \site\lib\WWW\ProxyChecker.html
    Installing C:\strawberry\perl\site\lib\WWW\ProxyChecker.pm

    ResponderEliminar
  3. Muy bueno su blog!
    Me gustaria ver sus publicaciones en Hogar del Ocio.

    Saludos

    ResponderEliminar