Este instructable le mostrará cómo iniciar sesión a través de un formulario AJAX usando Python y un módulo llamado Mechanize.
Las arañas son programas de automatización de la web que se están haciendo cada vez más popular forma de personas recopilar datos en línea. Se arrastran alrededor de la web recopilando materiales preciosos para alimentar las más poderosas empresas web. Otros gatear alrededor y reunirán conjuntos específicos de datos para mejorar la toma de decisiones, o inferir lo que está "in" o encuentran las rutas de viaje más baratas.
Arañas (rastreadores web, WebBot o raspadores de pantalla) son ideales para convertir a goop HTML en algo parecido a la de datos inteligentes, pero tenemos un problema cuando se trata de páginas Web AJAX habilitado que tienen JavaScript y sesiones de cookies habilitada que no son navegables con el conjunto normal de spidering herramientas. En este instructivo accederán nuestra propia página de miembro en pubmatic.com. Estos pasos muestran un método a seguir, pero tu página será diferente.
¡Que te diviertas!