Un corto Q & A sobre este instructable.
P: ¿qué la #$% * es web desguace y ¿por qué alguien necesita?
A: la mayoría de las páginas web en internet no ofrecen una web API, y lo necesita. La idea es tomar la información de la página web estructurada en una manera que puede ser utilizada por la aplicación (un script, un archivo ejecutable, una página web o incluso una base de datos).
P: ¿por qué?
R: vamos a ver, busca un apartamento en la ciudad de X, dentro de un área determinada y debe ser en metros cuadrados Y, puedes buscar Pentecostés las herramientas proporcionadas (pero a veces Tu criterio no es buscar poder por las herramientas de la página) pero los resultados no se presentan de la manera que necesita/les gusta. Ahora piense en un script que obtiene los datos para la ciudad X de la manera posible para su procesamiento posterior, luego buscar automáticamente para el área determinada y mostrar sólo los apartamentos que están sobre Y metros cuadrados como una lista, con el más barato primero. Todo esto por sólo un doble clic y funciona en Windows, Mac o Linux.
P: ¿es raspar legal?
R: no es ilegal, no obtener datos que no se supone que para conseguir, sólo obtendrá de manera automática y si lo haces bien no spam del servidor con las peticiones no necesarios.
P: ¿siempre funcionará, como una web API?
R: no, si la página cambia en una forma que afecta las lecturas deberá cambiar la secuencia de comandos a la nueva disposición de datos. Nada demasiado grande o difícil, lo puedo hacer en menos de 1 minuto.
P: ¿puedo obtener datos que no se supone que por acceder a él, como inyectar SQL?
R: no, usted no puede, raspado no es hackear, es sólo una manera de obtener sólo lo que necesita de una o más páginas Web.