Paso 4: Encuentre los datos
Esto fue la divertida pieza, que incluyó horas de investigación en internet en el transcurso de un par de meses. A diferencia del uso de herramientas de la tienda, mientras internet investigación puede beber whisky! Esto ayudado con la pesadez de tamizar a través de conjuntos de datos.
Rastreado a través de datos en GitHub repos, sitios web de gobierno, a través de conexiones personales y más. Algunos de los "malos datos" parecían demasiado localizadas (como San Antonion alcohol ventas), mientras que otros parecen tener más sentido como las ubicaciones de todas las prisiones de Estados Unidos en el mundo.
Los finales doce conjuntos de datos "malos" Elegí fueron):
* 2015 Airbnb anuncios en San Francisco (origen de datos: darkanddifficult.com)
* Meth laboratorios en Albuquerque (origen de datos: http://www.metromapper.org)
* Estados Unidos las prisiones (origen de datos: iniciativa de política de la prisión. prisonpolicy.org)
* U.S. masa tiroteos (1982-2012) (fuente de datos: Mother Jones)
* Lista negra de IPs (origen de datos: lista negra de SSL de Suricata)
* Internet violaciones de datos (origen de datos: http://www.informationisbeautiful.net/)
* A nivel mundial avistamientos de OVNI (fuente de datos: Centro Nacional de reportes de ovnis (NUFORC))
* Lugares en todo el mundo encantadas (origen de datos: Wikipedia)
* Missouri aborto alternativas (fuente de datos: data.gov (Gobierno de Estados Unidos))
* 18 años de los desalojos de San Francisco (origen de datos: el proyecto de mapeo de desalojo contra y la Junta de alquiler San Francisco)
* Sur de California de Starbucks (origen de datos: https://github.com/ali-ce)
* Dispensarios de mariguana Denver (origen de datos: Portal de datos abiertos de Denver)