Así que ayer por la noche en aproximadamente 22:00 después de un día agotador en el trabajo, me di cuenta que sólo el martes sólo y también hay partido de Liga del campeón de ningún Arsenal hoy. Decidí ver una película. Una película de buen deporte base.
Lo bueno fue que, tengo algunas buenas películas de hollywood en mi disco duro (que en su mayoría he copiado en mi disco duro de amigos), y no he visto la mayoría de ellos.
Pero que película pertenece al deporte de género!!.!! Ahh. No voy a hacer una búsqueda manual de cada película en google/imdb para encontrar su género.
Quería alguna solución rápida. Un script en python pequeño hará el truco para mí aquí. El script tomará el nombre de cada archivo en mi carpeta de la película y me dan el género así como la calificación de imdb de la película.
Bro no es tan fácil. Así que en primer lugar, el nombre del archivo no es el nombre de la película. Son los nombres de archivo como, We.Are.Marshall[2006]DvDrip[Eng]-aXXo o casa blanca abajo 2013 BRRip 720p x264 AAC - vírgenes [P2PDL] o el Sting.avi, etc..
Hacer una búsqueda directa de estos nombres fueron no darme ningún resultado en IMDB. por lo que necesitaba extraer el nombre de la película de estos nombres de archivo. Me permito escribir una expresión regular rápida para eso. No tan duro. Después de hacer algún golpe y tratar de surgió "^(.+?) \s[\ (\ [\d]. + « que estaba dando resultados justos para la mayoría de los casos. Resto fue manejado por re.
Ahora viene la parte agitada. ir a buscar la salida usando urllib y usando BeautifulSoup para analizarlo. Ahh.!! El análisis es agotador. Especialmente el martes por la noche: P. Google me ayudó en eso. Este paquete de IMDbPY ya hay allí. Aunque tiene algunos problemas, como que no funciona con python3 y es algo lento. Pero todavía lo fue resolver mi caso de uso.
Después de eso escribí un script rápido que encuentra el nombre de la película del nombre del archivo de mi carpeta de la película y me consiguió el resultado. Ahha. problema solucionado.
Tardó unos 10 minutos para hacerme el resultado. Y sí he escogido Hoosiers, el primer resultado que deportes de género (siempre he creído que codicioso es buena: P). fue realmente un reloj bonito.
Puedo hacer un montón de otras cosas también. Como ordenar las películas por orden decreciente de calificación de imdb y etc.. seguro de sí. Lo haré más adelante. : P