Paso 6: Y UTF-8 mal formados...
.Códigos UTF-8 con formato incorrecto pueden conducir a varios errores y eventuales accidentes si la aplicación compatible no está programada adecuadamente.
Usted puede encontrar los códigos UTF-8 con formato incorrecto debido a varias razones:
-el texto es un extendido ASCII uno (ASCII extendido utiliza 255 char en lugar de 127)
-el texto no está completo: faltan algunos bytes...
-hay un error en la aplicación que generó el texto codificado UTF-8...
Su aplicación debe detectar todo eso!
Si su aplicación de UTF-8 no es diseñado apropiadamente, pueden ser vulnerable a los hackers.
Al diseñar la aplicación, es necesario tener en cuenta todo eso.
Aquí, como un ejemplo simple, es una función para detectar la codificación UTF-8 y extraer Unicode de una cadena de caracteres (función no probada).