Paso 3: ¿Qué es UTF-8?
UTF-8 es un medio para codificar cualquier carácter Unicode en medio de un archivo ASCII (texto) 'tradicional'.
Archivos ASCII necesita sólo un byte por carácter. Es perfecto cuando sólo escribes en inglés.
Sin embargo, puede que necesite escribir un carácter chino o una fórmula matemática en medio de su texto, y UTF-8, es posible: cuando el código de carácter Unicode no cabe en un solo byte, se codifica en 2, 3 o 4 bytes.
Esta codificación intenta no romper la codificación de ASCII antiguo y tradicional.
Esto significa que si usted lee un texto de UTF-8 con un editor de texto que no es UTF-8 compatible, se estrellará ni el editor, ni el formato del texto que se descolocan.
En lugar de mostrar un carácter Unicode único y correcto, el editor incompatible mostrará 2, 3 o 4 caracteres ASCII extendidos.
Por otra parte, un código de UTF-8 con formato incorrecto puede llevar a problemas inesperados si el editor de texto compatible con UTF-8 no ha sido correctamente codificado.