¿Qué son los caracteres Unicode?
Los caracteres Unicode se pueden aplicar a todas las codificaciones conocidas. Unicode es un nuevo código de caracteres que sigue el ASCII (Código estándar nacional estadounidense para información interactiva). Define un número y un nombre para cada símbolo, especifica el carácter y su valor numérico (punto de código) y la representación binaria de ese valor. Define un valor de 16 bits utilizando un número hexadecimal y un prefijo (U), como por ejemplo: U 00465438. Sin embargo, tenga en cuenta que las versiones de JavaScript anteriores a la 1.3 no admiten la codificación Unicode.
Compatibilidad Unicode con ASCII e ISO
Unicode es compatible con caracteres ASCII y es compatible con la mayoría de los programas. Los primeros 128 códigos Unicode tienen los mismos valores de bytes que los códigos ASCII. Los caracteres Unicode de U 0020 a U 007E son equivalentes a los códigos ASCII 0x20 a 0x7E. A diferencia del ASCII de 7 bits, que admite letras latinas, Unicode establece un valor de codificación de 16 bits para cada carácter, lo que permite decenas de miles de caracteres. Por ejemplo, la versión Unicode contiene 38.885 caracteres. También se puede ampliar. Por ejemplo, UTF-16 permite combinar 16 caracteres en un millón o más de caracteres, mientras que UTF convierte la codificación en bits binarios verdaderos.
Unicode es totalmente compatible con el estándar internacional ISO/IEC 10646-1; 1993, que es un subconjunto de ISO 10646 y admite dos números octales de ISO UCS-2 (Conjunto de caracteres universales). La compatibilidad con Unicode en JavaScript 1.3 significa que puede utilizar libremente caracteres nativos y símbolos científicos especiales en sus programas. Unicode proporciona una forma estándar de codificar texto multilingüe y, como es compatible con ASCII, puede utilizar los caracteres ASCII que desee.
Secuencias de escape Unicode
Puedes utilizar secuencias de escape Unicode en caracteres literales, que constan de seis caracteres ASCII: \u más un número hexadecimal. Por ejemplo: \u00A9 representa el símbolo de copyright. Cada secuencia de escape Unicode en JavaScript se interpreta mediante un carácter. La siguiente tabla muestra los caracteres especiales más utilizados y sus valores Unicode.
Categoría Unicode Valor Nombre Formato Nombre
En blanco\u0009Pestaña
\u000BPestaña vertical
\u000CPágina Salto
\u0020 Espacio
Valor del terminador de línea \u000Un carácter de avance de línea
\u000D Intro.
Otros valores de secuencia de escape Unicode\u000bespacio
\u0009pestaña horizontal
\u0022comilla doble"
\ u0027 Comilla simple '
\u005C barra invertida/
JavaScript usa secuencias de escape Unicode de manera diferente a Java. En primer lugar, las secuencias de escape no se interpretan como caracteres especiales en JavaScript. Por ejemplo, una secuencia de escape para un carácter de nueva línea en una cadena. no termina la cadena hasta que la función la interpreta, y JavaScript la ignora si se usa dentro de un comentario. En Java, se ignorará si la secuencia de escape se usa dentro de una sola línea de comentario y se interpreta como caracteres Unicode. literales, el compilador de Java interpretará primero las secuencias de escape.
Por ejemplo, si usa una nueva línea (\u000A) en Java, terminará la cadena y provocará un error en Java porque la nueva línea no está permitida en los literales de cadena, por lo que debe usar el símbolo \n en JavaScript, ni la diferencia.
Mostrar caracteres en Unicode
Puede utilizar Unicode para mostrar caracteres o símbolos profesionales en diferentes idiomas, pero esto requiere que el cliente admita Unicode, como Netscape Navigator 4.x, y Las fuentes Unicode del cliente y las plataformas operativas también deben ser compatibles. Por ejemplo, Windows 95 sólo admite parte de Unicode. Además, para ingresar caracteres que no sean ASCII, debe tener un dispositivo de entrada que admita todos los caracteres Unicode. El teclado extendido estándar no puede hacer esto, pero podemos usar secuencias de escape Unicode para ingresar caracteres Unicode. Si necesita más información sobre Unicode, consulte la versión 2.0 del sitio web de Unicode Consortium.