¿Qué son los caracteres Unicode?

Unicode es un importante estándar universal de codificación de caracteres para interacción y visualización, que cubre idiomas de Estados Unidos, Europa, Medio Oriente, África, India, Asia y el Pacífico, así como símbolos chinos antiguos y profesionales. Unicode permite el intercambio, procesamiento y visualización de texto multilingüe, así como símbolos profesionales y matemáticos comunes. Espera resolver la informática multilingüe, como los estándares de caracteres de diferentes países, pero no todos los chinos modernos o antiguos pueden ser compatibles.

Los caracteres Unicode se pueden aplicar a todas las codificaciones conocidas. Unicode es un nuevo código de caracteres que sigue el ASCII (Código estándar nacional estadounidense para información interactiva). Define un número y un nombre para cada símbolo, especifica el carácter y su valor numérico (punto de código) y la representación binaria de ese valor. Define un valor de 16 bits utilizando un número hexadecimal y un prefijo (U), como por ejemplo: U 00465438. Sin embargo, tenga en cuenta que las versiones de JavaScript anteriores a la 1.3 no admiten la codificación Unicode.

Compatibilidad Unicode con ASCII e ISO

Unicode es compatible con caracteres ASCII y es compatible con la mayoría de los programas. Los primeros 128 códigos Unicode tienen los mismos valores de bytes que los códigos ASCII. Los caracteres Unicode de U 0020 a U 007E son equivalentes a los códigos ASCII 0x20 a 0x7E. A diferencia del ASCII de 7 bits, que admite letras latinas, Unicode establece un valor de codificación de 16 bits para cada carácter, lo que permite decenas de miles de caracteres. Por ejemplo, la versión Unicode contiene 38.885 caracteres. También se puede ampliar. Por ejemplo, UTF-16 permite combinar 16 caracteres en un millón o más de caracteres, mientras que UTF convierte la codificación en bits binarios verdaderos.

Unicode es totalmente compatible con el estándar internacional ISO/IEC 10646-1; 1993, que es un subconjunto de ISO 10646 y admite dos números octales de ISO UCS-2 (Conjunto de caracteres universales). La compatibilidad con Unicode en JavaScript 1.3 significa que puede utilizar libremente caracteres nativos y símbolos científicos especiales en sus programas. Unicode proporciona una forma estándar de codificar texto multilingüe y, como es compatible con ASCII, puede utilizar los caracteres ASCII que desee.

Secuencias de escape Unicode

Puedes utilizar secuencias de escape Unicode en caracteres literales, que constan de seis caracteres ASCII: \u más un número hexadecimal. Por ejemplo: \u00A9 representa el símbolo de copyright. Cada secuencia de escape Unicode en JavaScript se interpreta mediante un carácter. La siguiente tabla muestra los caracteres especiales más utilizados y sus valores Unicode.

Categoría Unicode Valor Nombre Formato Nombre

En blanco\u0009Pestaña

\u000BPestaña vertical

\u000CPágina Salto

\u0020 Espacio

Valor del terminador de línea \u000Un carácter de avance de línea

\u000D Intro.

Otros valores de secuencia de escape Unicode\u000bespacio

\u0009pestaña horizontal

\u0022comilla doble"

\ u0027 Comilla simple '

\u005C barra invertida/

JavaScript usa secuencias de escape Unicode de manera diferente a Java. En primer lugar, las secuencias de escape no se interpretan como caracteres especiales en JavaScript. Por ejemplo, una secuencia de escape para un carácter de nueva línea en una cadena. no termina la cadena hasta que la función la interpreta, y JavaScript la ignora si se usa dentro de un comentario. En Java, se ignorará si la secuencia de escape se usa dentro de una sola línea de comentario y se interpreta como caracteres Unicode. literales, el compilador de Java interpretará primero las secuencias de escape.

Por ejemplo, si usa una nueva línea (\u000A) en Java, terminará la cadena y provocará un error en Java porque la nueva línea no está permitida en los literales de cadena, por lo que debe usar el símbolo \n en JavaScript, ni la diferencia.

Mostrar caracteres en Unicode

Puede utilizar Unicode para mostrar caracteres o símbolos profesionales en diferentes idiomas, pero esto requiere que el cliente admita Unicode, como Netscape Navigator 4.x, y Las fuentes Unicode del cliente y las plataformas operativas también deben ser compatibles. Por ejemplo, Windows 95 sólo admite parte de Unicode. Además, para ingresar caracteres que no sean ASCII, debe tener un dispositivo de entrada que admita todos los caracteres Unicode. El teclado extendido estándar no puede hacer esto, pero podemos usar secuencias de escape Unicode para ingresar caracteres Unicode. Si necesita más información sobre Unicode, consulte la versión 2.0 del sitio web de Unicode Consortium.

上篇: El esfuerzo secreto de diez días de Ding Huo para obtener la imagen. 下篇: Corre para adivinar_Corre para realizar una prueba.