Constellation Knowledge Network - Preguntas y respuestas sobre Bagua - ¿Cuántas palabras equivalen a un byte?

¿Cuántas palabras equivalen a un byte?

Pregunta 1: ¿Cuánto cuesta un byte? Byte: un byte es una unidad para transmitir información a través de una red (o almacenar información en un disco duro o en la memoria).

Byte es una unidad de medida utilizada por la tecnología de la información informática para medir la capacidad de almacenamiento y la capacidad de transmisión. 1 byte equivale a 8 bits binarios.

En el código ASCII, una letra inglesa (independientemente de mayúsculas y minúsculas) ocupa un byte y un carácter chino ocupa dos bytes.

Símbolos: la puntuación en inglés ocupa un byte, la puntuación en chino ocupa dos bytes. Por ejemplo, el punto inglés "." ocupa 1 byte y el punto chino "." tiene un tamaño de 2 bytes.

Como unidad digital en las computadoras, una secuencia numérica binaria suele ser un número binario de 8 bits. Por ejemplo, el código ASCII es un byte y la conversión de esta unidad es:

1 kilobyte (TB, terabyte) = 1024 gigabytes (2 elevado a la 40ª potencia)

(1TB =1024GB)

1 gigabyte (GB, gigabyte) = 1024 megabytes (2 elevado a la 30ª potencia).

(1GB=1024MB)

1 megabyte (MB, megabyte) = 1024 kilobytes (2 elevado a 20 power bytes).

(1MB=1024KB)

1 kilobyte (KB, kilobyte) = 1024 bytes (65438+2 elevado a 00 bytes) (1KB=1024B).

1 byte) = 8 bits.

Nota: TB es la unidad de almacenamiento más grande de los discos duros de los ordenadores actuales. 10 TB equivalen aproximadamente a la capacidad de almacenamiento de un cerebro humano.

Las unidades más grandes incluyen PB (PB, 1PB = 1024TB), EB (EB, 1EB = 1024PB) y ZB (Zettabyte, 1ZB = 1024pb).

1.2 Caracteres, bytes, cadenas

La clave para comprender la codificación es comprender con precisión los conceptos de caracteres y bytes. Es fácil confundir estos dos conceptos, por eso aquí hacemos una distinción:

Ejemplos de descripción de conceptos

Símbolos que usa la gente, símbolos en un sentido abstracto. 1', 'middle', 'a', '$', 'RMB',...

Los bytes son la unidad de almacenamiento de datos en las computadoras, los números binarios de 8 bits, son un almacenamiento muy específico. espacio . 0x01, 0x45, 0xFA,...

Cadena ANSI

En la memoria, si existe un "carácter" en forma de codificación ANSI, un carácter puede usar un byte o varias palabras. sección, luego llamamos a esta cadena una cadena ANSI o una cadena multibyte. Por ejemplo, chino 123 (7 bytes).

Conjuntos de caracteres y páginas de códigos

La codificación ANSI tiene diferentes conjuntos de caracteres. La misma secuencia de bytes representa diferentes caracteres en diferentes conjuntos de caracteres. Para analizar correctamente una cadena ANSI, se debe seleccionar el juego de caracteres correcto; de lo contrario, se pueden generar los llamados caracteres confusos. Las versiones de diferentes idiomas de los sistemas operativos tienen juegos de caracteres predeterminados. Si no especifica un juego de caracteres, el sistema utilizará este juego de caracteres para analizar cadenas ANSI. En otras palabras, si abrimos un archivo de texto ANSI (un archivo de texto que contiene sólo cadenas ANSI) guardado por un sistema operativo japonés en la versión china simplificada de Windows, veremos caracteres confusos. Sin embargo, si abrimos el archivo usando un editor de texto con una selección de codificación (como Visual Studio) y seleccionamos el juego de caracteres correcto, podremos ver su apariencia original. Nota: La codificación de los caracteres del chino tradicional en el conjunto de caracteres del chino simplificado y en el conjunto de caracteres del chino tradicional no es necesariamente la misma (resulta que parecen ser completamente diferentes).

Cada conjunto de caracteres tiene un número único llamado página de códigos. La página de códigos del chino simplificado (GB2312) es 936, mientras que la página de códigos del juego de caracteres predeterminado del sistema es 0, lo que significa que el juego de caracteres apropiado se selecciona de acuerdo con la configuración de idioma del sistema.

Uso de doble byte para codificar caracteres

La cadena está en la memoria. Si los "caracteres" existen en forma de números de serie en Unicode, entonces los llamamos...>;& gt

Pregunta 2: ¿A cuántos bytes equivale una palabra en una computadora? "Sé que mucha gente en Internet dice que un carácter chino equivale a dos bytes y que una letra inglesa o un número equivale a un número> & gt Pero la respuesta dada por el profesor es que una palabra equivale a cuatro bytes > Además, hay una frase en el libro: Una palabra se compone de cuatro bytes consecutivos a partir de una dirección divisible por cuatro. El tipo de datos de una palabra es de cuatro bytes consecutivos y todos los datos en los microprocesadores de 32 bits admiten el formato de almacenamiento de palabras. .......

En primer lugar, dudo de esta frase... En el libro anterior, "Consta de cuatro bytes consecutivos que comienzan con una dirección divisible por 4 Una palabra", esto es no una palabra, sino una palabra doble. "Todos los datos de los microprocesadores de 32 bits admiten el formato de almacenamiento de palabras", esto es realmente engañoso. No sé cuántos procesadores de 32 bits he visto.

Recuerdas:

1, byte, byte, 8bit, es el espacio que ocupan ocho bits binarios y una letra ASCII.

2. Palabra, 16 bits, el espacio que ocupa un carácter chino. Vale la pena mencionar la codificación involucrada aquí, como UNicode, GBK, big5.

3. Palabra doble, palabra doble, 32 bits

3, cuatro bytes consecutivos... Se trata del alineamiento de procesadores de 32 bits. El alineamiento se debe a problemas de eficiencia. . Si no lo entiendes, simplemente ignóralo.

4. 64 bits, que puede ser popular en el futuro, aún no tiene nombre, pero predigo que se llamará qword.

Pregunta 3: ¿Cuántas palabras equivalen a 1 byte? Un carácter chino ocupa dos bytes y los signos de puntuación chinos en modo de ancho completo también ocupan dos bytes. Una letra en inglés, independientemente del caso, y los signos de puntuación en inglés ocupan un byte.

Pregunta 4: ¿A cuántos bytes equivale un carácter? Diferentes caracteres ocupan diferentes bytes.

Código ASCII:

Una letra inglesa (independientemente de mayúsculas y minúsculas) ocupa un byte y un carácter chino ocupa dos bytes. Una secuencia de números binarios, como unidad digital en las computadoras, generalmente un número binario de 8 bits, convertido a decimal. El valor mínimo es 0 y el valor máximo es 255. Por ejemplo, el código ASCII es un byte.

Codificación UTF 8:

Un carácter inglés equivale a un byte y un carácter chino (incluido el chino tradicional) equivale a tres bytes.

Codificación Unicode:

Una palabra en inglés equivale a dos bytes y un carácter chino (incluido el chino tradicional) equivale a dos bytes.

Símbolos:

La puntuación en inglés ocupa un byte y la puntuación en chino ocupa dos bytes. Por ejemplo, el punto inglés "." ocupa 1 byte y el punto chino "." tiene un tamaño de 2 bytes.

Pregunta 5: ¿Cuántos bytes tiene una palabra en una computadora? La unidad más pequeña de información procesada por una computadora. 1 byte = número binario de 8 bits

Byte significa byte en las computadoras.

Grupo numérico: En el ámbito de las tecnologías de la información y las tecnologías digitales, unidad utilizada para representar la cantidad de información.

Es la unidad de byte del lenguaje de máquina de los ordenadores, y 8 bits equivalen a un byte.

Un grupo de bits (normalmente 8 bits)

La unidad más pequeña de información procesada por una computadora. 1 byte = número binario de 8 bits.

Un carácter chino equivale a 2 bytes.

Entonces 50 caracteres chinos son 100 bytes.

El número 123456789 es un byte.

,. Los símbolos chinos son de 2 bytes.

,./;][ !@ # $% Los símbolos ordinarios son de 1 byte.

上篇: ¿Qué significa soñar con un arma en “El Duque de Zhou”? 下篇: Funciones psíquicas de los minerales coloreados
Artículos populares