OrdinadorsTecnologia de la informació

Codificació de la informació de text a l'ordinador

Ordinador - un dispositiu sofisticat amb el qual pot crear, convertir i emmagatzemar informació. No obstant això, l'equip no funciona de manera molt comprensible per a nosaltres - gràfic, text i dades numèriques s'emmagatzemen com matrius binàries nombres. En aquest article veurem com la codificació de la informació de text.

El que per a nosaltres és el text d'un ordinador - una seqüència de caràcters. Cada símbol representa un cert conjunt de zeros i uns. Sota els símbols signifiquen no només en majúscules i minúscules lletres del llatí alfabet, sinó també els signes de puntuació, signes aritmètics, caràcters especials, símbols especials i fins i tot l'espai.

codificació binària de la informació textual

Prement una tecla determinada al controlador intern envia un senyal elèctric que es converteix en un codi binari. Codi es correspon amb un determinat símbol, que es visualitza a la pantalla. Per a la seva presentació al alfabet llatí en un format de codificació ASCII sistema internacional digital va ser creada. Es requereix 1 byte per a l'enregistrament d'un símbol d'aquesta manera consisteix en la seqüència de vuit símbol de zeros i uns. L'interval de gravació - a partir d'00000000 a 11111111, és a dir, la codificació de la informació de text amb aquest sistema ens permet representar 256 caràcters. En la majoria dels casos, això és suficient.

ASCII es divideix en dues parts. Els primers 127 caràcters (de 00 milions a 01.111.111) són internacionals i són símbols i lletres de l'alfabet anglès específics. La segona part - l'extensió (de 10.000.000-11.111.111) - pretén representar l'alfabet nacional, la redacció és diferent del llatí.

la informació de codificació de text en format ASCII es basa en el principi de la successió creixent, és a dir, com més gran sigui el nombre de seqüència de lletres, més gran serà el valor del seu codi ASCII. Les figures i part russa de la taula es basen en el mateix principi.

No obstant això, en el món hi ha diversos tipus de codificació de caràcters ciríl·lics. El més comú - és KOI-8 (codificació de vuit bits que s'ha utilitzat en els anys 70 en el sistema operatiu Unix primera ruifitsirovannyh), ISO 8859-5 (desenvolupat per l'Oficina Internacional de Normalització), el CP 1251 (informació textual de codificació utilitzat en el modern sistema operatiu Windows), així com 2 bytes d'Unicode, que pot ser utilitzat per a introduir 65.536 caràcters. Tal varietat de codificacions a causa del fet que es van desenvolupar en moments diferents, per diferents sistemes operatius i consideracions diferents. A causa d'això, sovint tenen dificultats a l'hora de transferir text des d'un mitjà a un altre - d'un desajust que codifica l'usuari veurà un conjunt d'icones confusos. Com puc arreglar que aquesta situació? En Word, per exemple, quan s'obre un document, un missatge sobre problemes amb la visualització de text i ofereix diverses opcions per a la transcodificació.

Per tant, la codificació i processament de la informació textual en les entranyes de l'ordinador - el procés és difícil i requereix molt de temps organitzada. Tots els símbols de qualsevol alfabet són només una determinada seqüència de dígits del sistema binari, una cèl·lula - això és un byte d'informació.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ca.birmiss.com. Theme powered by WordPress.