OrdinadorsProgramació

Codi ASCII (Codi estàndard americà per a l'intercanvi d'informació) - la codificació de text bàsic per a l'alfabet llatí

Segons la Unió Internacional de Telecomunicacions, l'any 2016 per Internet amb més o menys regularitat utilitzar a tres mil milions i mig de persones. La majoria d'ells ni tan sols pensar en que qualsevol missatge enviat a ells a través d'un PC o dispositius mòbils, així com els textos que apareixen en els monitors de tota mena, de fet, és una combinació de 0 i 1. Això es coneix com la representació codificada de la informació. Es proporciona i facilita l'aplicació del seu emmagatzematge, processament i transmissió. El 1963, el codi ASCII dels Estats Units ha estat desenvolupat, que és l'objecte d'aquest article.

Presentació de la informació a l'ordinador

En termes de qualsevol text ordinador electrònica és un conjunt de caràcters individuals. Entre ells no són només la lletra, inclosa la capital, sinó també els signes de puntuació, números. A més, els símbols especials s'utilitzen "=", "i", "(" i espais.

Una pluralitat de símbols que componen el text, anomenat l'alfabet, i el nombre - de potència (denotat com N). Per determinar l'expressió N = 2 ^ b, on b - nombre de bits d'informació o un pes símbol particular.

Es va demostrar que el poder de 256 caràcters de l'alfabet li permet enviar tots els caràcters necessaris.

Des 256 és un 8 grau dos, llavors el pes de cada caràcter és de 8 bits.

Unitat de mesura de 8 bits s'anomena d'1 byte, per això diem que el codi binari de qualsevol caràcter en el text que s'emmagatzema a l'ordinador, ocupa un byte de memòria.

Com és la codificació

Qualsevol text introduït a la memòria del PC a través de les tecles del teclat, els números dels quals van ser escrits, lletres, signes de puntuació i altres símbols. En la memòria que es transmeten en codi binari, és a dir, cada símbol s'assigna al codi decimal familiar per a una persona de 0 a 255, el que correspon a un codi binari - .. De 00.000.000-11.111.111.

caràcter Byte de codificació permet que el processador realitza el processament de text, es refereix a cada caràcter per separat. Alhora, els 256 caràcters és suficient per a representar qualsevol informació de caràcter.

Codificació de caràcters ASCII

Aquesta abreviatura significa el codi estàndard anglès americà per a l'intercanvi d'informació.

Fins i tot en les albors de la informàtica, es va fer evident que és possible arribar a una varietat de modes de codificació de la informació. No obstant això, per transferir informació d'un ordinador a un altre es requereix per desenvolupar un estàndard únic. Així, el 1963 hi va haver una taula ASCII als EUA .. És qualsevol equip alfabet caràcter se li assigna un número d'ordre en la representació binària. Inicialment, el codi ASCII s'utilitza només als Estats Units, i més tard es va convertir en un estàndard internacional per al PC.

Taula de Continguts

codis ASCII es divideixen en 2 parts. norma internacional es considera que és només la primera meitat de la taula. Inclou codi del nombre de seqüència de 0 (codificat com 00000000) a 127 (codi 01.111.111).

número de sèrie

N

Codificació de text ASCII

símbol

0-31

0000 0000 - 0001 1111

Els personatges amb N des 0 a 31 se'ls crida gerents. La seva funció és la de "guia" el procés de sortida de text a un monitor o dispositiu d'impressió, un xiulet, etc.

32-127

0010 0000 - 0111 1111

Símbols amb N des de 32 127 (una part estàndard de la taula) - les lletres majúscules i minúscules de l'alfabet llatí, els números 10-Nye, signes de puntuació i diversos suports, comercials i altres personatges .. Símbol 32 indica un espai.

128-255

1000 0000 - 1111 1111

Símbols amb N des 128-255 (una part alternativa de la taula de la pàgina o codi) poden tenir una varietat d'opcions, cadascuna de les quals té el seu propi nombre. La pàgina de codis utilitzada per establir els alfabets nacionals, que són diferents del llatí. En particular, es va dur a terme amb l'ajuda del codi ASCII dels caràcters russos.

Taula de codificació de majúscules i minúscules estan seguint un a l'altre en ordre i nombres alfabètic - valors ascendents. Aquest principi és vàlid per a l'alfabet rus.

els caràcters de control

taula de codificació ASCII va ser originalment dissenyat per a la recepció i transmissió d'informació sobre això ja no és utilitzat pel dispositiu com un teletip. En aquest sentit, el joc de caràcters no imprimibles inclòs utilitzat com ordres per controlar el dispositiu. Tals ordres es van utilitzar en aquestes tècniques de missatgeria pre-ordinador com a codi Morse, i així successivament.

El símbol "teletip" més comú és la NUL (00 "zero"). Encara s'utilitza en la majoria dels llenguatges de programació, el que indica el signe del final de la línia.

Quan es fa servir la codificació ASCII

Codi Estàndard Americà requereix no només el teclat d'entrada de text. També s'utilitza en el gràfic. En particular, les imatges del programa Fabricant d'ASCII Art representen diferents espectres extensions de caràcters ASCII codificació.

Aquests productes vénen en dos tipus: editors gràfics que realitza la funció de convertir una imatge en text i converteix la "Imatges" en els gràfics ASCII. Per exemple, es coneix és un bon exemple Smiley Codificació símbol.

ASCII es pot utilitzar en crear el document HTML. En aquest cas, es pot introduir un conjunt de caràcters i un símbol que correspon a aquest codi apareixerà quan es veu la pàgina a la pantalla.

Es necessita ASCII per crear llocs multilingües, com a signes que no pertanyen a una taula nacional en particular, substituïts per codis ASCII.

algunes característiques

Per codificar la informació de text en format ASCII es va utilitzar originalment 7 bits (un va romandre buida), però en l'actualitat s'exerceix com 8 bits.

Les lletres, que es troben a les columnes estan per sobre i per sota, difereixen entre si només per un únic bit. Això redueix en gran mesura la complexitat de la prova.

aplicació ASCII en Microsoft Office

Si cal, aquest tipus d'informació de codificació de text es pot utilitzar en els editors de text de Microsoft, com el Bloc de notes i Office Word. No obstant això, en escriure en aquest cas, no podrà utilitzar algunes funcions. Per exemple, vostè no serà capaç de dur a terme audaç com el caràcter ASCII només conserva el significat de la informació, fent cas omís de la seva forma global i la forma.

estandardització

L'organització va adoptar ISO ISO estàndard 8859. Aquest grup defineix la codificació de vuit bits per a diferents grups lingüístics. En particular, la norma ISO 8859-1 - és l'ASCII estès, que és una taula dels Estats Units i Europa Occidental. Un ISO 8859-5 - és la taula que s'utilitza per a l'alfabet ciríl·lic, incloent l'idioma rus.

Per raons històriques a la norma ISO 8859-5 s'utilitza durant un curt temps.

Per a la llengua russa en el moment de codificació en realitat utilitzat:

  • CP866 (pàgina de codis 866), o DOS, que sovint es diu codificació alternativa GOST. Va ser utilitzat de forma activa fins a mitjans dels 90-s del segle passat. De moment, gairebé mai s'utilitza.
  • KOI-8. Codificació es va desenvolupar al 1970-80s, i de moment es tracta d'una norma comuna per als missatges de correu electrònic a RuNet. És àmpliament utilitzat en la família del sistema operatiu Unix, incloent Linux. "Rus" versió de KOI-8, anomenat KOI-8E. A més, existeixen versions per a altres idiomes ciríl·lics, com Ucraïna.
  • Pàgina de codis 1251 (CP 1251, Windows - 1251). Desenvolupat per Microsoft per proporcionar suport per l'idioma rus en l'entorn Windows.

El principal avantatge de CP866 primer estàndard era preservar caràcters pseudo-gràfic en les mateixes posicions que en l'ASCII estès. Això li permet executar text sense modificacions del programa, la producció estrangera, com el famós comandant Norton. En aquest punt CP866 s'utilitza per a programes dissenyats per a Windows, que operen en vista de text a pantalla completa o en caixes de text, fins i tot en FAR Manager.

els textos escrits a l'ordinador CP866 codificació, últimament són bastant rars, però s'usa per a noms d'arxiu en rus "Vindous".

"Unicode"

De moment, la més estesa és aquesta codificació. Codis "Unicode" al camp. El primer (de 0000 a U + U + 007F) inclou un conjunt de caràcters ASCII amb codis. Seguit dels caràcters de camp de diferents literatura nacional, així com puntuació i símbols tècnics. A més, part del codi "Unicode" es reserva en cas de la necessitat d'incloure nous personatges en el futur.

Ara se sap que en ASCII de cada caràcter es representa com una combinació de 8 zeros i uns. Laic, aquesta informació pot semblar innecessari i poc interessant, però no li agradaria saber el que està passant "al cervell" de l'equip ?!

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ca.birmiss.com. Theme powered by WordPress.