DatorerInformationsteknik

Kodning av textinformation i datorn

Dator - en sofistikerad enhet med vilken du kan skapa, konvertera och lagra information. Däremot datorn inte fungerar mycket begripligt sätt för oss - grafik, text och numeriska data lagras som binära matriser nummer. I denna artikel kommer vi att titta på hur kodningen av informationstexten.

Vad för oss är texten i en dator - en sekvens av tecken. Varje symbol representerar en viss uppsättning nollor och ettor. Under symbolerna betydde inte bara stora och små bokstäver i det latinska alfabetet, men även skiljetecken, aritmetiska tecken, specialtecken, specialtecken och även utrymme.

Binär kodning av textinformation

Genom att trycka på en viss knapp på den interna styrenheten sänder en elektrisk signal som omvandlas till en binär kod. Koden matchas med en viss symbol, som visas på skärmen. För vidarebefordran till det latinska alfabetet i ett digitalt format ASCII kodning internationella systemet skapades. Det kräver en bitgrupp för inspelning en symbol består således av åtta symbolsekvens av nollor och ettor. Tagningsintervallet - alltifrån 00000000 till 11111111, tillåter dvs kodning av textinformation med hjälp av detta system oss att representera 256 tecken. I de flesta fall är detta tillräckligt.

ASCII är uppdelad i två delar. De första 127 tecken (från 00 miljoner till 01.111.111) är internationella och finns särskilda symboler och bokstäver i det engelska alfabetet. Den andra delen - förlängningen (10.000.000 till 11.111.111) - är avsedd att representera den nationella alfabetet, skrivandet av som skiljer sig från det latinska.

Kodning textinformation i ASCII bygger på principen att öka sekvens, det vill säga ju större sekvens antal bokstäver, desto större är värdet av dess ASCII-kod. Siffror och ryska delen av tabellen bygger på samma princip.

Men i världen finns det flera typer av kodning för kyrilliska bokstäver. Den vanligaste - är KOI-8 (åtta-bitars kodning som har använts på 70-talet i den första ruifitsirovannyh Unix operativsystem), ISO 8859-5 (utvecklad av Internationella standardiserings Bureau), CP 1251 (som kodar textdata som används i moderna operativsystem Windows), såväl som 2-byte kodningen av Unicode, som kan användas för att införa 65.536 tecken. En sådan mängd kodningar grund av det faktum att de har utvecklats vid olika tidpunkter för olika operativsystem och olika överväganden. På grund av detta, har ofta svårigheter vid överföring text från ett medium till ett annat - från en obalans som kodar för användaren kommer att se en uppsättning förvirrande ikoner. Hur kan jag fixa den här situationen? I Word, till exempel när ett dokument öppnas, ett meddelande om problem med textdisplay och erbjuder flera alternativ för omkodning.

Således, kodning och bearbetning av textinformation i datorns tarmar - är processen svår och tidskrävande organiserad. Alla symboler i alla alfabetet är endast en viss sekvens av siffror i binärt system, en cell - det är ett byte av information.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sv.birmiss.com. Theme powered by WordPress.