ASCII (американски стандартен код за обмен на информация) - основно текстово кодиране на латинската азбука
Според Международния съюз по далекосъобщения през 2016 г. Интернет редовно се радва на три и половина милиарда души. Повечето от тях дори не мисля за това всички съобщения, изпратени до тях чрез компютър или мобилни джаджи, както и текстове, които се показват на мониторите от всякакъв вид, в действителност, е комбинация от 0 и 1. Това се нарича кодираното представяне на информацията. Тя осигурява и значително улеснява изпълнението на съхранението, обработката и предаването му. През 1963 г. е разработено американското кодиране на ASCII, което е предмет на тази статия.
съдържание
Представяне на информация в компютъра
От гледна точка на всеки електронен компютър текстът представлява съвкупност от отделни символи. Те включват не само букви, включително главни букви, но и препинателни знаци, числа. В допълнение, специални символи "=", "", "(и") се използват.
Комплектът от символи, които съставят текста, се нарича азбука и техният брой е мощта (означена като N). За да го определите, използвайте израз N = 2 ^ b, където b е броят на битовете или информационната маса на конкретен символ.
Доказано е, че азбуката с капацитет от 256 знака Ви позволява да представяте всички необходими символи.
Тъй като 256 е осмата мощност от две, тежестта на всеки символ е 8 бита.
Единица мярка от 8 бита се нарича 1 байт, така че е обичайно да се каже, че двоичен код Всеки символ в текста, съхраняван на компютъра, заема един байт памет.
Как се извършва кодирането
Всички текстове се въвеждат в паметта на персоналния компютър чрез клавишите на клавиатурата, върху които са написани номера, букви, препинателни знаци и други символи. В RAM те се предават в двоичен код, т.е. всеки символ съответства на обичайния човешки десетичен код, от 0 до 255, който съответства на двоичен код - от 00000000 до 11111111.
Кодирането на байтовите символи позволява на процесора да извършва текстообработка за достъп до всеки знак отделно. В същото време 256 знака са достатъчни, за да представят информация за всеки знак.
Кодиране на символи ASCII
Това абревиатура на английски език е американският стандартен код за обмен на информация.
Още в зората на компютъризацията стана очевидно, че можете да излезете с голямо разнообразие от начини за кодиране на информацията. Въпреки това, за да се прехвърли информация от един компютър на друг, беше необходимо да се разработи единен стандарт. Така че, през 1963 г. в САЩ имаше ASCII кодираща таблица. В него всеки символ на компютърната азбука се определя като сериен номер в двоичното представяне. Първоначално кодирането ASCII се използва само в Съединените щати и след това се превръща в международен стандарт за персоналния компютър.
Съдържание на таблицата
ASCII кодовете са разделени на 2 части. Международният стандарт е само първата половина на тази таблица. Той включва символи с номера от 0 (кодирани като 00000000) до 127 (код 01111111).
Номер на последователността N | ASCII текстово кодиране | символ |
0 - 31 | 0000 0000 - 0001 1111 | Символите с N от 0 до 31 се наричат мениджъри. Тяхната функция е да "ръководи" процеса на извеждането на текст към монитор или печатащо устройство, като дава аудио сигнал и т.н. |
32 - 127 | 0010 0000 - 0111 1111 | Знаците с N от 32 до 127 (стандартната част на таблицата) са главни и малки букви от латинската азбука, 10 цифри, пунктуационни знаци, както и различни скоби, търговски и други символи. Символът 32 обозначава място. |
128-255 | 1000 0000 - 1111 1111 | Символите с N от 128 до 255 (алтернативна част от таблицата или кодовата страница) могат да имат различни варианти, всяка от които има свой номер. Кодовата страница се използва за уточняване на националните азбуки, които са различни от латинските. По-специално, с негова помощ ASCII е кодирана за руски символи. |
В таблицата за кодиране, главни и малки малки букви отидете една след друга в азбучен ред, а числата - в нарастващи стойности. Този принцип се запазва и за руската азбука.
Контролни знаци
Таблицата за кодиране ASCII първоначално е създадена, за да получава и предава информация на устройство, което не е използвано дълго време, като телетип. В това отношение непартирането, използвано като команди за контролиране на това устройство, е включено в набора от знаци. Подобни команди бяха използвани в такива методи за преформатиране на съобщения като Morse code и др.
Най-често срещаният символ "теле тип" е NUL (00, "нула"). Той все още се използва в повечето програмни езици, обозначаващ края на реда.
Когато се използва ASCII кодирането
Американският стандартен код е необходим не само за въвеждане на текстова информация от клавиатурата. Използва се и в графиката. По-специално, в програмата ASCII Art Maker изображенията с различни разширения представляват редица ASCII знакови символи.
Подобни продукти са от два типа: изпълнение на функцията на графичните редактори чрез конвертиране на изображения в текст и конвертиране на "чертежи" в графики ASCII. Например, добре позната усмивка е ярък пример за кодиращ символ.
ASCII може да се използва и при създаване на HTML документ. В този случай можете да въведете определен набор от знаци и когато прегледате страницата, на екрана се появява символ, който съответства на този код.
ASCII също се изисква за създаване на многоезични сайтове, тъй като знаците, които не са част от конкретна национална таблица, се заменят с ASCII кодове.
Някои функции
За кодиране на текстова информация в ASCII кодиране първоначално се използват 7 бита (едната е празна), но днес тя работи като 8-битова.
Буквите, намиращи се в горните и долните колони, се различават един от друг само с един бит. Това значително намалява сложността на проверката.
Използване на ASCII в Microsoft Office
Ако е необходимо, този вид кодиране на текстова информация може да се използва в текстови редактори на Microsoft, като Notepad и Office Word. Когато пишете, обаче, в този случай ще бъде невъзможно да използвате някои функции. Например, няма да можете да направите селекция с удебелен шрифт, тъй като кодирането ASCII запазва само значението на информацията, като игнорира нейния общ външен вид и форма.
стандартизация
ISO прие стандарт ISO 8859. Тази група дефинира осем-битови кодировки за различни езикови групи. По-специално, ISO 8859-1 е разширена ASCII, която е таблица за Съединените щати и страните от Западна Европа. И ISO 8859-5 е таблица, използвана за кирилица, включително руски език.
Поради редица исторически причини стандартът ISO 8859-5 не беше използван много дълго.
За руския език в момента кодирането наистина се използва:
- CP866 (кода на страницата 866) или DOS, който често се нарича алтернативно кодиране на GOST. Тя се използва активно до средата на 90-те години на миналия век. В момента почти не се използва.
- KOI-8. Кодирането е разработено през 1970-80, а в момента е стандартът за имейл съобщения в RuNet. Той се използва широко в операционната система на Unix семейството, включително Linux. "Руската" версия на KOI-8 се нарича KOI-8R. Освен това има версии за други кирилийски езици, например украински.
- Код страница 1251 (CP 1251, Windows - 1251). Разработена от Microsoft Corporation за осигуряване на поддръжка на руския език в среда на Windows.
Основното предимство на първия CP866 стандарт е запазването на псевдо-графични символи на същите позиции, както при Extended ASCII. Това позволи да се изпълняват непроменени текстови програми, чуждестранно производство, като например известния командващ Norton. В момента CP866 се използва за програми, разработени под Windows, които работят в режим на цял екран или текстови прозорци, включително FAR Manager.
Компютърните текстове, написани в кодирането CP866, наскоро бяха редки, но се използват за руски имена на файловете в "Vindous".
"Unicode"
В момента това кодиране е най-разпространеното. Кодовете на Unicode са разделени на региони. Първият (от U + 0000 до U + 007F) включва символите на ASCII комплекта с кодове. После следвайте зоните със знаци от различни национални сценарии, както и препинателни знаци и технически символи. Освен това част от кодовете на Unicode е запазена в случай, че е необходимо да се включат нови символи в бъдеще.
Сега знаете, че в ASCII кодирането всеки символ е представен като комбинация от 8 нули и такива. За неспециалистите тази информация може да изглежда ненужна и неудобна, но не искате да знаете какво се случва в "мозъците" на вашия компютър?
- Каква е семафорна азбука?
- Дешифриране на хеш: най-простите методи
- ASCII, символи: описание, кодова таблица и изгледи
- Начин за кодиране на информация чрез номера. Бинарно кодиране
- Гръцки букви. Имената на гръцките букви. Гръцка азбука
- Как да поставите знаци на клавиатурата. Допълнителни знаци на клавиатурата
- Символи на клавиатурата: как да комбинирате клавишите. Как да поставите ненужни символи на…
- Въведете иконата за градуси във всички приложения
- Как да напишете римски цифри на клавиатурата е най-лесният?
- Какво представлява кодирането и декодирането? Примери. Методи за кодиране и декодиране на…
- Каква е кодирането на информацията и нейната обработка?
- Защо двоичното кодиране е универсално? Методи на програмиране
- UTF-8 - кодиране на знаци
- Каква е силата на азбуката? Как да намерим силата на азбуката: формула
- Htaccess (кодиране): настройка, примери за използване
- Усмивките са японски знаци и текст. Японски усмивки на kaomoji
- Теория на информацията
- Какъв е кодът на Bodo? Описание на технологията
- Двоични кодове: рецензии, коментари, въпроси, отговори
- Кодиране на текстова информация на компютъра
- Как да направите необичаен надпис с красиви букви и символи