Смислен и азбучен подход към измерването на информацията

Развитието на компютърните технологии в новата информационна ера повдига много допълнителни въпроси, открива нови възможности и знания. Но заедно с това има много дилеми, които трябва да бъдат решени. Така например, когато изучаваме компютърни технологии, е важно да разберем как се обработват, запомнят и прехвърлят файлове, какво е кодирането на данните и в какъв формат се измерва информацията. Но основният въпрос на дискусия е въпросът какви са основните подходи за измерване на информацията. Примери и обяснения на всеки аспект ще бъдат описани подробно в тази статия.

съдържание

Информация в областта на компютърните науки
Кодиране на информация от електронен компютър
Изчислителни системи в компютърното поле
Азбучен подход към измерването на информация: същност, единици
Равнопоставеност на символите в текстов файл
Различна вероятност за появяване на символи в текста
Измервателна информация: тънкостите на аспекта на съдържанието
Събития, срещани с еднаква вероятност
Пример за изчисление на събитие за еквидируем достъп
Измерване на информацията, като се вземат предвид различните вероятности за възникване на събитие
Разлики между азбучните и информативните подходи към информационното измерение
данни

Информация в областта на компютърните науки

За да започнете да разбирате информационните подходи за съхранение на данни, първо е необходимо да разберете коя информация представлява в компютърната сфера и какво показва. В края на краищата, ако вземем компютърната наука като наука, нейният основен обект на изследване е информацията. Самата дума от латински произход и в превод на нашия език означава "познаване", "обяснение", "смесване". Всяка наука използва различни определения на това понятие. В областта на компютрите това е цялата информация за различните явления и обекти, които ни заобикалят, което намалява мярката за несигурност и степента на невежеството ни. Но, за да се съхраняват всички файлове, данни и символи в електронен компютър, е необходимо да се знае алгоритъмът за превод в двоична форма и съществуващите единици за измерване на количеството данни. Азбучният подход за измерване на информация показва как точно компютърната машина преобразува символите в двоичен код на нули и такива.

Кодиране на информация от електронен компютър

Компютърната технология може да разпознава, обработва, съхранява и предава само информационни данни в двоичен код. Но ако това е аудио запис, текст, видео, графично изображение, как машината може да се различава типове данни конвертирате в двоичен тип? И как се съхраняват в паметта в тази форма? На тези въпроси може да се отговори, ако знаете азбучния подход за определяне на количеството информация, аспекта на съдържанието и техническата същност на кодирането.

азбучен подход за измерване на информацията в мерна единица

Кодираща информация е да кодирате героите в двоичен код, състоящ се от знаците "0" и "1". Технически е лесно да се организира. Сигналът е, ако има такъв, нулата показва обратното. Някои се чудят защо компютърът не може, както и човешкият мозък, да държи сложни номера, защото те са по-малки по размер. Но електронното изчисляване е по-лесно да се работи с огромен двоичен код, вместо да се съхраняват сложни номера в паметта ви.

Изчислителни системи в компютърното поле

Използвахме броя от 1 до 10, добавихме, извадихме, умножихме и направихме различни операции по номера. Компютърът може да работи само с две номера. Но го прави във фракции от милисекунди. Как компютърната машина кодира и декодира символите? Това е доста прост алгоритъм, който може да се разглежда като пример. По азбучен подход за измерване на информацията, единиците за измерване на данни, ще разгледаме малко по-късно, след като същността на кодирането и декодирането на данните стане ясна.

Има много компютърни програми, които визуално превеждат системите на смятането или текстовия низ двоичен код и обратно.

азбучен подход за измерване на информационната информация

Ние ще извършим изчисленията ръчно. Кодирането на информацията се прави с обикновен разделител с 2. Така че, да речем, имаме десетично число 217. Трябва да го превърнем в двоичен код. За да направите това, го разделете на числото 2, докато останалата част е нула или една.

217/2 = 108 с остатък от 1. Отделно, написваме останките и те ще създадат нашия окончателен отговор.
108/2 = 54. Тук остатъкът е числото 0, тъй като 108 е напълно разделено. Не забравяйте да се маркирате с остатъците. В крайна сметка, ако загубите поне един номер, първоначалният номер ще бъде различен.
54/2 = 27, остатъкът е 0.
27/2 = 13, напишете 1 към останалата част. Нашите номера от останалите създават двоичен код, който трябва да се чете в обратен ред.
13/2 = 6. Тук единицата е в останалата част, пишем я.
6/2 = 3 с остатък от 0. В крайния отговор цифрите трябва да бъдат повече от всички действия, които сте извършили.
3/2 = 1 с останалата част 1. Записваме остатъка и числото 1, което е окончателното разделяне.

Ако форматирате отговора, като започнете с номера в първото действие, резултатът е 10011011, но това е неправилно. Двоическото число трябва да бъде пренаписано в обратен ред. Ето крайния резултат от превеждането на номера: 11011001. Един смислен и азбучен подход към измерването на информацията използва данни от точно този формат за съхранение и предаване. Двоичният код се записва в кодовата таблица и се съхранява там, докато не трябва да се показва на екрана на монитора. След това информацията се превежда в познатата форма, наречена декодиране.

подходи за измерване на информацията

Картината ясно показва алгоритъма за превод от двоичен на десетичен. Тя се осъществява чрез проста формула. Първата цифра на кода се умножава по 2 до мощността от 0, добавяме към него следващата цифра, умножена по 2 в по-голяма степен и т.н. В резултат на това, както можете да видите от картинката, получаваме същия номер като оригиналния при кодирането.

Азбучен подход към измерването на информация: същност, единици

За да измерите количеството данни в текстова последователност от знаци, трябва да използвате съществуващия подход. Съдържанието на текста не е важно тук, основното е количествената корелация на знаците. Поради този аспект се изчислява стойността на текстовото съобщение, кодирано на компютъра. В съответствие с този подход количествената стойност на текста е пропорционална на броя въведени знаци от клавиатурата. Благодарение на това метод на измерване Обемът на информацията често се нарича обемен. Символите могат да бъдат твърде различни по отношение на величината. Ясно е, че такива числа като 0 и 1 носят 1 бит информация и букви, препинателни знаци, пространство - друго тегло. Можете да разгледате таблицата ASCII, за да разберете бинарния код на даден знак. За да изчислите необходимия обем на текста, трябва да добавите теглото на всички знаци - съставните части на целия текст. Това е азбучен подход за определяне на количеството информация.

азбучен подход за измерване на количеството информация

В областта на компютърната наука има много термини, които се използват все по-често в ежедневието. Така че азбуката в компютърната наука означава съвкупност от всички символи, включително скоби, интервал, пунктуационни знаци, кирилица, латински букви, които не са нищо повече от текстов компонент. Тук има две определения, чрез които ще се изчислява това количество.

1. Поради първото определение е възможно да се изчисли появата на символи в текстово съобщение, когато тяхната вероятност за възникване е напълно различна. Така че, можем да кажем, че някои писма в руски думи се появяват много рядко, например "ъ" или "ё".

2. Но в някои случаи е по-целесъобразно да се изчисли количеството, от което се нуждаем, чрез въвеждане на еквивалентния външен вид на всеки символ. И тогава ще се използва друга формула за изчисление.

Това е азбучен подход за измерване на информацията.

азбучен подход за измерване на информацията

Равнопоставеност на символите в текстов файл

За да се обясни това определение, трябва да се приеме, че всички знаци в текста или съобщението се показват със същата честота. За да изчислите колко памет те заемат в компютъра, трябва да се впуснете в теорията на вероятността и простите логически заключения.

Да приемем, че текстът се показва на екрана на монитора. Пред нас е задачата да изчислим колко памет на компютъра е нужна. Нека текстът да съдържа 100 знака. Оказва се, че вероятността за появата на една буква, символ или знак ще бъде една стотна част от общия обем. Ако прочетете книга за теорията на вероятността, можете да намерите такава проста формула, която точно ще определи числената стойност на шанса за появата на определен знак във всяка позиция на текста.

Вероятно доказателството за формули и теореми няма да е интересно за всеки, поради което, като се вземат предвид формулите на известни учени, се получава изчислен израз:

i = log₂(1 / р) = log₂N (бит) - 2^аз= N,

където аз - това е стойността, която трябва да се научим, стр - цифрова стойност на възможността за знак в позициите на текстови, N, в повечето случаи, равни на две, защото машината компютър кодира данните в двоичен код, състоящ се от две променливи.

Амбатизираният обемен подход за измерване на информацията предполага, че теглото на един символен знак е равно на 1 бит - минималната единица за измерване. По формулата можете да определите какво е равно на байт, килобайт, мегабайт и др.

Различна вероятност за появяване на символи в текста

Ако приемем, че знаците се появяват с различни честоти (съответно и в която и да е позиция на текста тяхната вероятност за възникване е различна), тогава можем да кажем, че тяхната тежест на информация също е различна. Необходимо е да се изчисли измерването на информацията чрез друга формула. Азбучният подход на темите е универсален, което предполага еднаква и различна възможност за честотата на появата на знака в текста. Няма да се докоснем до сложната формула за изчисляване на това количество, като се има предвид различната вероятност за възникване на символа. Необходимо е да разберем, че такива букви като "ъ", "х", "ф", "ч", в руски думи са много по-редки. Поради това е необходимо да се обмисли честотата на появата според друга формула. След като направиха някои изчисления, учените стигнаха до заключението, че информационната тежест на рядко срещаните символи е много по-голяма от теглото на буквите, които често се срещат. За да изчислите размера на текста, трябва да имате предвид размера на повторение на всеки знак и теглото му, както и размера на азбуката.

Измервателна информация: тънкостите на аспекта на съдържанието

Смислен и азбучен подход към измерването на информацията

Можете да пренебрегвате азбучния подход за измерване на информацията. Информатика предлага още един аспект на измерването на данните - смислен. Тук се решава малко по-различен проблем. Да предположим, че човек, който седи на компютър, получава информация за явление или някакъв обект. Преди всичко е ясно, че той не знае нищо, така че има определен брой възможни или очаквани варианти. След като прочетете съобщението, несигурността изчезва, оставяйки една опция, чиято стойност трябва да бъде изчислена. Обръщаме се към спомагателната формула. Стойността ще бъде изчислена в минималната единица - битове. Подобно на азбучния подход за измерване на количеството информация, правилната формула ще бъде избрана, като се вземат предвид 2 възможни ситуации: различна и еднаква вероятност за възникване на събития.

Събития, срещани с еднаква вероятност

Както в случая, когато се прилага обективен азбучен подход към измерването на информацията, търсената формула със смислен подход се изчислява, като се вземе предвид вече известната закономерност, която учените Хартли произвеждат:

2^аз= N,

където i е величината на събитието, което трябва да намерим, и N е броят на събитията, срещани с честотата на еквипродуктивността. Стойността i се разглежда в минималната единица изчисление - битове. Може да се изрази и по отношение на логаритъма.

Пример за изчисление на събитие за еквидируем достъп

Да приемем, че има 64 пелерини на табела, в една от които се крие изненада вместо месо. Необходимо е да се изчисли колко информация съдържа събитието, когато то беше извадено с изненада, т.е. за измерване на информацията. Азбучният подход е толкова прост, колкото и обективният. В два случая същата формула би била използвана за изчисляване на количеството информационни материали. Заместваме добре известната формула за количество: 2^аз= 64 = 2⁶. Резултат: i = 6 бита.

подхода за измерване на обема по азбучен ред

Измерване на информацията, като се вземат предвид различните вероятности за възникване на събитие

Да предположим, че имаме събитие с вероятността за възникване на p. Ще приемем, че стойността i, изчислена в битове, е число, характеризиращо факта, че събитието е станало. Въз основа на това може да се твърди, че стойностите могат да бъдат изчислени съгласно съществуващата формула: 2^аз= 1 / p.

Разлики между азбучните и информативните подходи към информационното измерение

Тъй като подходът на обема се различава от съществения? В крайна сметка формулите за изчисляване на количествата информация са напълно еднакви. Разликата е, че азбучният аспект може да се използва, ако работите с текстове, докато съдържанието ви позволява да решавате всички проблеми на теорията на вероятностите, да изчислите размера на информацията за дадено събитие, като вземе предвид вероятния му вид.

данни

Азбучен подход за измерване на информацията по същия начин, както и смислен, дава възможност да се разбере кои единици данни се измерват и колко ще бъдат заети от текстови знаци или друга информация. Можем да превеждаме всички текстови и цифрови файлове, съобщения в компютърния код и обратно, като винаги знаем колко памет ще заемат в компютъра.

Споделяне в социалните мрежи:

сроден