ПредишенСледващото

кодиране на символите

национално кодиране

дефинира

Съвременните компютри се съхранява цялата информация, като двоични байта, т.е.. Д. 8-битови блокове може да бъде всяка стойност от 0 до 255. За да се съхрани числен паметта на компютъра, и текстова информация, ние трябва да се дефинира какво байт или байта Тя ще се кодира всеки знак, който може да се появи в нашия текст. Тази кореспонденция между символи и кодиране на байта се нарича кодиращи символи (набор от символи). Лесно е да се разбере, че от всеки кодиране е предназначена за определен човешки език (по-точно, за определен скрипт), и второ, че тези езикови кодирания могат да мислят на изобилието. Знаейки, човешката природа, не е трудно да се отгатне, и че те ще излезе с много повече, отколкото трябва. Разбира се, че това се е случило: най-напредналите в крак преобразуване функция библиотека ICU (International Компоненти за Unicode), IBM поддържа повече от 170 различни кодировки.

кодиране Латинска

Нека разгледаме кодировката на тези скриптове, които често се изправя пред руски разработчик, т. Е. кирилица и латиница,. За Латинска днес използва два основния кодиране: ASCII и EBCDIC. ASCII (American Standard Code за информационен обмен) - е седем битова кодова таблица (символни кодове 00 - 7F или 0-127 знака след десетичната), която се превърна в стандарт за малки и средни компютри и затова стандарт за уеб. Тя байта с шестнадесетичен код 00 - 1F и 7F се използват за кодиране на контрола (без дисплей) символи, а останалите герои са кодирани, както следва:

лекция 06

Encoding EBCDIC (Extended двоичните Decimal Interchange код) - Този осем битово кодиране (символни кодове 00 - ОФ или 0-255 десетични), приета от всички компютри на IBM, но PC. Човек не би го споменавам, но и за развитието на XML като основен транспортен формат на данни в мрежата, ще бъде все по-често се сблъскват с XML-файлове, генерирани на големи машини. Тук байт код 00 - 3F контрол кодиране герои, а останалата част се използват, както следва:

лекция 06

кирилица кодировки

Кодиране на стоките "на не-латински" азбучни писмени системи са подредени по следния начин. Те са кодирани осем-битова маса (1 байт = 1 символ), т.е. номера 00 - .. FF (0-255 десетични), така че долната половина на кодовата книга (кодове 00 - 7F или 0-127 знака след десетичната) е ASCII, и по-възрастният половината (код 80 - FF или 128-255 десетични) се състои от национални буквени знаци, т.е., руски букви в руската кодова турски на турски и т.н. Такава организация национален кодови таблици позволява да се покаже както и процеса на букви, цифри, и .... пунктуация на всеки компютър, независимо от настройките на системата си. Точно така, по-специално, подредени и руски знакови набори, така че можем да разгледа по-подробно само им бъз половина.

Историята на руския характер - е пример за объркването, рядко дори и за нашия компютър реалност. Съветските организации по стандартизация да приемат посетители, производителите на компютри (Apple) и операционни системи (Microsoft) ги игнорират заедно и въвели свои собствени кодове. В резултат на това ние сме получили в наследство от четири различни гости, две кодировки от Microsoft (DOS и Windows) и кодиране на Apple за Mac-ове (всички, разбира се, несъвместими един с друг). Тези, които се интересуват от повече информация може да се отнася към страницата на кирилица, супа.

За щастие, днес не е необходимо да се опише подробно всички тези кодировки, защото в RuNet оцелели само две от тях. Първият - KOI8-R (KOI средства за обработка на използване на кодове и информация, P отличава руската кодова таблица от украински, KOI8-U). KOI8-P е включен Andrei Chernov на Relcom като RFC 1489 и е както следва:

лекция 06

KOI8-R е де факто стандарт за всички уеб услуги, с изключение на WWW. По-специално, всички услуги за електронна поща и новини Runet работа в тази кодиране. Що се отнася до интернет, положението е по-сложно. Фактът, че повече от 90% от клиентските компютри в мрежата, който работи на различни версии на Windows. Windows използва собствен кодиране на руски букви, което обикновено се нарича редица Windows-1251 или CP1251 код на страницата:

лекция 06

Свързани статии

Подкрепете проекта - споделете линка, благодаря!