ПредишенСледващото

Материал за самообучение по темата Лекции 2

Кодиране на маса ASCII (ASCII - American Standard Code за информационен обмен - American Standard Code за информационен обмен).

Общо използване ASCII таблица за кодиране (Фигура 1) може да кодира 256 различни символи. Тази таблица е разделен на две части: главен (с кодове от О до 7Fh) и допълнителна (от 80h до FFh, където писмо з означава кода, принадлежащ към системата за шестнадесетичен).

За кодираща един символ от таблица целеви 8 бита (1 байт). При обработката на текстова информация един байт може да съдържа код характер - букви, цифри, препинателни знаци, действия и т.н. марки Всеки герой има своя код под формата на цяло число. В този случай, всички кодове се събират в специални таблици, наречени кодиране. С тяхна помощ, направен превръщането на код характер, в своята видима представителство на екрана. В резултат на това всеки текст в паметта на компютъра е представен като последователност от байтове от кодовете знаци.

Например, думата здравей! ще бъде кодиран, както следва (Таблица 1).

Фигура 1 показва символите включени в стандарта (на английски език) и разширен (руски) ASCII кодиране.

През първата половина на ASCII таблица е стандартизирана. Той съдържа управляващи кодове (от 00ч до 20ч и 77H). Тези кодове се отстраняват от масата, тъй като те не се прилагат за текстовите елементи. Тук се поставят знаци и математически знаци: 2lh -. 26h - , 28з - (, 2BH - + големи и малки букви :. 41з - А, 61h - а.

През втората половина на таблицата съдържа национални шрифтове, чертожни герои, от които могат да бъдат изградени на масата, специални математически символи. В долната част на таблицата за кодиране може да се обменя с помощта на подходящите драйвери - програми за подпомагане контрол. Тази техника позволява използването на множество шрифтове и шрифтове.

Всеки екран характер код трябва да покаже образа символ - не само цифров код и съответната му картина като всеки един от героите има своя собствена форма. Описание образуват всеки знак се съхранява в паметта на дисплея - характер генератор. Показване на дисплея символ IBM PC, например, с помощта на точки, които са символ матрица. Всеки пиксел в такава матрица е елемент на изображението и може да бъде ярка или тъмна. Тъмна точка е кодиран 0, ярък (светъл) - 1. Ако в матрицата представляват областта на тъмните пиксели отбележат точка, и светлина - звезда, можете да обрисуват форма характер графично.

Хората в различни страни използват символи за записване на думите на своя роден език е. В днешно време повечето приложения, включително системи за електронна поща и уеб браузъри, са чисто 8-битов, което означава, че може да покаже и правилно възприемат само 8-битови символи, в съответствие с ISO-8859-1 стандарт.

Има повече от 256 знака в света (ако вземем предвид кирилица, арабски, китайски, японски, корейски и тайландски) и има все повече и повече нови герои. И това създава следните пропуски за много потребители:

Не можете да използвате символи от различни кодировки в същия документ. Тъй като всеки текстов документ използва свой собствен набор от кодировки, тогава има големи трудности с автоматично разпознаване на текст.

Има нови герои (например евро), което води до ISO разработва нова ISO-8859-15 стандарт, който е много подобен на ISO-8859-1 стандарт. Разликата е, както следва: от старите стандартни символи за кодиране на ISO-8859-1 се отнасят до масата на старите валути са били премахнати, което не се използва в момента, за да се направи място за нововъзникващите знаци (като евро). В резултат на това, потребителите могат да лежат на дисковете са същите документи, но в различни кодировки. Решението на тези проблеми е приемането на международна група от кодировки, което се нарича универсално кодиране или Unicode.

Свързани статии

Подкрепете проекта - споделете линка, благодаря!