ПредишенСледващото

силен старт

Към днешна дата, ASCII код е представен като първите 128 стойности (включително номера и пунктуация) от английската азбука, представени в определен ред.

кодиране на текста

Въпреки това, дори един байт позволява кодираща 2 пъти по-високи от стойностите, т.е. не 128, колкото 256 различни стойности. Ето защо, достатъчно бързо, за да замени основния ASCII започнаха да се появяват по-разширени версии на този известен и популярен и до днес кодиране, в която кодирани символи от азбуки, а следователно и на текста на различни езици, включително руски.

Extended ASCII за Русия

Към днешна дата, за руският народ са приоритет yavlyayutsyakodirovka windows-1251 и Unicode и UTF 8. което е настъпило от ASCII.

Всъщност, някой може да има много справедлив въпрос: "Защо имаме нужда от тези текстове кодиране?"
Струва си да припомним, че компютърът - това е само една машина, която трябва да действа в съответствие с инструкциите ясно. За да стане ясно какво да прави с всеки знак е писано, това се представя като набор от векторни форми, всеки набор от който се изпраща на правилното място, за да се появи на екрана или това наименование.

За формирането на векторни форми съответстват на шрифтовете, както и процеса на кодиране зависи от операционната система, както и се използва в своите програми. По този начин, всеки текст по своята същност - е набор от байтове, всяка от които е представена чрез кодиране на един napisannogosimvola. Програма, посветена на показване на печатна информация на екрана (тя може да бъде процесор браузър или дума), синтактичен анализ на кода, да намерите подходящо дисплей с неговия код в таблицата за кодиране, се превръща в желаната форма вектор и показва текстов файл.

Encoding CP866 и KOI8-R се използва широко, преди появата на графичен операционната система е придобило популярност по целия свят, - Windows. Сега най-популярната кодиране, поддържа руски, стана windows-1251.

кодиране на текста

Въпреки това, той не е единственият, който, така че производителите за руски шрифтове, използвани в софтуера от време на време дори още виждам трудностите, свързани с неправилното показване на символи и появата на така наречените безсмислици. Тези абсурдни герои са резултат от неправилно използване на кодиране маси, т.е. различни маси, използвани в кодиране и декодиране.

Същата ситуация се наблюдава и в сайтове, блогове и други ресурси, където има информация за руски и други чужди символи, различни от английски. Тази ситуация определено основната предпоставка за универсален формат ви позволява да се кодира текст на всеки език, дори и китайски, където героите много повече от 256.

Universal кодиране

Първата версия на универсално кодиране, разработена в рамките на Unicode Consortium, UTF 32. кодиране се използва за кодиране на 32 бита на всеки символ. Сега тя се реализира възможността за кодиране на огромен брой символи, но нямаше друг проблем -Most на европейските страни е броят на допълнителните символи са били напълно ненужни. Всъщност, документите, получени много тежки. Ето защо, за да замени UTF-32 влезе UTF 16. превърне в основа за всички знаци, използвани в нашата страна и извън нея.

кодиране на текста

Но все пак имаше много недоволни. Например, тези, които говори само на английски език, тъй като преходът от ASCII да UTF16 документите им все още се увеличават по размер, и значително, почти 2 пъти.
Резултатът е кодиране с променлива дължина е UTF 8. възможно да не се увеличава теглото на текста.

Krakozyabry и методи за справяне с тях

Като цяло, кодирането е обозначено на страницата, на която информацията се генерира съобщение. В резултат на това в началото на документа формира един вид етикет, който се съхранява в възходящ или низходящ ред записани кодове UTF16 характер.

Ако нещо е публикувано в UTF-8. тогава няма маркер В началото, тъй като самата възможност за записване на код характер в обратен ред в тази кодиране отсъства.

Друг полезен съвет за борба krakozyabrami - регистрирай се в заглавната част на всяка страница на код информация за правилното кодиране на текст и да е локален хост или на сървъра, не е объркване.

Свързани статии:

Свързани статии

Подкрепете проекта - споделете линка, благодаря!