XML документи могат да съдържат символи в различни международни кодови таблици.
За да се избегнат грешки, трябва да се определи кои кодиране на знаци, използвани в документа за XML, или да запишете файла в универсален UTF-8 кодиране.
кодиране на символите
Кодиране на символи определя уникален двоичен код за различни символи, използвани в документа.
В компютърни термини за кодиране на знаци също се нарича набор от символи, символично оформлението, код набор и код на страницата.
Unicode - индустриален стандарт за кодиране на знаци от текстов документ. Той определя (почти) всички възможни международни символи за имена и телефонни номера.
Unicode има две разновидности: UTF-8 и UTF-16.
Unicode UTF = формат реализация (Анг. Unicode Transformation Format).
UTF-8 използва един байт (8 бита) за представяне на приетите символи и двете (или три) за всички останали битови символи.
UTF-16 използва два байта (16 бита) за повечето герои и три байта за останалото.
UTF-8 - Web Standard
UTF-8 - характер стандартно кодиране в интернет.
Кодирането на документа за XML
Първият ред в документ, наречен XML пролог:
Prologue е по избор и обикновено съдържа номера на XML версия.
В допълнение, тя може да съдържа информация за кодировката на документа за XML. Следваща пролог определя UTF-8 кодиране:
XML стандартизация установява, че всички XML приложения трябва да разберат, кодировки UTF-8 и UTF-16.
UTF-8 е кодировка по подразбиране за XML документи без кодиране на информация.
Освен това, повечето XML приложения, системи, работят с кодировки като ISO-8859-1, Windows-1252, и ASCII.
XML грешка
Много често, XML документи са създадени на същия компютър, сървърът се разтоварват от друга страна, и в браузъра показва на чужд компютър.
Ако кодирането е правилно интерпретирани от трите компютри, браузърът показва безсмислен набор от знаци или дори съобщение за грешка.
Най-добрият избор в този случай е да се използва UTF-8 кодиране. UTF-8 ви дава възможност да се покаже на практика всички международни герои, и в допълнение, се счита, кодировка по подразбиране, ако не укажете различно кодиране.
заключение
Когато се напише XML документ:
Свързани статии