ПредишенСледващото

Има проблем: как да се бързо да се определи кодировката на знаците на текстов низ по отношение на UTF-8 Все по-често се налага да работят с низове в UNICODE.

По-долу е функция, за да се провери дали е необходимо преобразуване UNICODE кодиране (UTF-8) кодиране на WINDOWS (спечелим-1251)

Функцията дава доста точен отговор, въпреки че не се основава на преобразуване код на символа.

Накратко - описание detect_my_utf () функция.
  • конвертирате (низ в специален формат)
  • Ние изчисли дължината на реда за въвеждане
  • Ние даваме всички редове с главни букви
  • премахване на специфични кодове и 0,0 0,1
  • Ние изчисли дължината на новата линия
  • Ние се получи връзката с нова опаковка линия

Ако това съотношение е 1 или в близост до него, а след това има съмнение, че част от низ не е кодиран в UNICODE. Ако това съотношение е в границите на от 1.2 до 2.2 - тя може безопасно да кодира линия в WINDOWS кодираща победа-1251.

На изхода на функцията имаме 0 или 1, съответно, не UNICODE или UNICODE.

Примери на функцията:

Пример 4 Този алгоритъм се справя добре с различни вход низ като част от статистиката на услуги от търсачките.

PHP - език за програмиране, базиран на използването на скриптове. Този език се използва широко за създаване на разнообразни предния край и уеб приложения гърба в края. С подкрепата на неизпълнение на задълженията от повечето домакини, като една от водещите програмни езици за създаване на динамични, интерактивни уеб сайтове.

Подкрепете проекта - споделете линка, благодаря!