Web-мастер: курс молодого бойца

Удалить корявки

 Страницы: 1 | 2
 

 Добавлено 2009-06-15 15:26:30
evgenijj
Модератор




Сообщений: 1371
Зарегистрирован: 09.11.2007

Цитировать
murich пишет:
Ато уже третьи сутки гуглю и не удается найти таблицу код-- символ
http://www.unicode.org/charts/PDF/U0400.pdf
Цитата
UTF-8 — кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста. Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байтов (реально только до 4 байт, поскольку использование кодов больше 2**21 не планируется), в которых первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx. Проще говоря, в формате UTF-8 символы латинского алфавита, знаки препинания и управляющие символы ASCII записываются кодами US-ASCII, a все остальные символы кодируются при помощи нескольких октетов со старшим битом 1.
Символы UTF-8 получаются из Unicode следующим образом:
Unicode                     двоичный                                UTF-8
0x00000000 — 0x0000007F     00000000 00000000 00000000 0zzzzzzz     0zzzzzzz
0x00000080 — 0x000007FF     00000000 00000000 00000yyy yyzzzzzz     110yyyyy 10zzzzzz
0x00000800 — 0x0000FFFF     00000000 00000000 xxxxyyyy yyzzzzzz     1110xxxx 10yyyyyy 10zzzzzz
0x00010000 — 0x001FFFFF     00000000 000wwwxx xxxxyyyy yyzzzzzz     11110www 10xxxxxx 10yyyyyy 10zzzzzz
А вот как передать это функции preg_replace() - х.з.


Денежные купюры пронумерованы для того, чтобы когда-нибудь я мог сложить их все одну к одной, по порядку.
Наверх  Посмотреть профиль   Сайт автора  
 Страницы: 1 | 2
 
Быстрый ответ
 
Цвет шрифта: Закрыть все теги
Сообщение
Защитный код