Показать сообщение отдельно
Старый 19.05.2006, 15:11   #10
kit
Новенький
 
Регистрация: 08.05.2006
Сообщений: 5
По умолчанию

/**
* Apache 2.0.49
* PHP 4.3.4
* Mysql 4.0.18
* Typo3 4.0
*/
Копал сам, вот что нашел.
Проблема имеет место при кодировке UTF-8.
В файле typo3/sysext/cms/tslib/class.tslib_content.php, формируется текст обработчика события onsubmit() формы так (строка 2027):
Код:
$validateForm=' onsubmit="return validateForm(\''.$formname.'\',\''.implode(',',$fieldlist).'\','.t3lib_div::quoteJSvalue($conf['goodMess']).','.t3lib_div::quoteJSvalue($conf['badMess']).','.t3lib_div::quoteJSvalue($conf['emailMess']).')"';
Интересующие нас строки (метки полей) лежат в массиве $fieldlist, закодированные функцей rawurlencode(), которая кодирует utf8 строки побайтово и в итоге мы получаем вместо строки "Ваш e-mail:" строку "%D0%92%D0%B0%D1%88%20e-mail%3A", т.е. каждая русская буква становится двумя символами "В" -> "%D0%92".
Едем дальше. JavaScript функция validateForm(theFormname,theFieldlist,goodMess,bad Mess,emailMess) в файле t3lib/jsfunc.validateform.js принимает эту строку в качестве параметра theFieldlist, и декодирует ее функцией unescape().
Цитата:
Сообщение от Справочник по javascript
unescape(string) возвращает декодированную версию URL-КОДИРОВАННОЙ строки, прошедший как параметр функции. Кодирование URL преобразовывает неалфавитно-цифровые символы в шестнадцатеричные значения (типа %20 для пробела). Функции escape и unescape неправильно работают с не- ASCII символами.
Функции escape и unescape не используют Unicode, как указано в спецификации ECMA. Вместо этого они используют указания Internet Engineering Task Force (IETF) для заменяющих/escaping символов. В URI символы используют US-ASCII-символы (набор символов ISO-Latin-1). URI это последовательность символов из базового латинского алфавита, цифры и несколько специальных символов (например, / и @). Еscape-последовательности не поддерживают как Unicode-значения \uXXXX или %uXXXX, как специфицировано ECMA, но поддерживают %XX, где XX это 16-ричное число из двух цифр (например, %7E). В URI представлены восьмеричными числами, как 8-битные байты. Чтобы escape и unescape могли работать с поддерживаемыми Web-сервером URL и URI, JavaScript не использует Unicode для этих функций.

* escape возвращает 16-ричную кодировку специфицированной строки из набора символов ISO-Latin-1.
* unescape возвращает ASCII-строку, последовательность символов из набора ISO-Latin-1.

Unicode-специфичные escape-последовательности %uXXXX не поддерживаются.
А теперь внимание вопрос
Какая функция javascript раскодирует urlencoded строку и примет во внимание utf-8? Или может я не в том направлении копать начал?

Последний раз редактировалось kit; 19.05.2006 в 15:22
kit вне форума   Ответить с цитированием