PDA

Просмотр полной версии : Кодировка - появляются вопросы после манипуляции со строками


Ивано
14.11.2012, 18:31
Добрый день.

По умолчанию везде стоит (и на BE/FE и на БД) установлено utf-8.
В скрипте делаю вывод из базы данных.

while ($row = accoss)
{
$row[title]
}

Имена прекрасно выводятся и все в порядке.
Но как только пытаюсь производить манипуляцию с $row[title] - к примеру вырезать первую букву - substr - появляются вопросительные знаки вместо букв?

В чем может быть мое упущение?

Ивано
14.11.2012, 19:23
Как ни странно - проблему нашел

Вот из за этой строчки в коде <meta charset="utf-8">
Как только ее убираешь (пробовал сохранять html-документ на компьютер)- то все работает нормально...


Проблема только в том, как ее убрать?

Ивано
14.11.2012, 23:39
http://www.makannikov.ru/blog.php?id=9
http://forum.dklab.ru/viewtopic.php?p=176360
http://otvety.google.ru/otvety/thread?tid=62a1d65e0a4b18c5
http://www.typo3.ru/fileadmin/documentations/2009/Podderzhka_UTF-8.pdf

Решение проблемы:

1. Оказывается для строк в UTF-8 БД нужно использовать специальные функции, к примеру mb_strtolower.

Решение данной проблемы самым простым является:
Создание таблиц данных для контента в typo3 лучше в кодировке cp1251_general_ci, а также соответствующие полей контента (title, bodytext и других также в данной кодировке - cp1251_general_ci).

И все - день ушел ...

Используя mb_substr - остается мусор в строках - знаки вопроса?
Какой алгоритм для решения данной проблемы можно использовать?:confused:

Ивано
14.11.2012, 23:44
Так понимаю - что в typo3 есть что-то специально для работы с этим вопросом: согласно данным обсуждениям - http://lists.typo3.org/pipermail/typo3-dev/2011-January/042394.html - но как это использовать?:confused:

Ивано
15.11.2012, 00:16
Нашел решение данной проблемы следующим образом:

mb_internal_encoding('UTF-8');
$simbol_1 = substr( $row['title'] , 0, 4);
или
$simbol_1 = mb_substr( $row['title'] , 0, 1, 'UTF-8');