PDA

Просмотр полной версии : индексированый поиск с укр. языком


андрей
15.03.2005, 13:33
Здравствуйте, возможно я не по теме, но может быть кто-нибудь подскажет please?
Индексированый поиск после обработки class.indexer работает нормально, но есть одно но - не находит украинские слова содержащие \"\",\"\" вначале слова и слова с теми же буквами в конце слова. Все остальные слова находит нормально, включая слова, которые оканчиваются на \"\". Через поиск в phpMyAdmin находит все слова. Помогите, если кто с таким встречался!

андрей
17.03.2005, 01:46
И снова здравствуйте!
Похоже, индексированный поиск не находит только слова с \"\" вначале слова и в конце. С другими украинскими буквами (,) все благополучно ищет и находит!
Обычный поиск находит вообще все без проблем!
Перебрал кучу кодировок для MySQL (похоже, по умолчанию - koi8u_general_ci) и фронтенда.
Помогите, пожалуйста!

андрей
17.03.2005, 01:47
И снова здравствуйте!
Похоже, индексированный поиск не находит только слова с \"\" вначале слова и в конце. С другими украинскими буквами (,) все благополучно ищет и находит!
Обычный поиск находит вообще все без проблем!
Перебрал кучу кодировок для MySQL (похоже, по умолчанию - koi8u_general_ci) и фронтенда.
Помогите, пожалуйста!

андрей
19.03.2005, 13:58
Вобщем, всем спасибо!
Вместо укр. символа в class.indexer была прописана английская \"i\". indexer безбожно обрезал украинскую \"i\" в словах. Потратил кучу времени и перебрал весь class.indexer и все возможные кодировки, пока понял...

Michael Shigorin
20.08.2005, 02:36
Уууу... а патчик положите куда-нить, ну и надо бы это в bugs.typo3.org на TYPO3 Core Frontend (?) повесить.

Michael Shigorin
24.11.2005, 01:18
Так. Пока суть да дело.

По мотивам этого треда (http://66.249.93.104/search?q=cache:nkpBh-MExrgJ:www.typo3.ru/general%2BM587c1a2704d.html+indexed+search+site:ty po3.ru&hl=ru) и старой патченой копии 3.6.2 подновил/родил патчик (http://old.linux.kiev.ua/~mike/works/typo3/patches/class.indexer-rus.patch) (кодировка -- windows-1251, на случай если браузер начнёт умничать).

Там до сих пор latin1 прибито гвоздями, надо-таки block bug повесить -- такие преобразования обязательно надо выносить в языкозависимую часть!

PS: сам ещё не проверил, пытаюсь вспомнить, как аккуратно погрохать пережёванные indexed search новости... в смысле индексы.