Russian TYPO3 community Форум больше не используется. Присоединяйтесь к каналу #community-ru в Slack for TYPO3 community  

Вернуться   Russian TYPO3 community > Обсуждение общих технических вопросов > Общие вопросы

Ответ
 
Опции темы Опции просмотра
Старый 25.10.2006, 19:22   #21
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

Это я понимаю. Нашел даже доку по этому поиску, буду разбираться.
Пока так получается, что я установил crawler, добавил для него свойства какие УРЛ создать, запустил, оно мне понаписывало ОК, что обошло эти УРЛы, но вот захожу в меню пункт Indexing или через Инфо - итог один - поиск не видит эти результаты.
Что касается Indexing Configuration , то я так понял это для автоматической индексации в определенное время. С краулером пока никак не связал.
Буду думать дальше. Жаль нигде нет пошаговой докментации тупо по поиску - там смотрите то, там это. А в конце документа о поиске нашел инфу по установкам и инстале экстеншена - цирк)_
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress
Tod вне форума   Ответить с цитированием
Старый 25.10.2006, 23:17   #22
Baltazarr
Продвинутый
 
Аватар для Baltazarr
 
Регистрация: 24.07.2006
Адрес: Russia, Izhevsk
Сообщений: 81
Отправить сообщение для Baltazarr с помощью ICQ
По умолчанию about Crawler

Цитата:
Сообщение от void
indexed_search индексирует только кэшированные страницы. А кэшируются страницы при их просмотре.
crawler обходит дерево страниц и, таким образом, заставляет страницы кэшироваться, а значит - индексироваться.
Хмм, вот это ксттаи очень интересно, я конечно тоже читал в доке как в идеале должен функционировать краулер и знаю что он должен обходить все дерево, однако у меня абсолютно ничего не обходит и в резалтах как было No entries напротив каждой подстранички так и осталось. А в таблицах индексов весь кэш лежит как положено и поиск работает идеально...
Baltazarr вне форума   Ответить с цитированием
Старый 26.10.2006, 09:40   #23
Дылгеров Ц.В.
Senior Member
 
Регистрация: 14.11.2005
Адрес: Улан-Удэ
Сообщений: 158
Отправить сообщение для Дылгеров Ц.В. с помощью ICQ
По умолчанию работает у то и другое

Цитата:
Сообщение от Tod
Это я понимаю. Нашел даже доку по этому поиску, буду разбираться.
Пока так получается, что я установил crawler, добавил для него свойства какие УРЛ создать, запустил, оно мне понаписывало ОК, что обошло эти УРЛы, но вот захожу в меню пункт Indexing или через Инфо - итог один - поиск не видит эти результаты.
Что касается Indexing Configuration , то я так понял это для автоматической индексации в определенное время. С краулером пока никак не связал.
Буду думать дальше. Жаль нигде нет пошаговой докментации тупо по поиску - там смотрите то, там это. А в конце документа о поиске нашел инфу по установкам и инстале экстеншена - цирк)_
работает и то и другое - запускаю скрипт из крона каждые 15 минут для индексации только главной страницы - она у меня генерируется около 15 секунд

насколько я понял надо в Инфо страницы в SiteCrawler выделить стоку Re-indexing - настроить для этой строки Sheduled - и Update - и потом запустить краулинг тут же одной этой страницы (для скорости настройки)

после этого проверить поиск там же - вверху Индексный поиск - Overview - эта страница

Последний раз редактировалось Дылгеров Ц.В.; 26.10.2006 в 09:43
Дылгеров Ц.В. вне форума   Ответить с цитированием
Старый 26.10.2006, 17:21   #24
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

В общем, вроде настроил все более-менее. ДОкументация рулит. Из таких особых моментов можно выделить, то что Indexed configuration нужно хранить обязательно в системной директории (где-то в доке вычитал, работает вроде), потом задаем для этой записи время и периодику индексирования, тип page tree. Далее запускаю краулер с параметрами что-то вроде:
Код:
tx_crawler.crawlerCfg.paramSets {
  test = contentId=[_TABLE:tt_content]
  test.procInstrFilter = tx_indexedsearch_reindex
	
  tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news; _PID:9]
  tt_news.procInstrFilter = tx_indexedsearch_reindex
  tt_news.cHash = 1
  tt_news.pidsOnly = 10
}
При этом для новостей генерируются УРЛы только на странице с единичным отображением новости - 10, и беруться записи из системной директории - 9.
Есть пару вопросов:
1. ЗАчем нужно tx_cachemgm_recache ? А то не совсем понял.
2. Системные директории тоже индексируются, но там создаются так называемые meta-entries, для которых я так понимаю нужно создать запись indexed configuration?
3. И САМОЕ ГЛАВНОЕ. Краулер и индексирование работает четко на всех страницах кроме одной - главной. Она, в принципе, не маленьках, то есть содержит больше всего инфы (пару блоков новостей, рсс, текстовые блоки), может там как-то по другому индексировать нужно? В общем, проблемка((
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress
Tod вне форума   Ответить с цитированием
Старый 26.10.2006, 19:43   #25
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

Третий вопрос оказывается возник по причине наличи на странице РСС ленты новостей (tw_rssfeeds). Почему-то не представляю как для нее краулер настроить, да и собвественно она видимо как-то сама мешает работе, так бы индексировались другие УРЛы, а этот нет... в моем же случае - целая странице не индексируется.
Возможно что-то посоветуете по этому поводу, так как скрывать элементы РСС, потом запускать краулер, опять открывать РСС - это извращение
Сделал даже эти элементы на другой странице, потом как бы создал копию (ссылку) элемента на нужную страницу, без внесения его в базу - нифига)) может через TS получится. не пробовал...
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress
Tod вне форума   Ответить с цитированием
Старый 26.10.2006, 20:45   #26
Valery Romanchev
Administrator
 
Аватар для Valery Romanchev
 
Регистрация: 23.08.2003
Адрес: Moscow, Russia
Сообщений: 1,926
Отправить сообщение для Valery Romanchev с помощью Skype™
По умолчанию

Цитата:
Краулер и индексирование работает четко на всех страницах кроме одной - главной. Она, в принципе, не маленьках, то есть содержит больше всего инфы (пару блоков новостей, рсс, текстовые блоки), может там как-то по другому индексировать нужно? В общем, проблемка((
а надо ли ее индексировать?
на wciom.ru я ее не индексирую
__________________
Веб-студия ТТЛАБ
www.ttlab.ru
Valery Romanchev вне форума   Ответить с цитированием
Старый 26.10.2006, 22:29   #27
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

Ну на главное есть 3-4 блока с контентом как минимум. хочется, что бы и его могли найти или это не нужно?)) просто логично как бы, чтобы все находило))
---
И еще, я так понимаю, что с помощью некоторых типов Indexed configuration можно искать и без краулера? тот же поиск по самой БД... с указанием в какие таблицы смотреть.
ЗЫ. Сайт бомба... аж глаза разбегаются)) столько всего...
---
Еще вопрос. Можно ли как-то задать конкретно какие поля индексировать, а то на всех страницах оно кроме, допустим, новостей, понаходило инфу из МЕТА тэгов и при поиске соответствующих слов - выдаст не совсем правильный ответ.
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress

Последний раз редактировалось Tod; 26.10.2006 в 23:17
Tod вне форума   Ответить с цитированием
Старый 23.11.2006, 19:51   #28
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

Есть страница, на которой отображаются новости, они все external - типа ссылки на другие сайты.
Пытаюсь индексировать эту страницу, но она состоит из нескольких, то есть все новости на одной не помещаются. Так вот по ссылке получается такая штука:
index.php?id=54&tx_ttnews[pointer]=1&cHash=e13df408c8
но как на деле это прописать в правила для краулера? проблема с [pointer] - где оно вообще в базе хранится?
может кто с ним сталкивался...
системную директорию с этими записями почему-то не индексирует(( там нужны какие-то доп. настройки? чем для обычных страниц?
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress

Последний раз редактировалось Tod; 23.11.2006 в 20:09
Tod вне форума   Ответить с цитированием
Старый 27.11.2006, 20:29   #29
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

Вопрос остается в силе.
Кто-то сталкивался с тем. что при использовании краулера и индексированного поиска индексируется еще и значения МЕТА description и keywords для каждой страницы? при вводе этих значений поиск выдаст в качестве результатов все страницы, а это сами понимаете не приемлемо((
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress
Tod вне форума   Ответить с цитированием
Старый 28.11.2006, 07:08   #30
Дылгеров Ц.В.
Senior Member
 
Регистрация: 14.11.2005
Адрес: Улан-Удэ
Сообщений: 158
Отправить сообщение для Дылгеров Ц.В. с помощью ICQ
По умолчанию

Цитата:
Сообщение от Valery Romanchev Посмотреть сообщение
а надо ли ее индексировать?
на wciom.ru я ее не индексирую
да конечно - смысл краулера на главной в том чтобы обновить кеш а не проиндексировать - а как можно сделать это из бэкэнда по-другому?

Цитата:
Сообщение от Tod Посмотреть сообщение
Вопрос остается в силе.
Кто-то сталкивался с тем. что при использовании краулера и индексированного поиска индексируется еще и значения МЕТА description и keywords для каждой страницы? при вводе этих значений поиск выдаст в качестве результатов все страницы, а это сами понимаете не приемлемо((
а тег в шаблоне <!--TYPO3SEARCH_begin--> не использовали?
Дылгеров Ц.В. вне форума   Ответить с цитированием
Ответ


Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB code is Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.

Быстрый переход


Часовой пояс GMT +4, время: 14:42.


Работает на vBulletin® версия 3.8.1.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot

Хостинг и техническая поддержка: TYPO3 Лаборатория