Тема: Site Crawler
Показать сообщение отдельно
Старый 26.10.2006, 17:21   #24
Tod
Senior Member
 
Аватар для Tod
 
Регистрация: 25.03.2006
Сообщений: 627
Отправить сообщение для Tod с помощью ICQ
По умолчанию

В общем, вроде настроил все более-менее. ДОкументация рулит. Из таких особых моментов можно выделить, то что Indexed configuration нужно хранить обязательно в системной директории (где-то в доке вычитал, работает вроде), потом задаем для этой записи время и периодику индексирования, тип page tree. Далее запускаю краулер с параметрами что-то вроде:
Код:
tx_crawler.crawlerCfg.paramSets {
  test = contentId=[_TABLE:tt_content]
  test.procInstrFilter = tx_indexedsearch_reindex
	
  tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news; _PID:9]
  tt_news.procInstrFilter = tx_indexedsearch_reindex
  tt_news.cHash = 1
  tt_news.pidsOnly = 10
}
При этом для новостей генерируются УРЛы только на странице с единичным отображением новости - 10, и беруться записи из системной директории - 9.
Есть пару вопросов:
1. ЗАчем нужно tx_cachemgm_recache ? А то не совсем понял.
2. Системные директории тоже индексируются, но там создаются так называемые meta-entries, для которых я так понимаю нужно создать запись indexed configuration?
3. И САМОЕ ГЛАВНОЕ. Краулер и индексирование работает четко на всех страницах кроме одной - главной. Она, в принципе, не маленьках, то есть содержит больше всего инфы (пару блоков новостей, рсс, текстовые блоки), может там как-то по другому индексировать нужно? В общем, проблемка((
__________________
Персональный блог про заработок в интернете + полезных блога про typo3 и wordpress
Tod вне форума   Ответить с цитированием