Илья
09.11.2010, 20:40
Привет.
Пытаюсь подружить индексный поиск (indexed_search) и новости (tt_news).
На форуме этот вопрос периодически поднимается, но полностью работающего решения я не нашел. Впрочем как не заработали решения и из других источников.
Предлагаю сделать полный вариант решения и перенести его в FAQ.
Итак, что было сделано:
1. Установлен indexed_search из TER, добавил в TS корня сайта page.config.index_enable = 1
2. Установлен crawler из TER (не уверен, что он нужен с нынешней версией поисковика, где есть какие то настройки типа шедулера!?)
3. В корне сайта сделана запись: Crawler Configuration, в которой указан: Base url, Processing instruction parameters:
tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:3]
tt_news.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
tt_news.cHash = 1
tt_news.pidsOnly = 4
4. В TS корня сайта дополнительно вставлено следующее:
# taken from the crawler-docu, p. 8
tx_crawler.crawlerCfg.paramSets {
language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language _uid]
language.procInstrFilter =tx_indexedsearch_reindex, tx_indexedsearch_crawler
language.baseUrl = http://www.mysite.ru/
}
#for tt_news from #http://typo3.toaster-schwerin.de/typo3_english/2006_05/msg00355.html
#_PID:3 is the sysfolder with the news records
#pidsOnly = 4 is the page with the news singeview.
tx_crawler.crawlerCfg.paramSets {
tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:3]
tt_news.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
tt_news.cHash = 1
tt_news.pidsOnly = 4
}
5. Все Новости лежат в sysfolder'e и при попытке запуска crawler напротив всех sysfolder'ов вижу: No entries (Because doktype is not allowed). Где разрешить этот тип страниц для индексирования - не нашел.
wiki (http://wiki.typo3.org/wiki/Crawler) изучил, но не нашел ответа. Есть только хук для запрещения индексации конкретного doktype:
excludeDoktype Hook
By adding doktype ids to following array you can exclude them from being crawled:
$GLOBALS['TYPO3_CONF_VARS']['EXTCONF']['crawler']['excludeDoktype'][] = <dokTypeId>
6. В корне сайта сделана запись "Конфигурация индексирования":
Указаны:
Индексируемые таблицы: Новости
Альтернативный страницы: Указан sysfolder с новостями.
Строка параметер GET (с заменой ###UID###): &tx_ttnews[tt_news]=###UID###
7. В TS sysfolder'a с новостями пробовал указать ч
Вот вопросы, которые меня интересуют в настоящий момент:
1. Нужен ли crowler или переиндексация будет осуществляться средствами indexed_search?
2. Реально ли индексировать sysfolder'ы или придется менять тип страницы?
3. Есть ли в природе описание нужного мне процесса настройки поисковика?
4. Что я сделал неверно, или не сделал?
Заранее благодарю.
Пытаюсь подружить индексный поиск (indexed_search) и новости (tt_news).
На форуме этот вопрос периодически поднимается, но полностью работающего решения я не нашел. Впрочем как не заработали решения и из других источников.
Предлагаю сделать полный вариант решения и перенести его в FAQ.
Итак, что было сделано:
1. Установлен indexed_search из TER, добавил в TS корня сайта page.config.index_enable = 1
2. Установлен crawler из TER (не уверен, что он нужен с нынешней версией поисковика, где есть какие то настройки типа шедулера!?)
3. В корне сайта сделана запись: Crawler Configuration, в которой указан: Base url, Processing instruction parameters:
tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:3]
tt_news.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
tt_news.cHash = 1
tt_news.pidsOnly = 4
4. В TS корня сайта дополнительно вставлено следующее:
# taken from the crawler-docu, p. 8
tx_crawler.crawlerCfg.paramSets {
language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language _uid]
language.procInstrFilter =tx_indexedsearch_reindex, tx_indexedsearch_crawler
language.baseUrl = http://www.mysite.ru/
}
#for tt_news from #http://typo3.toaster-schwerin.de/typo3_english/2006_05/msg00355.html
#_PID:3 is the sysfolder with the news records
#pidsOnly = 4 is the page with the news singeview.
tx_crawler.crawlerCfg.paramSets {
tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:3]
tt_news.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
tt_news.cHash = 1
tt_news.pidsOnly = 4
}
5. Все Новости лежат в sysfolder'e и при попытке запуска crawler напротив всех sysfolder'ов вижу: No entries (Because doktype is not allowed). Где разрешить этот тип страниц для индексирования - не нашел.
wiki (http://wiki.typo3.org/wiki/Crawler) изучил, но не нашел ответа. Есть только хук для запрещения индексации конкретного doktype:
excludeDoktype Hook
By adding doktype ids to following array you can exclude them from being crawled:
$GLOBALS['TYPO3_CONF_VARS']['EXTCONF']['crawler']['excludeDoktype'][] = <dokTypeId>
6. В корне сайта сделана запись "Конфигурация индексирования":
Указаны:
Индексируемые таблицы: Новости
Альтернативный страницы: Указан sysfolder с новостями.
Строка параметер GET (с заменой ###UID###): &tx_ttnews[tt_news]=###UID###
7. В TS sysfolder'a с новостями пробовал указать ч
Вот вопросы, которые меня интересуют в настоящий момент:
1. Нужен ли crowler или переиндексация будет осуществляться средствами indexed_search?
2. Реально ли индексировать sysfolder'ы или придется менять тип страницы?
3. Есть ли в природе описание нужного мне процесса настройки поисковика?
4. Что я сделал неверно, или не сделал?
Заранее благодарю.