Russian TYPO3 community

Russian TYPO3 community (http://forum.typo3.ru/index.php)
-   Разработка расширений / TYPO3 extension development (http://forum.typo3.ru/forumdisplay.php?f=38)
-   -   indexed search - pages are indexed many times (http://forum.typo3.ru/showthread.php?t=5940)

typo27 28.02.2008 13:11

indexed search - pages are indexed many times
 
Some pages are indexed several times, and when the page is found in indexed searching, the page is shown multiple times in search result!

How to get rid of multiple search results of one page?

(:) 28.02.2008 13:23

привет, маловато написал, трудно понять вашу ситуацию...

1) страницы точно разные?
2) урлы у них точно разные?

3) в чем отличия страниц?

4) чистить в меню инфо пробовали? и снова инициировать индексацию?

что-то вроде этого

привет

typo27 28.02.2008 13:58

Sposibo,
one page is indexed 4 times, and when searching there are 4 identical search results with identical links (links are clear - withouth hash getvar- like index.php?id=1769) - pointing to the same page.

"4) чистить в меню инфо пробовали? и снова инициировать индексацию?"

I would not like to do this - there are few thousand of indexed pages - most of them are in 'not in menu' - so there is no comfort way for visitors to reach them in frontend and to index them again.

The problem is - in search result there are several identical results with identical urls.

(:) 28.02.2008 14:09

пример урлов?

урл полный, две штуки...


переиндексировать можно автоматом если настроить краулер и скормить ему список всех страниц

в инфо можно чистить выборочно по одной записи за раз, это нужно будет сделать, чтоб удостовериться как происходит переиндексирование.

возможный план действий:

выбираем типичную страницу с проблемой (повторяющиеся индексы).
так же чтоб по возможности можно было с ней поэксперементировать (наименее важный контент)

и чистим индексы только для неё
затем заставляем тайпу проиндексировать эту страницу, смотри что получилось

о результатах мероприятия докладываем здесь :)

пока так

typo27 28.02.2008 15:12

Sposibo,
I choosed problematic page, cleared index it it.

But how to reindex it with crawler? Sorry for stupid question :)
I go to web->info->crawler
but there is no items in the Processing Instructions (there should be item Re-index [tx_indexedsearch_reindex] according to crawler manual).

(:) 29.02.2008 10:37

hello,

first of all just not to mess up with crawler you'd start with simple approach - just load a problematic page manually by the browser.

indexing working when your page is cached and in its turn your page is cached when it is requested by any means: browser or curl command from php or wget or so.

so you just try to reload your page and look what will happen with indexing statistics in info

good luck


Часовой пояс GMT +4, время: 18:36.

Работает на vBulletin® версия 3.8.1.
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Перевод: zCarot