PDA

Просмотр полной версии : Вопрос про работу search_engine


Ивано++
25.01.2013, 14:25
Добрый день.

Вот на этом демо сайте есть поиск:
Расположен по адресу:
http://demo.anweb.ru/no_cache/search.html?tx_indexedsearch%5Bext%5D=1

И имеется вот такой select:
Искать: Во всех видах информации либо в определенной (документы pdf,doc...)

<select name="tx_indexedsearch[media]" class="tx-indexedsearch-selectbox-media media"><option value="-1" selected="selected">Во всех видах информации</option><option value="0">Во внутренних страницах</option><option value="-2">Во внешних страницах</option><option value="pdf">PDF (*.pdf)</option><option value="doc">MS Word (*.doc)</option><option value="pps">MS Powerpoint (*.pps)</option><option value="ppt">MS Powerpoint (*.ppt)</option><option value="xls">MS Excel (*.xls)</option><option value="sxc">OpenOffice.org Calc (*.sxc)</option><option value="sxi">OpenOffice.org Impress (*.sxi)</option><option value="sxw">OpenOffice.org Writer (*.sxw)</option><option value="ods">ODF Spreadsheet (*.ods)</option><option value="odp">ODF Presentation (*.odp)</option><option value="odt">ODF Text (*.odt)</option><option value="rtf">Rich Text Format (*.rtf)</option><option value="txt">Текстовые файлы (*.txt)</option><option value="html">Веб страницы (*.html)</option><option value="csv">Значения, через запятую (*.csv)</option><option value="xml">Extensible Markup Language (*.xml)</option></select>

Очень интересно как typo3 ищет данные например в csv или pdf или word или odp или любом другом типе файла - он открывает это с помощью специальных библиотек - читает содержимое и кладет в свой индекс?

Или просто адрес на файл сохраняет?

--
Спасибо.

mazaev
19.03.2013, 03:33
привет.
Насколько я знаю открывает с помощью спец библиотек, их дополнительно нужно ставить на сервер.

Ивано++
19.03.2013, 13:49
Получается - это такой маленький google, встроенный на сайт...

Думаю - что не буду эту тему развивать в своих работах - а оставлю классику, когда к примеру документ описывается в ручную (его тэги, ключевые слова, заголовок - и все это хранится в БД)...

Иначе на сайте при запросе любого слова "xxxx" - будет в результатах поиска выдаваться куча хлама...

А так хотя бы по тому, что хочется найти...