PDA

Просмотр полной версии : как проще всего перенести контент в сайт?


Илья
31.05.2006, 21:07
Есть много контента, который нужно перенести в сайт.
Это банальные word документы (текст, таблицы, нумерованные списки и т.п.). Таких документов немало.
Каким образом проще всего запихать все это в Typo?
Форматирование нужно максимально приближенное к оригиналу.
1. Пробовал с помощью htmlArea RTE v 1.2.0, он вроде бы понимает word таблицы и можно cut&paste из ворда, но разъезжается все на сайте после этого. Может быть CSS еще порулить надо было получше?
2. Можно из word'а html генерить и их вставлять в typo. На внешний вид наиболее похоже к оригиналу получается, но РАЗМЕР этих страниц огромный и не отредактировать нормально.
3. Также из word'а html генерить, но перед вставкой очищать от лишних тегов и их вставлять в typo.

Собственно что бы еще придумать?

ЗЫ Заказчик принципиально делает контент в Ворде и не планирует ничего менять.
Хотя если возможен обратный вариант (изначально делать в каком-нить редакторе в typo, а потом уже в word пихать). Не знаю насколько реализуемо.

Valery Romanchev
31.05.2006, 21:58
HTMLarea - к сожаленю по дефолту не вычащает нормально.
Можно его подкручивать... настраивать что он будет чистить. Но это большая работа.

Попробуйте другие редакторы.
Для ombudsman.mos.ru я поставил последний вариант RTE - он нормально вычащает простые вордовские документы ( rte_plus )

Сегодня тестировал tinyrte - он корректно вычистил сложную таблицу, которую не смогли вычистить HTMLarea и RTE.

Илья
31.05.2006, 23:04
Спасибо за ответ.
Попробую эти редакторы.
А возможно ли это:
"Хотя если возможен обратный вариант (изначально делать в каком-нить редакторе в typo, а потом уже в word пихать). Не знаю насколько реализуемо."

farm
31.05.2006, 23:34
тайпо тут не причем, деньги надо брать за ворд->html, отдельным пунктом в прайс-листе, я как-то опеноффисом открывал вордовые поделия и сохранял в Html, но при навороченном форматировании проще переделать в dreamweaver, чем разгребать помойку (про размер вы правильно заметили).

Дылгеров Ц.В.
01.06.2006, 08:14
Мое мнение - лучше worda никто не распознает word-формат.
Поэтому можно пойти двумя путями:
Первый - двухэтапный - пишем в Ворде скрипт который используя команду SaveAs сохраняет все файлы в КОМПАКТНОМ html. Наверное это возможно в офисе 2003. Обход каталогов сделать рекурсивным. Ворд решит все проблемы с рисунками. На втором этапе перенести все эти HTML в Typo3 либо php-скриптом, либо любым другим, умеющим работать с БД mysql. Например я перенес БД старого сайта используя Typo3-функции - для того чтобы в дереве соблюдался sorting (положение в дереве) - но это не так уж важно. Причем работать придется всего лишь с двумя таблицами - pages и tt_content. Затем придется сложить все рисунки в один каталог - а в БД поменять все img src на этот каталог.

Второй путь - прямо в Ворде организовать доступ к Typo3 - но это тяжелее намного - пример - SPD в программном комплексе "Кодекс" (питерцы сделали). Если реализовать - круто будет - сидишь в Ворде и зарегистрировавшись размещаешь в нужном тебе дереве Typo3 документ. Круто для теток конечно, которым лень кроме Ворда работать где-либо .

И еще один способ - наверное реальный - для импорта использовать OpenOffice - наверняка он может сохранять из командной строки вордовские файлы в формате html. Под юниксами наверное точно.

Valery Romanchev
01.06.2006, 11:47
И еще один способ - наверное реальный - для импорта использовать OpenOffice - наверняка он может сохранять из командной строки вордовские файлы в формате html. Под юниксами наверное точно. я с OpenOffice делал. Получалось неплохо.
А именно: есть сложно отформатированный документ в Word.
вставляю его через буфер в открытый пустой документ OpenOffice (там есть тип документа HTML).
Сразу же после вставки копирую снова в буфер и вставляю в HTMLArea


Если реализовать - круто будет - сидишь в Ворде и зарегистрировавшись размещаешь в нужном тебе дереве Typo3 документ. Круто для теток конечно, которым лень кроме Ворда работать где-либо . Мне это напомнило дезайнерскую шутку о том, что некоторые заказчики думают, будто в фотошопе есть кнопка "Сделать п... дато" :) ... А ее там нету :eek:

На сегодняшнем уровне развития веб-технологий можно сделать, что из ворда что-то там можно будет публиковать.. но полного управления контентом не будет, и система в целом врядли будет надежной.

Илья
01.06.2006, 12:08
Да форматирования в word'e не особо сложное.
Типа заголовок определенного размера выровнен по центру,
основной текст курсивом, таблица с обычными границами.

Илья
01.06.2006, 12:16
Кстати еще вариант есть вставить очищенный Dreamwaver'ом word'овский html в htmlarea, с нажатой кнопкой html, или как она там называется, а потом уже обработать может быть даже вручную.

Дылгеров Ц.В.
02.06.2006, 05:00
Для переноса большого количества файлов за один присест нужна командная строка - иначе как решить проблему вставки в Typo3.

Создаем скрипт который идет по каталогу и просматривает все файлы - открывает их в OpenOffice или Word и сохраняет в HTML - все через командную строку - и внедряет в БД Typo3.

Пример работы с OpenOffice http://xmlhack.ru/texts/06/from-microsoft-to-openoffice/from-microsoft-to-openoffice.html

Илья
02.06.2006, 11:06
Больше интересует соответствие полученных, таким образом файлов, оригинальным документам.
А через PDF никак не получится преобразовать?
Типа Doc->PDF->Typo3 но при этом чтобы можно было в тайпо редактировать...
Хотя похоже это из области научной фантастики...

Pavel Antonov
02.06.2006, 13:39
Больше интересует соответствие полученных, таким образом файлов, оригинальным документам.
А через PDF никак не получится преобразовать?
Типа Doc->PDF->Typo3 но при этом чтобы можно было в тайпо редактировать...
Хотя похоже это из области научной фантастики...

с PDF то как??? Это вообще помоему малопригодный формат для внесение данных куда либо, ввиду его "полиграфической" внутренней сущности... IMHO

Илья
02.06.2006, 14:14
Да, наверное с PDF я погорячился... :)
А rtf в этом смысле не лучше чем doc? В смысле может быть из него экспорт в typo сделать можно?