Entry tags:
Ох...
Очередной автор, доставшийся мне в электронном виде, не знает о существовании клавиши Tab (заменяя абзацный отступ кучей пробелов) и о возможности отформатировать текст по центру (используя вместо этого еще большую кучу пробелов). На сам текст я пока стараюсь не смотреть.
Люди, ведь правда, вы так не делаете?..
Upd: спасибо за идею с абзацным отступом в параметрах абзаца. :) Заодно убью дохренищу стилей, которые там разведены.
Люди, ведь правда, вы так не делаете?..
Upd: спасибо за идею с абзацным отступом в параметрах абзаца. :) Заодно убью дохренищу стилей, которые там разведены.
no subject
no subject
А вот если пробелами создается центрирование - это совсем труба, потому что это значит, что там каждая строчка оканчивается знаком окончания абзаца. Хотя скорее всего в этом случае этот текст копировался из тупого текстового редактора - и там окончание абзаца вообще в каждой строке. Тогда работает серия автозамен:
1) два конца абзаца - на разрыв страницы;
2) конец абзаца - на пробел
3) разрыв страницы - на конец абзац.
А потом руками восстанавливать центрирование там, где надо.
no subject
Правило "заменить от пяти до десяти пробелов _в_начале_строки_ на табуляцию" решит проблему отбивки табуляциями в 98% случаев. остальные два -- таки руками. Только в ворде такое правило не напишешь... Потому что он убог, не смотря на свою монструозность.
Про центрирование -- я уже сказал, что надо смотреть на то как это сделано, и тогда предлагать конкретное решение. в 75% случаев возьмусь это сделать только заменами с регулярными выражениями (это как раз та технология которая при замене позволяет указать диапазон количества заменяемых символов, факт начала строки и много чего еще). В остальных случаях наверно решал бы написанием программы, обрабатывающий текст.
no subject
А вот процедура "заменить много пробелов на центрирование" - уже невозможна, потому что это нелокальная операция, действительно, без программы, обрабатывающий весь текст, такое автоматически не обработать.
no subject
Если центрирование сделано "как будто бы текст был набран в лексеконе", то последовательно применяем следующее кол-во замен на "языке" регулярных выражений.
1. Если строка отбита пробелами и начинается не с заглавной буквы и большого тире, то отбрасываем передние пробелы и берем все <center></center>
2. Если строка отбита более десяти пробелами, то пробелы удаляем, и берем все <center></center>
3. Если строка отбита 5-10 пробелами и содержит N-M символов (прикидываем сколько cимволов в одной полной лексиконной строке было у автора и берем запас) опять же удаляем и заменяем
4. По всему тексту выкусываем </center>[перевод строки]<center>
Далее уже руками.
Тебе или остинг освоить инструментарий регулярных выражений на таком уровне -- максимум пол дня. Скорее всего час-другой. Пользоваться этим можно всю оставшуюся жизнь.
no subject
no subject
Я бы такое экспортировал бы в html витусовской утилитой catdoc, оно туда попало бы уже очищенное от стилей, потом в нормальном редакторе сделал бы все замены, и потом вернул бы назад в ворд...
Это ты в tex не экспортируешь ничего, видимо... У меня знакомый научные работы в tex переверстывает для публикации в зарубежных научных сборниках. Он такого нарассказывал...
no subject
В тех я вордовые тексты перевожу автоматическим конвертером, после этого достаточно чуть-чуть подправить сложные формулы и наложить нужный стиль - и все, текст готов.
>Я бы такое экспортировал бы в html витусовской утилитой catdoc, оно туда попало бы уже очищенное от стилей, потом в нормальном редакторе сделал бы все замены, и потом вернул бы назад в ворд...
И испортил бы в процессе все формулы, рисунки и таблицы.
no subject
http://wiki.openoffice.org/wiki/Documentation/How_Tos/Regular_Expressions_in_Writer
>Я бы такое экспортировал бы в html витусовской утилитой catdoc, оно туда попало бы уже очищенное от стилей, потом в нормальном редакторе сделал бы все замены, и потом вернул бы назад в ворд...
И испортил бы в процессе все формулы, рисунки и таблицы.
Да с таблицами и рисунками тяжелее...
no subject
no subject
no subject
no subject
no subject
no subject
Центрирование было, по счастью, только в титульной странице и некоторых заголовках. Хотя... представила стихи, сверстанные именно таким образом. И некоторые древности тоже. Как подумаю, что сама их писала... :)
no subject
но криво.
no subject
no subject
^t, ^n кажется.
во: http://support.microsoft.com/kb/214204
no subject