Вы здесьМуки с Word`ом
Опубликовано чт, 05/02/2009 - 06:19 пользователем sc_pasechnik
Доброго времени суток. Кто может подсказать хорошее средство для "причесывания файла" после сканирования на предмет мусора. Делаю вычитку в Word`е и в fb2 перегонять пока не буду (хотя если кому интересно книга С.Р. Певзнер "Вождение автомобиля" Москва, 1972 г.)
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Telly RE:Подайте бедному копеечку на книжку с литреса... 2 часа
babajga RE:Удивленная сова 2 дня Larisa_F RE:Серия «Квадрат» издательства «Текст» 4 дня Aleks_Sim RE:Беженцы с Флибусты 4 дня edvud RE:Прошу переформатировать, распознать, etc... 4 дня monochka RE:С 8 Марта! 1 неделя babajga RE:Книга чуДОМищ 1 неделя ProstoTac RE:Подборка о Первой Мировой 1 неделя babajga RE:Нержавеющая сабля 1 неделя sem14 RE:«Уроки русского» 1 неделя Isais RE:Древний Рим. Подборка книг 2 недели kopak RE:О группе Дятлова. О той самой, того самого... 2 недели babajga RE:Отчаянная осень 2 недели babajga RE:Сказки Сени Малины 2 недели babajga RE:Сказки 2 недели babajga RE:Мои четвероногие друзья 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Isais RE:Семейственность в литературе 3 недели Впечатления о книгах
Barbud про Черемис: Первая кровь (Попаданцы, Самиздат, сетевая литература)
15 03 Очень нудное писево. Герой - унылый предпенсионер-неудачник без талантов и особых умений, попавший в себя-студента. Действие разворачивается крайне неторопливо, прочитал уже мало не четверть первой книги, а у ГГ еще не закончился ……… Оценка: плохо
Олег Макаров. про Астахов: Без брака (Детективы: прочее)
15 03 после того, как Устинова стала писать вместе с этим товарисчем, читать стало просто невозможно.
Alligatoreader про Циркин: Политическая история Римской империи (История)
15 03 Пожалуй, лучшая работа профессора Циркина, хоть автор и создавал её в весьма преклонном возрасте. Связно, чётко, подробно, понятно и без лишней идеологической шелухи. Большое спасибо выложившему! Второй том, посвящённый ………
neletay про Веркин: Остров Сахалин (Постапокалипсис)
15 03 Это потрясающая книга. Современный постап все-таки в основном беллетристика, часто косая и хромая. А "Сахалин" - настоящая литература. Я очень рада, что прочитала ее. Теперь хочу купить бумажную, чтобы она у меня была живьем.
Oleg68 про Куанг: Республика Дракон [litres] (Героическая фантастика, Фэнтези)
15 03 Интересное продолжение приключений Рин Оценка: отлично!
Lan2292 про Шаман: Клан Борзых: Приемыш (Постапокалипсис, Самиздат, сетевая литература)
14 03 Как интересно начиналось, а потом такая тягамотина, бросила. Оценка: неплохо
Fornit про Хволкер: Фанфик по Overlords (Фанфик, Самиздат, сетевая литература)
14 03 50. Бабаджанян Василий Алибабаевич 2025/03/14 18:18 [ответить] Был такой автор - "хволкер". Написал ничё так фентези: http://flibusta.is/a/248212 Но украинизм головного моска ударил ………
clomeron про Маас: Дом Земли и Крови [litres] (Детективная фантастика, Городское фэнтези, Любовная фантастика)
14 03 Ну это для совсем уж невзыскательных читателей.) Оценка: нечитаемо
clomeron про Пехов: Ветер и искры [сборник : с иллюстрациями ; litres] (Фэнтези)
13 03 Топовое фэнтези. Автор большой молодец. Оценка: отлично!
clomeron про Пехов: Страж [тетралогия] (Фэнтези)
13 03 Это одна из вершин творчества признанного мастера русского фэнтези. Всякие там Мартины и прости Господи Аберкромби нервно курят в углу.))) Оценка: отлично!
clomeron про Аберкромби: Дурацкие задания [The Fool Jobs ru] (Фэнтези)
13 03 Ну и кому вообще нужен этот рассказ? Оценка: нечитаемо
clomeron про Аберкромби: Прежде, чем их повесят [Before They Are Hanged ru] (Фэнтези)
13 03 Трэш средней степени паршивости Оценка: нечитаемо |
Комментарии
Отв: Муки с Word`ом
Если после сканирования сохранить текст не в ворде, а как текст, весь мусор сам собой исчезает.
После этого текст можно открыть тем же вордом, но в нем уже не будет ни левой графики (в т.ч. крокозябры на сгибах и в развороте), ни разделителей разделов и колонок!
Правда, текстовая разметка (курсив, жирный) тоже теряется.
Восстановление текстовой разметки же занимает существенно меньше времени и требует значительно меньше усилий и нервов.
Отв: Муки с Word`ом
Все бы ничего, но в тексте довольно большой объем занимают картинки и отдельная их вставка в документ будет несколько затруднительна. Думал, может макрос какой есть для чистки.
Отв: Муки с Word`ом
Есть макрос, как не быть - сам себе его писал, много его пользую.
http://www.the-ebook.org/rus/?page_id=122&dl_page=2
http://www.the-ebook.org/rus/?p=255
Text_Cleaner_Macros
Размер файла: 21.0 KiB
Общее количество загрузок: 1,984 Дата обновления: 12 Июнь 2008
Макрос для MSWord (офис 97, 2003) по очистке и приведению в чувство текстов и страниц, скопированных из инета, отсканированных и прошедших обработку OCR pad. Приводит в достаточно красивый вид подавляющее большинство текстов. Подробнее:
.....
Но некоторые мусорные знаки мне проще регулярными выражениями потом именно в фб2 (в ФБЕ) искать.
мусорные знаки после скана (поиском, прямо как есть в квадратных скобках):
[/\\*>|'<_×`]
(включаем галку "Регулярное выражение")
и еще частые случаи
\s- (любой пробел+дефис)
-\s (дефис+любой пробел)
(включаем галку "Регулярное выражение")
И поскольку в фб2 можно перевести достаточно быстро, и он прекрасно открывается и правится вордом (для вычитки), то может имеет смысл все же сразу сделать фб2.
Отв: Муки с Word`ом
За макрос громадное спасибо. Сделаю и ФБ2 толькосначала всетаки вордовский.
Отв: Муки с Word`ом
Eсть знатная программа, убирающая большинство мусора - AfterScan (в варианте Lite - бесплатная, Pro и Express - shareware, но таблетки к ней также имеются). Попробуйте:
http://www.softoman.ru/windows/buisiness/other/11829.html
http://www.panvasoft.com/rus/15/
Отв: Муки с Word`ом
Всегда пользовался средством "Найти и заменить" :)
Хорошо помогает.
Например убрать двойные (многократные) пробелы, лишние переводы строки и абзацы, переносы...
И кодить ничего не надо)
Отв: Муки с Word`ом
После десятка текстов ручная работа по чистке типичных вещей через поиск начинает сильно утомлять ))
Нехай железный конь работает, он для того и нужен.
А пробелы, перевод строк и проч фбд сам исправляет, это вообще в 99% случаев нафиг не надо для фб2 делать.