Регулярные выражения - нужна помощь
Опубликовано пт, 22/01/2010 - 04:24 пользователем vadimmo
Forums: Захотелось заменить двухсимвольное сочетание пробел, длинное тире на неразрывный пробел, длинное тире во всей книге. Во всех версиях FBE, FBW можно использовать регулярные выражения при поиске, замене (а как иначе задать в строке замены неразрывный пробел?). Не получается. Такой символ - \x20 (обычный пробел) - находит. \xA0 (неразрывный пробел) - нет.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Подайте бедному копеечку на книжку с литреса... 1 день
Саша из Киева RE:Детям о Ленине (Издание 1965 года) 1 день Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 5 дней Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 5 дней babajga RE:Белая княжна 1 неделя Nicout RE:Таинственная личность админа Флибусты 1 неделя Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 неделя mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 2 недели zlyaka RE:С Новым годом! 2 недели Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели SparkySpirit RE:Прошу переформатировать, распознать, etc... 3 недели SparkySpirit RE:Жорж Санд - переводы 19 века 3 недели Саша из Киева RE:Наш дом - СССР 3 недели babajga RE:Чернушка. Повести 3 недели Саша из Киева RE:Сказки далёких островов 3 недели babajga RE:Лопоухий бес 3 недели babajga RE:Ежик покидает дом 4 недели babajga RE:Сказки бабушки Черепахи 4 недели Впечатления о книгах
9333694 про Дроздов: Горящее небо Аорна [СИ] (Боевая фантастика, Социальная фантастика, Приключения в современном мире, Самиздат, сетевая литература)
18 01 Напоминает классику: Эдмон Мур Гамильтон "Звездные короли". Но совершенно самсостоятельное произведение. Прочитал с удовольствием. Немаловажно, что ГГ не злоупотреблял перепевом отечественной классики, чем автор иногда грешит Оценка: хорошо
Stager про Демина: Громов: Хозяин теней (СИ) (Боевая фантастика, Фэнтези, Самиздат, сетевая литература)
17 01 Написано с большой любовью к бандиту и демократии. Но бандит всё равно образцовое дерьмо. Зато не так занудно, как обычно. Оценка: плохо
Никос Костакис про Ланцов: Десантник на престоле [Шесть книг в одном томе] (Альтернативная история)
16 01 ...познаниями в области радиоэлектронике..." Так выпьем за кибернетике! (с)
marin029 про Поселягин: Тактик [СИ] (Боевая фантастика, Попаданцы, Самиздат, сетевая литература)
16 01 Где-то в середине книги есть такое: ..."полярная ночь, или северная. Говорят, тут постоянно так светло." Автор уточни получше. Ночью светло это летом, во время полярного, короткого лета. А зимой в заполярье почти постоянно темно.
mysevra про Глуховский: Сумерки (Ужасы, Триллер)
16 01 Я была в восхищении до середины книги, потом всё-таки начали закрадываться сомнения. Потрясающий язык, но, да простит меня автор, так по-ленивому все обосновать – это сплошное разочарование. Оценка: хорошо
DGOBLEK про Кивиряхк: Последний, кто знал змеиную молвь [Mees, kes teadis ussisõnu ru] (Фэнтези, Современная проза)
14 01 Огромнейшее спасибо! Цитаты с книги - Они, видишь ли, ноги мне отрубили да в море сбросили! Пусть катятся в задницу, такими детскими приёмчиками от меня не избавишься! Юной девушке трудно устоять перед косолапым — ……… Оценка: отлично!
Barbud про Фонд: Агитбригада 1 [СИ] (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
14 01 Написано вроде и неплохо, но анахронизмы глаз режут - тут тебе в 1927 году и дуст, и "Либертанго", и "учебник по истории КПСС". И это я только половину книги одолел. Похоже, автор (или коллектив авторов) в реалиях тех лет ……… Оценка: неплохо
Саша из Киева про Даррелл: Говорящий сверток [The Talking Parcel ru] (Природа и животные, Детская проза)
14 01 artak60, У меня эта книга тоже была именно с такими иллюстрациями. Правда, эта книга была не моя собственная - я брал её в нашей местной детской библиотеке. А сейчас у нас в Киеве со старыми книгами катастрофическая ситуация.
dolle про Пелевин: Круть [litres] (Современная проза)
14 01 Наверное не нужно рассматривать " Трансгуманизм " как цикл.Все книги концептуально разные , вызывающие разные вопросы и эмоции у читателя.После первой книги планка была поднята слишком высоко и у многих появились завышенные ……… Оценка: отлично!
Belomor.canal про Свечин: Месть – блюдо горячее (Исторический детектив, Исторические приключения)
13 01 Похоже автору Лыков надоел по полной! если выкинуть 100 тонн воды - многостраничные цитаты из газет того времени, описание международной обстановки и ещё куча всего, то останется мало интересная история поимки, похожая на ……… Оценка: неплохо
alexk про Древневосточная литература: Книга тысячи и одной ночи. Арабские сказки [litres] (Древневосточная литература, Мифы. Легенды. Эпос)
13 01 Неловкая попытка переиздания /b/436061 из БВЛ
mysevra про Чайлд: Из глубины [Deep Storm ru] (Научная фантастика, Триллер)
13 01 Мне понравилось. Увлекательный сюжет, быстрое развитие действий. Наверное, фильм по этой книге вышел бы зрелищным. Оценка: хорошо |
Отв: Регулярные выражения - нужна помощь
А копипаст тоже не работает?
В смысле скопировать нужное из боди файла в строку замены.
Отв: Регулярные выражения - нужна помощь
Попробовал. Вместо неразрывного пробела вставляется простой. :(
Отв: Регулярные выражения - нужна помощь
Проблема снята использованием 16-ричного редактора
Отв: Регулярные выражения - нужна помощь
Можно ещё AkelPad и аналогичные использовать...
Отв: Регулярные выражения - нужна помощь
Да, спасибо, действительно Akelpad годится
Отв: Регулярные выражения - нужна помощь
В FBE2 делал контекстной заменой строки из пробела и тире на неразрывный и тире при включенных регулярных выражениях - проходило. Символ "пробел" вводил просто как " ", "неразрывный пробел" копипастил из штатной микро$офт-форточной софтинки "character map".
Тонкость: в режиме regexp неразрывный пробел тоже находится вместо обычного. Поэтому приходится повыкобениваться с серией замен:
- переключаюсь в режим исходника;
- меняю "<p> " на "<p>";
- "<v> " на "<v>";
- длинное тире на любой символ, которого в тексте гарантированно нет (к примеру, "доллар");
- пробел-доллар-пробел на неразрывный-тире-пробел;
- (ё-пс, забыл - поправляю) <p>-доллар-пробел на <p>-тире-неразрывный;
- <v>-доллар-пробел на <v>-тире-неразрывный;
- ищу все оставшиеся "доллары", правлю руками.
Ну, и неплохо поискать последовательности "пробел-минус" и "минус-пробел" - бывают неуверенно распознанные сканером или изгаженные при изготовлении .doc из .txt.
Отв: Регулярные выражения - нужна помощь
любой пробел (хоть в сорцах, хоть в обычном режиме):
\s
Отв: Регулярные выражения - нужна помощь
Кстати, а не подскажешь regexp для "европейских" букв (с галочками, акутами, умляутами и прочими хвостиками)? А то иногда досаждают - то из-за кривости исходной кодировки, а то есть умники, которые их пихают вместо ударений... :-(
Отв: Регулярные выражения - нужна помощь
Вот это подойдет?
http://miraduga.com/Temp/TablSpec.html
Отв: Регулярные выражения - нужна помощь
Можешь сам подобрать.
Таблицу символов выводишь на экран (на виндоус:
%SystemRoot%\system32\charmap.exe
) и начинаешь исключать диапазоны и символы.[^!-¿]
- уберет латинский и распространенные символы[^!-¿а-яё]
- тоже самое + русский[^!-¿а-яё\s–—…„“]
- с этим уже можно работать.По вкусу, в общем.
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
для подобной чистки я использую либо скрипт «Генеральная уборка», либо внешние средства регэкспов (хоть тот же AkelPad), поэтому такие проблемы были для меня новостью, и я решил поразбираться. результаты приведены ниже. до кучи последним пунктом добавил свое давнее наблюдение.
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
И вот еще что есть:
Регекспы от Грибова (входят в дистрибутив Ocr Pad)
http://narod.ru/disk/17203841000/RegExp.html.zip.html
Отв: Регулярные выражения - нужна помощь
Посмотрев на ситуацию с неразрывными пробелами, я опечалился и озадачился.
Вручную расстановка этого дела - трудоёмкое занятие. Даже если делать с использованием рег.выражений.
Видимо, напишу программку на Python. Займёт какое-то время, зато есть надежда, можно будет автоматически расставлять неразрывные пробелы по всей книге сразу.
Ещё правильней было бы сделать на javascript. Мне не хочется.
Отв: Регулярные выражения - нужна помощь
А чем не устраивает вышеупомянутый скрипт "Генеральная уборка"? он широко используется (в узком кругу :)) для чистки fb2
Отв: Регулярные выражения - нужна помощь
Да у меня из-за проблем со стабильностью программы скрипты почти никакие не работали. Сейчас, когда проблема решена, можно посмотреть, что и как работает из скриптов.
Отв: Регулярные выражения - нужна помощь
Попробовал скрипт "Генеральная уборка". Отличный скрипт. Только неразрывные пробелы он не расставляет, а удаляет.
Отв: Регулярные выражения - нужна помощь
насколько я помню, от ставит неразрывный пробел не перед всеми тире, а только, если перед пробелом есть знак препинания, а также после тире прямой речи.
Отв: Регулярные выражения - нужна помощь
В код не заглядывал, но прогнал текст один раз - скрипт про неразрывные пробелы ничего не сказал. Поставил вручную один неразрывный пробел. Результат - http://ifotka.ru/images/l8lhz486rmwhbegwd1dz.png
Отв: Регулярные выражения - нужна помощь
я тоже не заглядывал в код. лучше сделать так:
выполнить скрипт, документ сохранить как name1;
во внешнем редакторе открыть name1, заменить все неразрывные на простые, сохранить как name2;
снова в FBE открыть name2, выполнить скрипт, сохранить как name3;
в любимой программе сравнения посмотреть на разницу между name2 и name3.
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
Гы-ы. А в бесплатном WinMegre пробелы учитываются, причем дифференцированно - обычные и неразрывные.
Отв: Регулярные выражения - нужна помощь
Upd: невезуха - не берётся, админы уже успели закрыть закачку .exe-файлов и доступ к самым популярным файлообменникам. :-( Смогу скачать только вечером из дому.
Upd2: скачал, пробую. Непривычно - сравниваемые тексты не сверху-снизу, а слева-справа. А особенно жаль, что нету моих любимых регулярных выражений, в коих так удобно собирать отличия, которые я намерен проигнорировать (разные кавычки, тире, даже имена - в "Туманности Андромеды, например: Эрг Ноор, Ионе Мар, Мвен Мас - то латиницей, то кириллицей).
Отв: Регулярные выражения - нужна помощь
Положение окошек можно поменять в настройках. И никто не говорил,что будет легко :). Можно им пользоваться только для
окончательных расчётовпоследней проверки именно пробелов, после прогона ч/з CompareIt.Я, конечно, понимаю, что лучше быть и здоровым и богатым, но делать-то нечего.
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
(каеццо) Не-е-е. Наврала я. Там в "окна" есть переключатель - горизонтальное и вертикальное расположение окон, но это не то, не на те окошки действует, перепутала. :( Мне-то как раз удобно, как тебе не удобно. :))
Отв: Регулярные выражения - нужна помощь
подсказка… в вышеописанной схеме программа сравнения не обязана быть текстовой: для установления факта, что в name2 — обычные пробелы, а в name3 — неразрывные, достаточно fc /b
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
я не понял, в чем проблема. поковырялся я с этой прогой — замечательно себя ведет, дай бог каждой. можно визуализировать пробельные символы, так там все, как на ладоне. если включить игнор пробельных, то естественно всякие пробелы, табы и пр. в безразличном количестве не будут принимать участие в сравнении.
надо будет поактивнее эту прогу пользовать, а то что-то она у меня простаивает :)
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
Отв: Регулярные выражения - нужна помощь
Да, это бандитизм. Я после "генеральной уборки" дополнительно делаю общую замену пробел + тире на неразрывный пробел + тире.
Отв: Регулярные выражения - нужна помощь
Когда вставлены неразрывные пробелы в Alreader'е не работает поиск, если в строке поиска есть пробел, а на самом деле там неразрывный пробел. Это скорее претензия к читалке. В Coolreader3 поиска вообще не нашёл.