Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 11 часов
babajga RE:Удивленная сова 2 дня Larisa_F RE:Серия «Квадрат» издательства «Текст» 4 дня Aleks_Sim RE:Беженцы с Флибусты 4 дня edvud RE:Прошу переформатировать, распознать, etc... 4 дня monochka RE:С 8 Марта! 1 неделя babajga RE:Книга чуДОМищ 1 неделя ProstoTac RE:Подборка о Первой Мировой 1 неделя babajga RE:Нержавеющая сабля 1 неделя sem14 RE:«Уроки русского» 1 неделя Isais RE:Древний Рим. Подборка книг 2 недели kopak RE:О группе Дятлова. О той самой, того самого... 2 недели babajga RE:Отчаянная осень 2 недели babajga RE:Сказки Сени Малины 2 недели babajga RE:Сказки 2 недели babajga RE:Мои четвероногие друзья 2 недели Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 недели Isais RE:Семейственность в литературе 3 недели Впечатления о книгах
Олег Макаров. про Астахов: Без брака (Детективы: прочее)
15 03 после того, как Устинова стала писать вместе с этим товарисчем, читать стало просто невозможно.
Alligatoreader про Циркин: Политическая история Римской империи (История)
15 03 Пожалуй, лучшая работа профессора Циркина, хоть автор и создавал её в весьма преклонном возрасте. Связно, чётко, подробно, понятно и без лишней идеологической шелухи. Большое спасибо выложившему! Второй том, посвящённый ………
neletay про Веркин: Остров Сахалин (Постапокалипсис)
15 03 Это потрясающая книга. Современный постап все-таки в основном беллетристика, часто косая и хромая. А "Сахалин" - настоящая литература. Я очень рада, что прочитала ее. Теперь хочу купить бумажную, чтобы она у меня была живьем.
Oleg68 про Куанг: Республика Дракон [litres] (Героическая фантастика, Фэнтези)
15 03 Интересное продолжение приключений Рин Оценка: отлично!
Lan2292 про Шаман: Клан Борзых: Приемыш (Постапокалипсис, Самиздат, сетевая литература)
14 03 Как интересно начиналось, а потом такая тягамотина, бросила. Оценка: неплохо
Fornit про Хволкер: Фанфик по Overlords (Фанфик, Самиздат, сетевая литература)
14 03 50. Бабаджанян Василий Алибабаевич 2025/03/14 18:18 [ответить] Был такой автор - "хволкер". Написал ничё так фентези: http://flibusta.is/a/248212 Но украинизм головного моска ударил ………
clomeron про Маас: Дом Земли и Крови [litres] (Детективная фантастика, Городское фэнтези, Любовная фантастика)
14 03 Ну это для совсем уж невзыскательных читателей.) Оценка: нечитаемо
clomeron про Пехов: Ветер и искры [сборник : с иллюстрациями ; litres] (Фэнтези)
13 03 Топовое фэнтези. Автор большой молодец. Оценка: отлично!
clomeron про Пехов: Страж [тетралогия] (Фэнтези)
13 03 Это одна из вершин творчества признанного мастера русского фэнтези. Всякие там Мартины и прости Господи Аберкромби нервно курят в углу.))) Оценка: отлично!
clomeron про Аберкромби: Дурацкие задания [The Fool Jobs ru] (Фэнтези)
13 03 Ну и кому вообще нужен этот рассказ? Оценка: нечитаемо
clomeron про Аберкромби: Прежде, чем их повесят [Before They Are Hanged ru] (Фэнтези)
13 03 Трэш средней степени паршивости Оценка: нечитаемо
Олег Макаров. про Сказ: Темный Герой [СИ] (Фэнтези, Попаданцы, ЛитРПГ, Самиздат, сетевая литература)
12 03 Увидев гранату, залетающую в окно, спецназовец кричит напарнику: — Тимур, осторожней! а я перестаю читать. Потому что... ну просто потому что нельзя такое читать Оценка: нечитаемо |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Ну, я не специалист-филолог, но мне кажется, скрипт должен ориентироваться на литературный, а не на просторечный вариант.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы