Неправильная кодировка на az.lib.ru

Вопрос к знатокам - как можно скачать вот эту страницу http://az.lib.ru/t/turgenew_i_s/text_0900.shtml и при этом чтобы правильно отображался текст?

а то при загрузке выдаёт вот такой текст

1269. M. H. ѓѓѓСѓдѓЬѓаѓУѓе. 11(23) ѓсѓЯѓУѓСѓвѓс
1270. ѓЎ. ѓЄ. ѓ?ѓЦѓвѓиѓЦѓЯѓе. 13(25) ѓсѓЯѓУѓСѓвѓс
1271. ѓЎ. ѓЎ. ѓѓЦѓдѓе.(14)26 ѓсѓЯѓУѓСѓвѓс
1272. ѓ+. ѓ?. ѓЎѓЯѓЯѓЦѓЯѓЬѓаѓУѓе. ѓіѓЦѓвѓЦѓХѓЪѓЯѓС ѓсѓЯѓУѓСѓвѓс ѓгѓд. ѓгѓд.

Комментарии

Для начала надо было предупредить, что там 2,5 Мб текста, не у всех тянут машинки на такое и не у всех есть лишний траффик. А во-вторых, есть программа Shtirlitz IV, которая вам таки может помочь.

полчаса проработала автоматом - не помогла. надо бы попробовать разные варианты настроек, но это - время.

Что-то мне думается, что она и не подберет кодировку. В тексте через букву стоит

Цитата:
ѓ
. Это не просто ошибка кодировки...

Jagget написал:
Это не просто ошибка кодировки...
Ну почему? Если это Юникод, прочтенный как обычная кодировка, то лишние байты во что-то одинаковое и преобразуются.

А зачем надо именно оттуда это все выдирать?

"Письма 1862-1864 " если и есть на других сайтах, фронтальной гугл-атакой не обнаруживаются.

Jagget написал:
Это не просто ошибка кодировки...

Да, нет, как раз типичная ошибка в выборе кодировки при заливке текста на сайт. Все латинские буквы и цифры сохранились, пострадали только кирилличные символы.

peshehodrost, в начале страницы, указанной вами, есть два адреса - попробуйте задать ваш вопрос письмом. Или Связаться с программистом сайта - в конце страницы.

sd пишет

Цитата:
peshehodrost, в начале страницы, указанной вами, есть два адреса - попробуйте задать ваш вопрос письмом. Или Связаться с программистом сайта - в конце страницы.

связался - получил ответ

Как только, так сразу.
МАксим Бычков сейчас в поезде дальнем.
Как разыщу, обговорю, так и придумает что-нибудь...

чтож с нетерпением жду! всем спасибо!

Спасибо, Google, за желание помочь. Но, ксожалению, найдены были письма 1859-1861 годов, а не 1862-1864.

Штирлиц не пробовали?
Достаточно определить кодировку, а потом преобразовать проблем не будет.
могу еще порекомендовать утилитку ruscod.com из поставки досовского лексикона.

К сожалению указанная статья не может быть корректно преобразована, т.к. в ней испорчены часть символов. В основном это заглавные буквы (в исходном тексте - знак ?). Поэтому преобразовать текст не получится до конца правильно.

Если очень нужно, можно вручную подправить некоторые буквы.
Во вложении преобразованный текст (нужно переименовать jpg в rar).

Спасибо за помощь. Мой штирлиц так и не справился (хотя, это беда не штирлица, а корявости моих рук). Посмотрел, ошибок очень мало. Если не секрет, какой программой раскодировали? какая кодировка была изначально?
PS: Очень рад встретить вас здесь )))

Насколько я понял, изначально кодировка была - UNICODE.
Потом, в результате какого-то страшного колдунства байты сместились на некоторую величину, причем смещение могло быть разное. По-видимому такое произошло в результате многократной перекодировки в какой-то страшной программе.

Раскодировал в Экселе :)

Google - большое спасибо!а как вы это сделали? поделитесь опытом

X