V403476 Звездный кот

В книге Звездный кот много ошибок.
Например:
Это какой пакостник залил TXT в кодировке - страшно подумать! - UTF16! Эт наверно, чтоб кетайцам лехше было четать!
Срочно стряпаю fb2 с первоисточника!

Аватар пользователя Isais

Поздравляю!
*утянув словцо у АнныВин, непричёмно* А я псевдоним установил http://lib.rus.ec/a/218302...

Isais написал:
Поздравляю!
*утянув словцо у АнныВин, непричёмно* А я псевдоним установил http://lib.rus.ec/a/218302...
http://lib.rus.ec/a/218302... написал:
По фактам "руководитель группы подготовки первых космонавтов", "участник торжественного приема 14 апреля 1961 г. в Кремле в честь полета Ю. Гагарина", "собеседник Н. Хрущева" - устанавливается, что Е.А. Петров - псевдоним Николая Петровича Каманина.
У этого автора только одна книжка и это НЕ Звездный кот! Тоже, конечно, про космонавтов, но не фантастика.

Zadd написал:
В книге Звездный кот много ошибок.
Например:
Это какой пакостник залил TXT в кодировке - страшно подумать! - UTF16! Эт наверно, чтоб кетайцам лехше было четать!
Получилось, что fb2 со всеми наворотами: разметка глав, разметка абзацев, цитата, курсив... занимают в итоге меньше места(в кодировке UTF8), чем тот TXT, первоначально залитый в кодировке UTF16(хитрожопый заливщик детектед!). Понятно, что в UTF16 каждый символ занимает 16 бит, т.е. 4 байта, что, впрочем, все равно НЕ хватает на отображение ВСЕХ китайских иероглифов, которых больше, чем 65536=216, поэтому для китайцев юзается упрощенный китайский, но, возможно, когда-нибудь специально для китайцев разработают UTF32 или UTF64.
Короче, предлагаю отобрать орден у Насера "пользу" у хитрожопого заливщика. Ну не мог он скачать TXT в UTF16, только самому сделать!

Zadd написал:
Понятно, что в UTF16 каждый символ занимает 16 бит, т.е. 4 байта, что, впрочем, все равно НЕ хватает на отображение ВСЕХ китайских иероглифов, которых больше, чем 65536=216, поэтому для китайцев юзается упрощенный китайский

Упрощённый китайский юзается вовсе не поэтому, а потому, что существует два стандарта начертания иероглифов - традиционный и упрощённый. Упрощённый стандарт был введён в 1964 году, задолго до появления UTF.

Verdi1 написал:
Упрощённый китайский юзается вовсе не поэтому, а потому, что существует два стандарта начертания иероглифов - традиционный и упрощённый. Упрощённый стандарт был введён в 1964 году, задолго до появления UTF.
Возможно, одна причина не отменяет другую? А может, существование упрощенного китайского как раз и мешает прогрессу разработке UTF32? Нафига делать полный китайский, если есть упрощенный?
И ещё: я там неправильно сказал, что символ UTF16 занимает 4 байта, на самом деле 2 байта непосредственно на сам символ, а не знаю сколько, один или 2 байта - код языка, символом которого является этот символ.
В данном конкретном случае упрощенный китайский UTF16 юзался не для того, чтобы отобразить китайские иероглифы, а для того, чтобы просто раздуть размер файла и потенциально извлечь больше "пользы".

(меланхолично) 4 байта - это 32 бита.

N. N. написал:
(меланхолично) 4 байта - это 32 бита.
Не учитываешь, что ещё должен код языка добавляться. А про свою ошибку я уже написал, поправил
X