?

Log in

мимоходом (программистское) - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

мимоходом (программистское) [авг. 30, 2004|04:15 pm]
Anatoly Vorobey
[Настроение |задумчивое]

Читал главный юникодный файл. Много думал.
СсылкаОтветить

Comments:
[User Picture]From: gosha
2004-08-30 06:21 am
Поневоле заставляет задуматься...
(Ответить) (Thread)
[User Picture]From: b0rg
2004-08-30 06:24 am
Революцию будем устраивать, или пока подождем? :)
(Ответить) (Thread)
[User Picture]From: tlkh
2004-08-30 06:52 am
У меня есть этот файл с картинками, изданный в виде книги.
Не знаю как насчет думать, но убить этой книгой легко.
(Ответить) (Thread)
[User Picture]From: rukenau
2004-08-30 08:16 am
Мне вот это больше всего понравилось:

4DC0;HEXAGRAM FOR THE CREATIVE HEAVEN;So;0;ON;;;;;N;;;;;
4DC1;HEXAGRAM FOR THE RECEPTIVE EARTH;So;0;ON;;;;;N;;;;;
4DC2;HEXAGRAM FOR DIFFICULTY AT THE BEGINNING;So;0;ON;;;;;N;;;;;
4DC3;HEXAGRAM FOR YOUTHFUL FOLLY;So;0;ON;;;;;N;;;;;
4DC4;HEXAGRAM FOR WAITING;So;0;ON;;;;;N;;;;;
4DC5;HEXAGRAM FOR CONFLICT;So;0;ON;;;;;N;;;;;
4DC6;HEXAGRAM FOR THE ARMY;So;0;ON;;;;;N;;;;;
4DC7;HEXAGRAM FOR HOLDING TOGETHER;So;0;ON;;;;;N;;;;;
4DC8;HEXAGRAM FOR SMALL TAMING;So;0;ON;;;;;N;;;;;
4DC9;HEXAGRAM FOR TREADING;So;0;ON;;;;;N;;;;;
4DCA;HEXAGRAM FOR PEACE;So;0;ON;;;;;N;;;;;
4DCB;HEXAGRAM FOR STANDSTILL;So;0;ON;;;;;N;;;;;
etc.

А вообще-то, из каких компонентов состоят эти строки? Можно ли первый код (4DC7, например) перевести в HTML-форму?
(Ответить) (Thread)
[User Picture]From: rukenau
2004-08-30 08:32 am
А, уже дошло, кажется. Можно записать в форме &#x + hex;, а можно в форме &# + decimal;. Если я правильно понимаю, конечно.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2004-08-30 08:52 am
Ага.
(Ответить) (Parent) (Thread)
[User Picture]From: liveuser
2004-08-30 08:22 am
Увидел много LOL и CooL. :-)
Больше ничего не понял.
(Ответить) (Thread)
(Удалённый комментарий)
[User Picture]From: moon_aka_sun
2004-08-30 01:30 pm
Тогда уж так:
Читал главный юникодный файл. Нассал под креслом.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2004-08-30 02:11 pm
Можно и так, да ;)
(Ответить) (Parent) (Thread)
[User Picture]From: averros
2004-08-30 05:04 pm
...держу талмуд Unicode 3.0 дома на книжной полке...

На самом деле, Unicod - довольно бредовая идея. Просто потому что кроме рисования текста на экране или листе бумаги с ним ещё нужно уметь как-то работать. Например, сравнивать строки игнорируя case или не-обязательную диакритику. Или сортировать по алфавиту, не обязательно в совсем "каноническом" порядке (которым всё равно никто уже давно не пользуется - см. правила сравнения строк во французском). Или, наконец, просто делать spell checking.

Всё это можно делать в Unicode только если известен язык, на котором написан текст. А если известен язык, то на кой чёрт нужно иметь уникальные code points для глифов? У каждого языка они всё равно свои - и во многих случаях многобайтовая кодировка нафиг не нужна. Как кодировка, Unicode - избыточен, но при этом не несёт в себе действительно полезной информации (а именно - код языка, а не алфавита).

Да, а для того, чтобы был известен язык, Unicode приходится окружать какой-либо лабудой вроде locale или rich text format. Просто текст на Unicode можно только изобразить.

Я когда-то пытался эти простые мысли донести до творцов стандарта, но был послан нафиг на основании того, что "мы же проделали большую работу, и теперь не можем ничего поменять". Сподвигнули меня на написание бумажек по поводу более разумной альтернативы.

Но, поскольку я тварь крайне ленивая, да и работы хватает, оно так в воздухе и повисло. Если кому интересно: Rosetta encoding.
(Ответить) (Thread)
[User Picture]From: ypq
2004-08-30 10:17 pm
предупреждать надо, что там 900 кил! :)
(Ответить) (Thread)