?

Log in

о дореволюционной орфографии и книге Кони - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

о дореволюционной орфографии и книге Кони [окт. 22, 2002|06:42 pm]
Anatoly Vorobey
Во время вчерашнего визита в библиотеку я нашёл также замечательную книгу: сборник речей Анатолия Фёдоровича Кони, знаменитого русского юриста. Он был издан в 1890-м году, и содержит текст некоторых судебных выступлений Кони в 1868-1888 годы; в основном там обвинительные заключения (15 штук), но есть также несколько указаний присяжным (в качестве председателя суда) и кассационных жалоб.

Читать это исключительно интересно. Я бы хотел хотя бы несколько его речей поместить в дневнике, но это, пожалуй, нереально: они довольно длинные, а у меня нет ни сканера, ни OCR-программ. Да я и не знаю, насколько эти программы хорошо справляются с дореформенной отфографией.

Но кроме самих речей, перед каждой речью в книге есть сжатое описание сути данного дела: ход следствия, показания свидетелей, исход дела и даже в некоторых случаях письма подсудимых или свидетелей, которые использовались в качестве свидетельств во время суда. Я не знаю точно, но предполагаю, что эти сжатые описания написал сам Кони (сборник явно издавался с его ведома, и в нём есть его предисловие); так или иначе, мне они показались столь же интересными, как и сами речи, а в отдельных случаях и более интересными. Каждое описание - словно небольшой рассказ, позволяющий (сейчас будут какие-то дежурные банальности, извините) лучше понять жизнь тогдашнего общества, привычки и характеры каких-то людей.

Хотя бы два-три таких описания дел я хочу поместить в журнале, но тут есть одна техническая сложность. Я очень хочу оставить неизменной орфографию оригинала (дореволюционную). Сделать это не так уж просто. Вместо "десятеричного и" можно использовать латинское i, от него неотличимое. Вместо фиты - греческую тету: Θедор (надеюсь, всем хорошо видно). А вот с ятем есть серьёзная проблема; в Юникоде для него есть, конечно, символ, но, насколько я понимаю, далеко не у всех юзеров установлены фонты, которые его показывают.

Вот несколько разных методов, с помощью которых я могу попробовать изобразить букву ять в дореволюционных текстах; мне хотелось бы получить от читателей дневника информацию о том, какой из них "работает" у всех или почти у всех. И тогда именно его я и использую.
  1. "настоящая" буква ять в Юникоде; в HTML её пишут так: Ѣ (большая) и ѣ (маленькая); или в десятичной записи Ѣ (большая) и ѣ (маленькая). Вот пример слов с этой буквой, по которому можно проверить, хорошо ли она видна: слова "дело" и "ДЕЛО" строчными и прописными буквами через ять.
    дѣло ДѢЛО

    (кстати, я читал где-то, уже не помню где, что лучше писать HTML entities в десятичной записи, а не в шестнадцатиричной; если кто-то знает точно, расскажите)
  2. Следующий способ: использовать сербскую букву, похожую на ять, в надежде на то, что она встречается в большем репертуаре фонтов. Вот она в этих словах (Юникодные коды 0x402 и 0x452):
    дђло ДЂЛО
  3. ещё один вариант - использовать ту же "похожую" букву, но только в её прописном варианте, т.к. он особенно похож на обычную печатную ять:
    дЂло ДЂЛО
  4. ещё один вариант - латинская строчная буква h (несколько похожая на рукописную строчную ять). Этого бы очень не хотелось.
    дhло ДhЛО
  5. следующий вариант - картинка вместо каждой буквы. Показывать, как это выглядит, не буду. Самый неприятный для меня с эстетической точки зрения, кроме следующего и последнего.
  6. Последний вариант - просто использовать "е" вместо яти. Самый нежелательный с моей точки зрения.

Вот вроде бы и всё. Хотелось бы узнать, что лучше видно, и есть ли какие-то другие варианты, которые я упустил, или какие-то ещё мнения специалистов (только желательно прочитать написанное в комментах к тому времени -- если какая-то реакция уже много раз высказывалась, можно не повторять, наверное).

P.S. Ижицей и прочими очень редкими буквами я считаю возможным пренебречь в этом случае, да.
СсылкаОтветить

Comments:
From: ex_ilyavinar899
2002-10-22 09:55 am
С Windows NT распространяется шрифт Palatino Linotype, включающий в себя ять.

Еще вариант: <STRIKE>ь</STRIKE> = ь.
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 09:58 am
Windows NT мало у кого есть, наверное.
Вариант с перечёркнутым мягким знаком интересный, спасибо.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: zhenyach
2002-10-22 09:58 am
1 - не видно (квадратики вместо букв).
2,3 - в ленте видно, причём 3 вполне красиво. На странице самого постинга - другой шрифт, и всё уже не так красиво.
(Ответить) (Thread)
[User Picture]From: smirnoff
2002-10-22 10:03 am
в стародавние времена я, не знаючи слова Юникод, использовал вариант с картинками:
например...
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:52 pm

Re:

Выглядит на удивление прилично, спасибо за совет.
Но как-то у меня ну очень душа не лежит к запихиванию такого кол-ва картинок, по картинке вместо каждой буквы. Эстетическое неприятие, не очень рациональное.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: boriskus
2002-10-22 10:03 am

OFFTOPIC

Простите за оффтопик, я думаю, что вам следует почитать вот это: http://www.livejournal.com/talkread.bml?journal=happyidiots&itemid=22441
(Ответить) (Thread)
[User Picture]From: gera
2002-10-22 10:10 am

Re: OFFTOPIC

Это просто песня :)
Made my day :)
(Ответить) (Parent) (Thread)
[User Picture]From: alexcohn
2002-10-22 10:04 am

зачем так сложно

Можно выставить в HTML фонт, встречающийся в Win2K и многих других местах, "Arial Unicode MS", в котором &#x0463 есть: дѣло ДѢЛО. Но вообще-то тексты Кони, по-моему, интересны независимо от орфографии, и не только потому, что его фамилия похожа на мою.
(Ответить) (Thread)
[User Picture]From: toshick
2002-10-22 10:22 am

Re: зачем так сложно

Угум, только в IE 5.1 видны квадратики.
(Ответить) (Parent) (Thread)
[User Picture]From: sheb
2002-10-22 10:12 am
Вижу всё кроме №1.
(Ответить) (Thread)
[User Picture]From: cax
2002-10-22 10:19 am

Браузериада

Проверял на XP в Опере 6 и MSIE 6.
Вижу всё кроме (1) и кроме варианта alexcohn.

Но:
Мозилла показывает всё без исключения.
(Ответить) (Thread)
[User Picture]From: alexcohn
2002-10-22 10:32 am

Re: Браузериада

а Palatino Linotype показывает? дѣло ДѢЛО дѣло ДѢЛО
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: motto
2002-10-22 10:25 am
забавно.
IE 6/0, win2K -- вариант 1 квадратиками.
Mozilla 1.1 (Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.1) Gecko/20020826)

под той же win2k -- "ять" отлично видно, но мазила тормозила (похоже, разобралась что в шрифтах выставляемы стайлшитом от /talkpost.bml нужного символа нет, нашла шрифт, где буква есть (это видно по начертанию, да, шрифт другой) и нашла какой-то компромиссный вариант, но на этом нашла какую-то багу у себя внутри, и скрючилась)

Да, в ленте мазилла нарисовала тоже правильно, тоже заменив шрифт, и похоже, тоже с тормозами.
опера, разумеется не смогла, НН4.хх даже и не пробовал
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:51 pm

Re:

Да, Мозилла находит Paladino Lynotype видимо или как там его, в этих системах.
(Ответить) (Parent) (Thread)
[User Picture]From: stas
2002-10-22 10:28 am
у меня на юниксе первый не видно (что не удивительно - у меня, небось, и фонта-то такого нету с ятями), а вот все остальные видно.
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 10:32 am

Re:

А какой из них больше всего нравится?
(Ответить) (Parent) (Thread) (Развернуть)
From: bbb
2002-10-22 11:16 am
Седьмой нетскейп - вариант 1 читается нормально.

А если не секрет - в чем необходимость обязательно поддерживать ять? Много ли случаев смыслового значения, которое теряется без ятя?

Предполагается ли сохранять твердый знак в конце слов?
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 02:23 pm

Re:

Нет, честно говоря, какой-то действительной необходимости. Просто хочется попробовать в этот раз сохранить старую орфографию, я люблю в ней читать (для, предполагается сохранить твёрдые знаки, написания типа ея и разспрос итп.)

Надеюсь, что не будет слишком тяжело читать тем, кто не привык, текст-то хороший.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: dmtr
2002-10-22 11:17 am
Я бы предложил сербскую "ђ" как наиболее похожую и точно присутствующую у всех.
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:47 pm

Re:

Именно, ђ не Ђ? Мне кажется, что строчная рукописная (или курсивная) ять просто мало кому знакома, Ђ намного более узнаваема, если иметь в виду среднего читателя.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: iseg
2002-10-22 11:20 am
Писать надо пожалуй ѣ и т.п. Не стоит пользоваться "похожими" буквами. По многим причинам (есть например невизуальные агенты, Яндекс, скажем при индекисровании заменят ё и ять на е и т.д.).

Микрософт, к сожалению, закрыл в августе страничку Microsoft Core Fonts for Web (из-за Линукса, по-видимому). Там было с десяток WGL4 шрифтов плюс описание того с каким офисами браузерами и операционками распространяется та или иная версия того или иного шрифта. Из этих шрифтов ять есть в "Arial Unicode MS" и "Lucida Unicode". Именно на эти шрифты в общем безопасно ссылаться в HTML-е. Как запасной вариант можно использовать пару бесплатных bitstream-овских шрифтов, но они почему-то очень некрасивые. И их надо просить скачивать и устанавливать. Что неуждобно. Видел я в интернете и страничку про это, там еще парочка маленьких бесплатных русских шрифтов лежала.

Что касается браузеров, то в 4-м Нетскейпе на кодовую табличку при отрисовке отводилось 256 символов, поэтому хотя он и поддерживает unicode entities, ять видно не будет. 4-й эксплорер не понимает конструкции "#x". Есть и еще нюансы.

Все что здесь написано более-менее относится и к знаку ударения.
(Ответить) (Thread)
[User Picture]From: iseg
2002-10-22 11:25 am
Да и, кстати, в советские годы Кони много печатали. У меня была его книга. Я ее читал. Довольно толстая и без ятей. Думаю, что стоит поискать ее.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: rydel23
2002-10-22 12:51 pm
Первый не вижу. Третий наиболее приемлемый визуально (но не семантически).
(Ответить) (Thread)
[User Picture]From: rydel23
2002-10-22 01:00 pm

Вместо "десятеричного и" можно использовать латинское i.

Я думаю, можно спокойно использовать белорусское/украинское і (U+0456), так как если русский отоброжается нормально, то в 99.9% эта буква тоже показывается нормально. Так, имхо, правильнее.
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:46 pm

Re:

Спасибо, я подумаю. Это всё-таки уже не так критично (хотя я согласен, что в принципе правильнее).
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: cema
2002-10-22 01:04 pm
Я все варианты вижу нормально, но для этого у меня специально скачаны шрифты. Во-первых, знаменитый Майкрософтовский Arial Unicode, сделанный, как я понимаю, фирмой www.monotype.com Monotype. Он, правда, в сжатом состоянии занимает до хрена места:

        321) 7:34am [cema@trip:pts/1]           Tue, Oct 22, 2002               
/mnt/windows --> ls -l Aruniupd.exe 
-rwxrwxrwx    1 root     root     14016168 Jun 21 23:19 Aruniupd.exe


И, как видите, сжат в exe-файл, т.е. запустить его можно только из-под Windows (или, возможно, через wine в Linux'е, не пробовал). Ну, короче, я его поставил.

http://zsigri.tripod.com/fontboard/cjk/cjksupp.html
Microsoft no longer offers it for download but you can still get it from the following sites:
list enclosed.

Кроме того, бывают специальные шрифты с древнерусскими буквами, они как раз небольшие. Но нормального юникодова шрифта небольшого размера и с дореформенными буквами я не знаю.

Короче, рассчитывать на юникод, пожалуй, пока не стоит.
(Ответить) (Thread)
[User Picture]From: tejblum
2002-10-23 02:55 am
И, как видите, сжат в exe-файл, т.е. запустить его можно только из-под Windows (или, возможно, через wine в Linux'е, не пробовал).

Я тут как раз выясняю, как на моих юниксных машинах поставить TTF шрифты. Оказалось, что это скорее .cab, чем .exe, и распаковать его можно программой cabextract без всякого wine
(Ответить) (Parent) (Thread)
From: ex_innin997
2002-10-22 01:17 pm
видно, всё кроме первого. Из работающих, наверное, предпочительней второй?
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:34 pm

Re:

Второй или третий, видимо. Строчная буква во втором довольна малоизвестна тем, кто не читал много дореформенных текстов. Многие её просто не знают, а "печатную ять" все где-нибудь да видели. Это аргумент в пользу третьего.
(Ответить) (Parent) (Thread)
From: ex_innin997
2002-10-22 01:24 pm
кстати, вариант с подгрузкой шрифта через CSS не рассматриваете?
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:35 pm

Re:

Неа. Я даже не знаю, как это делается, и не уверен, что понимаю. Что значит с подгрузкой - CSS может инструктировать браузер скачать с сети фонт, к-го на компьютере нет? Как? И если такое возможно, вряд ли я захочу, это как-то даже невежливо выглядит ;)
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: b_k
2002-10-22 02:41 pm
Первыы - не видно. Для глаза (моего)приятнее всего третий.
(Ответить) (Thread)
[User Picture]From: yms
2002-10-22 03:23 pm
ВстрЪчалъ еще вполнЪ читабельный и самый легкореализуемый варiантъ: большой "Ъ" вместо "яти".
(Ответить) (Thread)
[User Picture]From: avva
2002-10-22 03:33 pm

Re:

Как-то оно совсем... того... уродливо ;(
(Ответить) (Parent) (Thread)
[User Picture]From: piggymouse
2002-10-22 11:56 pm

Сообщение по делу: под Windows 2000 в Мозилле 1.1 видны все варианты, в MSIE 6 не работает "честный" вариант 1. Полностью предсказуемый вариант. Что касается варианта с явно указанным шрифтом, он работает и там, и там.

Немного мыслей off-topic. Возможно, мой подход слишком программистский, однако я считаю правильным: (а) в "плане содержания" пользоваться только "честными" юникодовскими символами (в данном случае ятями U0462 и U0463); (б) в "плане выражения" пользоваться всеми доступными средствами для облегчения участи читателей, не вооружённых инструментами с полноценной поддержкой Юникода (в данном случае явным указанием шрифта). Насколько я понимаю, Вашей целью является публикация текста именно в оригинальной орфографии, а ни один из паллиативных вариантов эту задачу не решает (не говоря уже о картинках, даже вариант с сербским алфавитом не проходит, ибо Кони не использовал сербский алфавит). Юникод (в виде соответствующего стандарта ISO/IEC) с нами всерьёз и надолго, так что, с моей точки зрения, надо работать на перспективу.

Резюме: я бы рекомендовал вариант с "честными" ятями и явным указанием Unicode-enabled шрифта.

Кстати, вот Вам пример неудачного решения подобной проблемы. Товарищи пошли по радикально "нестандартному" (в смысле несоответствия стандартам) пути, поставив себе целью оптимизировать отображение текста в конкретном браузере (разумеется, MSIE). В результате их текст не отображается в других браузерах (кстати, более "соответствующих") и не может быть использован в мирных целях путём "copy-paste" или "save as".

(Ответить) (Thread)
[User Picture]From: sema
2002-10-23 12:03 am
Полностью согласен с этим оратором, кстати.
(Ответить) (Parent) (Thread)
From: (Anonymous)
2006-06-08 11:08 am
к сожалению, ять корректно отобразить, все-таки невозможно - в смысле, независимо от шрифтов.
Но предложу еще один вариант имитации (для строчных букв):

вотъ такое дbло

внутри большого текста смотрится вполне ничего
(Ответить) (Thread)