?

Log in

No account? Create an account
arnabitur - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

arnabitur [июл. 9, 2003|06:03 pm]
Anatoly Vorobey
О том, как распостраняются ошибки OCR:

arnabitur — 35 страниц.

Странное слово, встречающееся во всей только в одном месте: в тексте рассказа Бунина "Руся" (из сборника "Тёмные аллеи"). Встречается там как часть латинской фразы "Amata nobis quantum arnabitur nulla!"

На самом деле, конечно, не arnabitur, а amabitur — "будет любимой". А вся фраза —
"Amata nobis quantum amabitur nulla" — из восьмого стиха Катулла, означает примерно "любима нами, как никто любим не будет".

Видимо, все тексты рассказа "Руся" в сети происходят из одного источника. Ни одного текста с правильным латинским словом в сети нет.
СсылкаОтветить

Comments:
[User Picture]From: lz
2003-07-09 08:16 am

http://mwclub.narod.ru/rusia.htm

Нельзя доверять одной искалке, даже если это Гугл ;-)

Яндекс - ищущий да обрящет
(Ответить) (Thread)
[User Picture]From: avva
2003-07-09 08:17 am

Re:

Ух, уели ;-)
(Ответить) (Parent) (Thread)
From: drw
2003-07-09 08:27 am
Только не «ух, уели», а «ох, уели». ;-)
(Ответить) (Parent) (Thread)
[User Picture]From: lz
2003-07-09 08:32 am
Ну, это я не чтобы...

Просто сейчас приходится много разных цитат искать в инете (не понимаю, как комментаторы текстов жили в доинтернетную эпоху), в процессе выяснилось, что гугл и яндекс очень удачно друг друга дополняют.
В яндексе, например, по понятным причинам намного лучше проиндексированы сайты на народ.ру
(Ответить) (Parent) (Thread)
From: (Anonymous)
2003-07-09 09:11 am

For future

А на французском сайты лучше всего по yahoo.fr искать. Потому как он (yahoo) - большой...
(Ответить) (Thread)
[User Picture]From: prokofyev
2003-07-09 09:51 am

Примерно так биологи определили, что, скажем, млекопитающие возникли только один раз, и потом расселились по планете.
(Ответить) (Thread)
[User Picture]From: onsamyi
2003-07-09 10:38 am

хорошо, хрестоматийно даже, я бы сказал.
(Ответить) (Thread)
[User Picture]From: amddiffynfa
2003-07-09 11:40 am
"О том, как распостраняются ошибки OCR"
...a также и о том, как расПОСтраняются ошибки печатанья ;)
(Ответить) (Parent) (Thread)
[User Picture]From: doriy
2003-07-09 10:45 am
Так зародилась сетевая генетика :)
(Ответить) (Thread)
[User Picture]From: dkuzmin
2003-07-09 03:41 pm
Вот это какие-то специальные люди все-таки - которые, обнаружив на чужом сайте кем-то другим оцифрованный текст, гордо перевешивают его к себе. Зачем это нужно делать? И зачем нужны такие люди? Не лучше ли было бы их удалить с сервера?
(Ответить) (Thread)
[User Picture]From: avva
2003-07-09 06:11 pm

Re:

Ну я не знаю вообще-то. Не вижу ничего особенно зазорного в перекладывании текстов для создания целой сетевой библиотеки, например. Особенно если тот, кто оцифровал, не против.

Лучше иметь текст на десяти серверах, чем на одном, т.к. один всегда может куда-то пропасть.
(Ответить) (Parent) (Thread)
[User Picture]From: 0qwerty0
2003-07-10 01:09 am
cf. zamt transfomad into zanit (now zenith) - w/o digital OCRs etc.
(Ответить) (Thread)
[User Picture]From: ok_66
2003-07-10 03:10 am
Видимо, все тексты рассказа "Руся" в сети происходят из одного источника.
С той же степенью достоверности можно предположить, что эти тексты происходят из разных источников, но распозновались одной программой.
(Ответить) (Thread)
[User Picture]From: avva
2003-07-10 07:59 am

Re:

Одна и та же программа далеко не всегда совершит одну и ту же ошибку - это зависит от книги, из которой сканировали, от освещения, от того, как она лежала, итп.

Конечно, ошибка m<->rn одна из самых типичных, но, тем не менее, современные программы в большинстве случаев правильно распознают.
(Ответить) (Parent) (Thread)
From: (Anonymous)
2003-07-13 06:37 am
В словаре Даля есть трогательная окаэринка: вместо прописной буквы "П" слэш и семёрка. Сидит во всех решительно сетевых вариантах, включая мой. ( /7ыль столбом стоит )
http://vidahl.agava.ru/cgi-bin/dic.cgi?p=221&t=38921

Арнольд.
(Ответить) (Thread)
[User Picture]From: avva
2003-07-13 09:36 am

Re:

Замечательно ;)

А почему ты не исправляешь?
(Ответить) (Parent) (Thread)
From: saccovanzetti
2006-12-21 06:33 pm
Читаю сейчас этот рассказ (навеяно Вашим опросом).
Сделал поиск в Гугле на фразу.
Нашел этот Ваш пост трехлетней давности.

P.S. Эх, Иван Алексич, Иван Алексеич. Зачем душу травите :)
(Ответить) (Thread)