?

Log in

No account? Create an account
библиотека "Артефакт", тексты на языках оригиналов - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

библиотека "Артефакт", тексты на языках оригиналов [май. 8, 2002|04:43 pm]
Anatoly Vorobey
Хорошая сетевая библиотека: Артефакт

Хороша в первую очередь наличием большого кол-ва оригинальных текстов. Например, "Satanic Verses" Рушди. Или весь Лем по-польски.

Довольно много там всего.

Главный недостаток: все тексты - в вордовских файлах. Хранитель библиотеки этим гордится и специально в них всё переводит. Ну нет больше сил, товарищи. Опускаются руки. Как, как объяснить??
СсылкаОтветить

Comments:
[User Picture]From: asterius
2002-05-08 06:48 am

Объясните мне, чтобы я не повторял их ошибок?

Как, в чем хранить?
(Ответить) (Thread)
[User Picture]From: silpol
2002-05-08 07:01 am

PDF или old good plain text ...
(Ответить) (Parent) (Thread)
[User Picture]From: bleys
2002-05-08 06:50 am
Объяснить, что PDF-reader, в отличие от Word, бесплатен =)
(Ответить) (Thread)
[User Picture]From: zimopisec
2002-05-08 07:21 am
А почему? Я тоже люблю ворд и ненавижу pdf.

ПАТАМУШТА В ПИДИЭФ НЕВОЗМОЖНО ПОСТАВИТЬ ЗАКЛАДКУ!
И НАЙТИ СЛОВО В ТЕКСТЕ!

(Кстати, давно надо договориться с моим бывшим начальствием и открыть для публики когда-то написанную мной читалку, которая позволяет отыскивать не отдельно взятое слово, но любое слово из списка)
(Ответить) (Parent) (Thread)
From: 9000
2002-05-08 08:22 am
Если б в PDF нельзя было найти слово в тексте, я бы давно умер, работая с доками по Oracle. Hint: Ctrl+F или из контекстного меню по правой кнопке ;-)

Eжели б .doc был так же открыт и бесплатен, как .pdf, было б всё равно. Ан нет-с.

Читалка с поиском некольких слов -- мудро. В идеале у неё вообще должен бы быть интерфейс, как у google или altavista, т. е. искать не одно тупое слово и даже не regexp.
(Ответить) (Parent) (Thread)
[User Picture]From: zimopisec
2002-05-08 09:46 am
В той вводился список, разделенный запятыми- и можно было прыгать от первого ( в порядке отыскания в тексте) ко второму и так далее- более того, можно было ввести несколько списков- и появлялась линейка, на которой высвечивались разноцветные точки ( каждому списку цвет, каждому найденному в тексте слову- точка, местонахождение точки на линейке соответствует позиции слова в тексте, клик в точку вызывал прыжок на соответствующее место в тексте. Плюс я понаписал конверторов из ворда , эртэээфа и хатиэмэля, так что читать можно было все, что угодно, в одном окне( только частично теряя форматирование, что в общем-то только удобнее)
(Ответить) (Parent) (Thread)
From: 9000
2002-05-08 09:48 am
Красота :-) Опубликуйте -- и Adobe с MS быстренько своруют эту идею $-)
(Ответить) (Parent) (Thread)
[User Picture]From: zimopisec
2002-05-08 09:58 am
Фигли :((

Все захапал шеф бывший и сидит на всем этом, как собака на сене.

Связываться неохота. А переписать снова и по-другому, чтобы чистенько было- некогда.
(Ответить) (Parent) (Thread)
[User Picture]From: toshick
2002-05-08 12:04 pm
Это Вам сильно не повезло.

Некоторые (например, в таком формате лежат старые журналы на mises.org) сканируют текст и объявляют постраничные картинки pdf'ом. Красиво, конечно - тридцатистраничная статья на полтора мегабайта, и действительно нихрена не найти и нихрена не скопировать. Разве что OCR развлекаться.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2002-05-08 12:21 pm

Re:

Фиг с ним с PDFом (хотя искать там можно).
Но как можно агитировать за распостранение текстов в Ворде - это выше моего понимания.
(Ответить) (Parent) (Thread)
[User Picture]From: 37
2002-05-08 09:38 am
WordReader точно также бесплатен (http://office.microsoft.com/downloads/2000/wd97vwr32.aspx)
(Ответить) (Parent) (Thread)
[User Picture]From: bleys
2002-05-08 09:40 am
Оттуда же:

System Requirements for Using Word Viewer
* A personal computer with a 486 or higher processor
* Microsoft Windows® 95 operating system or Microsoft Windows NT®
Workstation operating system 3.51 or later

А *ix-оидам что делать?
(Ответить) (Parent) (Thread)
[User Picture]From: 37
2002-05-08 09:44 am

Re:

Use Star Office :-))))
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2002-05-08 12:22 pm

Re:

Да я и PDF не особо люблю для такой цели. Но уж всяко лучше, чем Ворд, да.
(Ответить) (Parent) (Thread)
[User Picture]From: i_shmael
2002-05-08 06:51 am
Мало того, там и Midnight's Children!
(Ответить) (Thread)
[User Picture]From: alexpgp
2002-05-08 07:51 am

Take a look at this.

Cheers...
(Ответить) (Thread)
From: 9000
2002-05-08 08:23 am
Скачивать, переводить в PDF / HTML / TXT и выкладывать ещё где-то :-) Он к зеркалам нормально относится?
(Ответить) (Thread)
[User Picture]From: avva
2002-05-08 12:20 pm

Re:

Да у меня нету даже Ворда, ну не пользуюсь я им! Есть какой-то 97 старый, но он глючит и виснет через раз.
ДЛя просмотра, если уж очень надо, я пользуюсь бесплатным Viewer'ом, а он никуда ничего не переводит.
(Ответить) (Parent) (Thread)
From: 9000
2002-05-13 12:58 am

Нету ворда

Во-первых, есть для win32 родная M$-овская смотрелка.
Во-вторых, есть (на всех разумных платформах) бесплатный OpenOffice -- очень неплохо работает с doc-форматом; я им вообще вместо ворда пользуюсь :-)
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2002-05-13 08:35 am

Re: Нету ворда

Родной смотрелкой я и пользуюсь, да.
А OpenOffice ещё не смотрел, попробую как-нибудь, спасибо ;)
(Ответить) (Parent) (Thread)
(Удалённый комментарий)
[User Picture]From: zimopisec
2002-05-08 09:47 am
А нормальные люди у ворда макросы отключают и включают только в особо проверенных случаях.
(Ответить) (Parent) (Thread)
(Удалённый комментарий)
[User Picture]From: zimopisec
2002-05-08 10:26 am
Ну, если б я знал, что форзацы и шмуцтитулы делаются из материала, с достаточно большой вероятностью зараженного сибирской язвой :))
(Ответить) (Parent) (Thread)
[User Picture]From: lz
2002-05-08 09:58 am

Что, простите,

Вы разумеете под "тратить".
Всегда приятнее читать отформатированный текст (поэтому txt отпадает).
Иногда хочется распечатать - тогда html тоже не катит. Так что PDF - наиболее универсальный формат. Тяжелый только, зараза. :-)
(Ответить) (Parent) (Thread)
(Удалённый комментарий)
[User Picture]From: lz
2002-05-08 10:43 am

Re: Что, простите,

Шура, html не предназначен для печати. Никак. Просто этого нет в идеологии языка. В частности нет понятия "страница". Нет колонтитулов. Нет сносок (нормальных).

Т.е. вывести на печать, конечно, можно. Но и только.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2002-05-08 12:18 pm

Re: Что, простите,

Есть программы, хорошо форматирующие txt (и для печати тоже, напр. a2ps).

У PDF проблема не только в том, что большой, а и в том, что труднообрабатываемый.
(Ответить) (Parent) (Thread)
[User Picture]From: lz
2002-05-08 12:37 pm

Re: Что, простите,

Это понятно. Но жесткие концы строк - мука мученическая, масштабировать тяжело.
Да и выделять фрагменты текста и размещать картинки не позволяет, что в моей области (техдокументация) важно.
А PDF обладает еще одним достоинством: он представляет собой единое целое. Т.е. ни один криворукий заказчик не может "потерять" картинки, шрифты, стили и пр.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2002-05-08 01:32 pm

Re: Что, простите,

Насчёт технической документации - пожалуй, соглашусь.
Но насчёт сплошного текста, скажем, романа - PDF всё же неудобен, по-моему. Идеальное решение тут состоит в правильно маркапнутом XMLном файле (из которого уже худа хошь - хоть в PDF), я приемлемое - plaintext или минимально размеченный для удобства чтения HTML.
(Ответить) (Parent) (Thread)
[User Picture]From: lz
2002-05-08 01:55 pm

Re: Что, простите,

Да, согласен. XML - вообще вне конкуренции, только квалификация для его создания нужна несколько иная.
Для романов и научных статей все же на мой вкус предпочтительнее HTML - оглавления всякие, примечания. Да и переформатировать проще.
(Ответить) (Parent) (Thread)
[User Picture]From: nslu
2002-05-08 10:57 am
кхе-кхе, а мы-то на мошковский preformatted text роптали. жаль. футорологический конгрес по-польски - это не хухрымухры!
(Ответить) (Thread)
[User Picture]From: avva
2002-05-08 12:17 pm

Re:

До чего вы там договорились в результате?
Мне кажется очевидным, что для серьёзной обработки и структуризации текста нужен XML. А потом уже из него делать PDF/PS/вообще чего захочется.
(Ответить) (Parent) (Thread)
[User Picture]From: nslu
2002-05-08 01:30 pm

ни к чему мы не пришли, вышел чистой воды флейм.

мнения разделились, каждый истолковал задачу как хотел:

  • простенький dtd из дюжины тегов, чтобы без выпендрежа
  • полноценный dtd, бишь docbook/xml -- всем лень читать документацию
  • и я выступал за ручную верстку в TeX. поскольку я не особенно вижу какой там может быть data processing для художественной литературы. оглавление в html можно и из TeX'а выгнать

еще зависит от источника: я как-то рассматривал только перевод из preformatted текстов с мошкова. и это, кстати, оказалось неэлементарно -- как, например, если не руками, побеждать насильные переносы в словах?

(Ответить) (Parent) (Thread)
[User Picture]From: nslu
2002-05-09 02:46 pm
когда нужно что-то делать самому, я очень непривередлив.
сегодня, в свободное от работы рабочее время, я сляпал маленький скриптец,переводящий мошковские prefomatted тексты в LaTeX.

http://myxomop.com/libru/

в качестве примера там лежат postscript'ы лем - урановые уши и набоков - подвиг, последний с ятями и фитами. бумага -- us-letter, в две колонки, много места снизу и сверху -- мне так читать удобнее.
можно бы попытаться разобраться в принтере, он как бы mopier, умеет книжицы делать, но я пошел по пути наименьшего сопротивления.
(Ответить) (Parent) (Thread)