April 3rd, 2002

moose, transparent

тексты в XML: некоторые ссылки и заметки

Несколько важных линков.

  • Проект LatinML: маркап классических латинских текстов в XML. Пример стиха Катулла в маркапе с внутренним DTD (все названия элементов в латыни, ну молодцы). Преобразование в HTML при помощи XSL (давно пора разобраться с XSL - заметка себе).

  • Проект lector longinquus: очень много латинских текстов в хорошо машинно-читаемой форме; Катулл и Гораций уже переведены в XML предыдущего проекта, остальные пока в HTML.

  • http://www.heml.org - очень интересная задумка, DTD и XML-схемы для маркапа исторических событий. Посмотреть пристальнее.

  • Cocoon - платформа для разработки/выдачи XML-документов; преобразует на лету в HTML/PDF и т.п., бежит как Java servlet.

Задание себе: найти и сравнить основные схемы разметки исторических документов, литературных источников, вообще любых primary sources. Что-то было где-то по поводу medieval English texts, сейчас не помню. Ещё пример: церковнославянская библия (у них доморощенная текстовая схема разметки, но, должно быть, легко переводима в XML; правда, Ян? ;))
Какие есть удачные схемы разметки вне XML? Есть ли в них что-то, что затрудняет такую же схематизацию, но в XML? Ограничиваю ли я себя в чем-то привязкой к XML с точки зрения гибкости маркапа? Обдумать.