Bravo à Dave Winer de Userland qui deviendra professeur à Harvard. Bravo à Dave pour son invention de ThinkTank et de More (en passant, on peut même télécharger gratuitement ces très vieux logiciels à partir de ce site). Mais Dave commet une erreur lorsqu'il écrivait que l'utilisation de XML pour les sciences humaines, l'histoire, la littérature serait une nouveauté.
« We're going to bring weblogs to Harvard, and then teach the world what we learn. We know XML is great for engineering and financial applications. But what about XML for the liberal arts, for the humanities? That's something new. »
Il se trompe. C'est là une belle erreur de mémoire ou de méconnaissance. SGML, une norme développée depuis les années 60 mais devenue officielle en 1986, est l'ancêtre conceptuelle de XML. Ou si vous préférez, XML est la version 4.x de SGML. Cette norme a été créée par des gens qui voulaient précisément manipuler du texte, qui désiraient transformer le texte, qui avaient besoin de faire des recherches intelligentes et pointues dans des textes. Ces créateurs, inventeurs et premiers utilisateurs étaient des avocats, des littéraires, des militaires. Même les militaires ne manipulaient essentiellement que du texte... mais des quantités énormes. Peut-être saviez-vous que la documentation technique d'un sous-marin est plus volumineuse que la capacité même du sous-marin?
Une des plus importantes initiatives SGML était le Text Encoding Initiative (TEI). Les projets utilisant ce type de balisage du texte (TEI DTD) sont très « liberal arts and humanities » pour reprendre l'expression de M. Wiener. Non. XML pour les sciences humaines n'est pas du tout une nouveauté. Ça date de plus de 20 ans. Des centaines de milliers de pages de texte, probablement des millions, ont déjà été encodées pour les sciences humaines. Par exemple, vous voulez lire Cervantes, un petit tour à La Biblioteca Virtual Miguel de Cervantes vous le permet... en plus de 8000 autres titres. Ailleurs, il y a aussi des projets en français qui devraient trouver grâce même auprès de la Grande Rousse, si elle ne les connaît pas déjà.
D'ailleurs, deux importants projets SGML-XML auxquels j'ai participé étaient de nature très texte et non-pas échange de données: la loi de l'impôt du ministère du Revenu et la transcription des débats à l'Assemblée nationale du Québec. ;-)
Laissez un commentaire