Dataontsluiting met XML, XQuery en XSLT

Geplaatst op 18-11-2011 door Maarten Marx | eXist, resultaten, XML, XPath, xquery, xslt | | comment image Geen reacties »

Anne Schuth en Maarten Marx hebben een artikel geschreven voor de <!ELEMENT, het blad van de XML Holland user-groep. Het artikel laat zien hoe je met gebruikmaking van alleen maar XML technologie een volledige applicatie kan bouwen. In het artikel wordt het voorbeeld van een video zoekmachine helemaal uitgewerkt.

  • Link naar het artikel
  • Anne Schuth and Maarten Marx, Dataontsluiting met XML, XQuery en XSLT. <!ELEMENT Vol 17, Nr 2, p. 21-25, 2011.

Text preserving transformations

Geplaatst op 31-01-2011 door Anne | Political Mashup, xslt | | comment image Geen reacties »

We take all interviews (by Marianne Winslett) in pdf format from http://www.sigmod.org/publications/interview and pull each of them through a sequence of processors to arrive at clean and structured xml.

Below is an example of the interview with Serge Abiteboul, with underneath the tools/schema’s we’ve used.

abiteboul.pdf —> abiteboul.xml —> abiteboul.trans.xml
pdftohtml

(-xml -hidden)

sigmod.rnc xslt transformation

sigmod.xsl

sigmod.trans.rnc

In this example, the input file abiteboul.pdf is transformed with the standard linux tool pdftohtml. The xml output (abiteboul.xml/sigmod.rnc) is then transformed using XSLT (sigmod.xsl) into a cleaner and more structured xml file (abiteboul.trans.xml/sigmod.trans.rnc). | lees verder…