Over ontologieën
Tegenwoordig is web 2.0 in de bibliotheekwereld een ingeburgerd begrip. Er dient zich echter al een volgende fase aan in de ontwikkeling van het www: het semantische web of web 3.0.
Over deze volgende versie van het web gaat Finding the concept, not just the word: a librarian’s guide to ontologies and semantics.
Brandy King en Kathy Reinold doen hierbij nauwelijks of geen uitspraken over de toekomst van de bibliotheek. Veeleer dan beschouwingen geven ze de bibliothecaris een concrete technische uitleg. Ontologieën bevinden zich immers op de kruising van taalkunde en technologie. Voor wie al bekend is met classificaties en thesauri, zal dit evenwel vertrouwd overkomen. Kort gezegd gaat het bij een ontologie over een verzameling van concepten en de relaties daartussen, bedoeld om de computer binnen een bepaald kennisgebied de betekenis achter natuurlijke taal te laten begrijpen.
Eerst leggen de auteurs het verschil uit tussen een Booleaanse en een semantische zoekvraag. Daarbij komen begrippen ter sprake als natural language processing, parsers, precisie en vangst.
Vervolgens leer je aan de hand van een duidelijk voorbeeld hoe een ontologie in negen stappen kan worden opgebouwd.
Daarna volgt het verslag van vier boeiende case studies. MINDSWAP’s Profiles in Terror project spreekt daarbij het meest tot de verbeelding: doordat ontologieën verbanden tussen informatie zichtbaar maken, kunnen ze helpen in de strijd tegen het terrorisme.
Verderop in het boek komen enkele meer geavanceerde onderwerpen aan bod. Zo krijg je een overzicht en onderlinge vergelijking van de talen waarin ontologieën kunnen worden uitgedrukt: XML, RDF, OWL en SKOS. Ook wordt de nodige aandacht besteed aan software om ontologieën te creëren, visualiseren en beheren.
Tot slot hebben King en Reinold het over de rol van de bibliothecaris met betrekking tot het semantische web. In de toekomst zal hij niet langer de intermediair zijn die de vraag van de gebruiker vertaalt naar de zoekmachine, maar moet hij de zoekmachines mee helpen betekenis geven, zodat gebruikers zelf hun vragen kunnen stellen in hun eigen natuurlijke taal. Een bibliothecaris is volgens de auteurs immers perfect geplaatst om termen te categoriseren en relaties te definiëren.
Hiermee wordt afgeweken van het web 2.0 gedachtegoed: ontologieën zijn niet het domein van de gebruikers of het ‘volk’, maar worden gebouwd door experten die bepalen wat de meest belangrijke concepten en relaties binnen een bepaald interessegebied zijn.
Is ontologieën creëren werkelijk de toekomstige taak van de bibliothecaris? Gezien de tijd, mankracht en gelden die de verwezenlijking van het semantische web vraagt, lijkt deze visie me wat kort door de bocht.
Maar, ook al ontbreekt enige nuancering ten aanzien van andere methodes van informatieontsluiting, dit is zonder meer een zeer verhelderend boek over het wat en hoe van ontologieën.
31/01/09 om 16:15
In wikipedia is een ontologie omschreven als “het product van een poging een uitputtend en strikt conceptueel schema te formuleren over een bepaald domein”. “Een poging tot” is de kern van de zaak, want zoals we weten is everything miscellaneous … en concepten relateren met de beperkingen die eigen zijn aan taal is geen exacte wetenschap.
Daarom vind ik het semantische web een prachtig concept: breng “alle pogingen” samen om mensen en machines slimmer te maken. Als organisaties ruimer dan bibliotheken hun “pogingen” zichtbaar maken voor het semantische web zal de taak van de intermediair inderdaad wijzigen, en zal vooral ook het werk van vele nu geïsoleerde pogingen in een nieuw daglicht komen. Voor mij horen daar evengoed folksonomies bij. Daarom zie ik web 2.0 niet als een afwijking maar als een bron voor web 3.0, een verlengde of logisch gevolg van web 2.0.
1/02/09 om 9:44
Ik vind het merkwaardig dat je je afvraagt of ontologieën creëren werkelijk de toekomstige taak van de bibliothecaris is. Tijdens het inlichtingenwerk doen bibliothecarissen namelijk bijna niets anders (bij inhoudelijke vragen, bedoel ik).
Inlichtingenwerkers creëren ad-hoc ontologieën voor eenmalig gebruik. Het probleem is dat ze dat meestal doen door de techniek van het doorvragen. Zo kom je te weten wat de klant wil, wat de context is van zijn vraag enzovoorts. Zoekmachines stellen vooralsnog weinig vragen.
De techniek van “faceted search” die nu in bibliografische databanken zoals Zoeken.Bibliotheek.be wordt toegepast, is een heel eenvoudige vorm van “doorvragen”, nl. door de klant de mogelijkheid te bieden de zoekresultaten in te perken of ze vanuit een bepaalde invalshoek te bekijken (”Ik zoek iets over tweelingen, maar het moet fictie zijn en een film”). Faceted search legt echter alle actie bij de klant, de techniek creëert mogelijkheden, maar legt die niet op. Een klant die het principe van inperking niet doorheeft, of het gewoon vergeet toe te passen, komt nog steeds in een onoverzichtelijke informatiejungle terecht.
Om te weten te komen of een ontologie “geslaagd” is, zou je moeten kunnen meten of de klant die een bepaalde vraag stelt (en die vervolgens door de “ontologiemolen” is gehaald), tevreden is over de zoekresultaten die hij vervolgens krijgt voorgeschoteld.
Aangezien ontologieën veel met taal en technologie te maken hebben, denk ik dat de ontwikkeling van het semantische web (dat alleen maar kan bestaan bij de gratie van goede ontologieën) erg nauw samenhangt met de manier waarop vertaalsoftware zich in de toekomst zal ontwikkelen. En zoals we weten ligt er op dat vlak nog heel wat werk voor de boeg.
1/02/09 om 18:16
Dit boek is zo te zien zeker een aanrader voor de lesgever(s) Bib C4 aan VSPW Gent.
1/02/09 om 19:31
@Patrick: Het is een vraag die ik in het boek onderbelicht vind.
@Stef: Het boek is ook een aanrader voor de cursisten Bib C4.
1/02/09 om 22:00
Dan zal het vast in de bibliografie van de volgende Bib C4-syllabus vermeld staan, of beter nog, aangekocht zijn door de VSPW-bib. Bedankt voor de tip.
Stellen dat de kwaliteit van een ontologie af te meten is aan de mate waarin 1 klant ze voor 1 zoekvraag bevredigend vindt, doet volgens mij een paar generaties wetenschappelijk onderzoek naar tekst-, taal- en denkstructuren tekort. Maar da’s enkel mijn duit in ‘t zakje. Ik zie wel wat ze nog waard is als ik het boek gelezen heb.
1/02/09 om 23:15
@Stef: Misschien was ik niet echt duidelijk, maar ik zeg niet dat je de kwaliteit van een ontologie moet afmeten aan de mate waarin ze voor één enkele klant bevredigend is. Wat ik bedoelde, is dat ook hier de wet van het getal speelt. Als je voldoende ad-hocontologieën kunt “samenvoegen” waarvan bewezen is dat ze werken (omdat je de tevredenheid van de klant hebt afgetoetst), dan kun je deze ontologieën misschien op een hoger plan brengen, waardoor ze hun ad-hocstatus verliezen en een stuk universeler worden.
4/02/09 om 14:40
Wanneer komt de cursus Web 3.0 in 9 stappen?