zaterdag, juli 09, 2005

Keywords in bibliografische databases

Deze weblog behandelt drie heel verschillende onderwerpen. Boekkunst en poëzie hebben in veel gevallen nog wel wederzijdse betrekkingen, voor menigeen zal het onderwerp 'information research' echter een vreemde eend in de bijt zijn. Hierbij een poging om ze alle drie tegelijkertijd tot hun recht te laten komen.

In het eerste deel van deze 'post' behandel ik het gebruik van keywords bij de information retrieval. Vervolgens zal ik ingaan op het wat vreemde gebruik van het concept 'keywords' in Book History Online, een bibliografische database die in zijn geheel is gewijd aan de geschiedenis van het gedrukte boek en die van het bibliotheekwezen (www.kb.nl/bho).

Keywords
In tegenstelling tot zoekmachines voor het www, kennen bibliografische databases zogenaamde 'velden' voor verschillende typen gegevens. Bij het zoeken naar bibliografische gegevens kun je op die manier aangeven of een zoekwoord betrekking heeft op (bijvoorbeeld) een auteursnaam, of juist op de titel van een document of het onderwerp dat behandeld wordt. Dat is wel zo plezierig want op die manier kan ik bijvoorbeeld onderscheid maken tussen de documenten die óver W.F. Hermans zijn geschreven en de boeken en artikelen die hij zelf heeft gepubliceerd.

Nu kennen de meeste databases ook weer verschillende velden voor gegevens die betrekking op de inhoud van een document. De meest voorkomende zijn:

- titel (waarbij er stilzwijgend van uitgegaan wordt dat die niet 'fancy' is)
- abstract / samenvatting
- onderwerp / trefwoord / subject
- onderwerp / classificatiecode
- keyword.

Over het verschil tussen een trefwoord en een classificatiecode als aanduiding van een onderwerp, zal ik ik hier verder zwijgen; het gaat me nu om het gebruik van zogenaamde 'keywords', dat nogal eens aanleiding geeft tot verwarring.

Book History Online
Book History Online kent naast het veld 'Author / Editor' twee gegevensvelden die betrekking hebben op de inhoud van een publicatie, te weten 'Keyword' en 'Title(word)'. Een vierde zoekingang is 'Any word', waarmee je zoekt in de volledige bibliografische beschrijving (behalve in de drie eerder genoemde gegevensvelden ook nog in kenmerken zoals de reekstitel of de plaats van uitgave).

Palladium
Nu dan over boekkunst en over poëzie. Vanaf 1920 verscheen onder leiding van de boekverzorger Jan van Krimpen de literaire reeks Palladium. Bij de keuze van de uit te geven teksten werd hij bijgestaan door de literaire adviseurs Greshoff, Van Nijlen en Bloem. In de zeer goed verzorgde boekjes verschenen poëzie- en prozateksten van Van Nijlen en Greshoff zelf, en van geestverwanten als Roland Holst, Marsman en Weremeus Buning.
Altijd geïnteresseerd in de achtergronden van de literaire activiteiten uit deze kring, ben ik benieuwd wat BOH mij over Palladium als referenties geeft. Zoals hierboven al aangegeven heb ik daarbij de keuze uit 3 zoekmogelijkheden. Zoeken op titelwoorden sluit ik uit, om de reden dat er inderdaad artikelen over Palladium zouden kunnen bestaan zonder dat de naam van die reeks zelf in de titel voorkomt. Het meest voor de hand liggend is in dit geval dus om te kiezen voor de standaard optie 'Any word'. Dat levert 3 tijdschriftartikelen op, die inderdaad alle drie gaan over het onderwerp waar ik graag meer over wil lezen. Als ik vervolgens controleer wat dezelde zoekactie oplevert als ik kies voor 'Keyword' blijft er van de drie maar één over.

BHO gebruikt het veld 'keyword' blijkbaar voor wat wij een 'trefwoord' zouden noemen (toegekend door een indexeerder). Dat lijkt voor een buitenstaander wellicht logisch, voor iemand die veelvuldig gebruik maakt van online databases is het dat echter niet. Ik heb hierboven immers niet voor niets onderscheid gemaakt tussen 'onderwerp / trefwoord / subject' en 'keyword'. In vrijwel alle engelstalige databases staat 'keyword' voor "ieder betekenisdragend woord of frase....dat/die gebruikt kan worden als zoekterm in een free-text zoeksysteem" (vrij vertaald uit ODLIS, Online Dictionary for Library and Information Science, cursivering van mij / JvH). Met andere woorden: met de optie 'keyword' zoek je in verschillende velden tegelijk (titel, trefwoord, abstract enzovoorts).

Conclusie
Het gebruik van de optie 'keyword' bij een zoekactie in een online database dient met voorzichtigheid te worden toegepast. In bijna alle grote databases betekent het dat je free-text zoekt. Je zou het eigenlijk pas moeten toepassen als zoeken op 'subject' of 'subject heading' te weinig oplevert. Dat Book History Online met het begrip 'keyword' bedoelt wat elders een 'subject' heet, maakt het er niet minder verwarrend op. Bij een argeloze zoekactie krijg ik daardoor juist minder resultaten dan ik zou verwachten. Het is in alle gevallen dus aan te raden om je er eerst goed van te vergewissen wat er binnen de betreffende database onder wordt verstaan.