dinsdag, september 08, 2009

Alles gevonden... en toch geen ruis

Dit studiejaar ben ik voor het eerst sinds twee jaren weer betrokken bij het onderwerp Document Management, wat minder sexy ook wel aangeduid als 'archivering'. Wat mij al enige tijd intrigeert is dat binnen het vakgebied DM het klassieke verhaal over de verhouding tussen Recall en Precision van een retrievalsysteem niet op lijkt te gaan.
In het kader van document management zijn gebruikers van het retrievalsysteem immers vaak op zoek naar een dossier waarvan ze weten dat het bestaat en ze willen alleen dat éne dossier terugvinden (100% precisie). Ze willen met andere woorden niet gehinderd worden door allerlei zoekresultaten die iets te maken lijken te hebben met het dossier maar die op de keper beschouwd gaan over een heel andere 'zaak'. Tegelijkertijd verwachten ze wel dat het dossier ook 'compleet' is (100% recall). Je schiet er immers weinig mee op als je je in het kader van bewijsvoering baseert op een half verhaal.

Ik herinner me dat Eric Sieverts nog niet zo heel lang geleden een column in IP of op de website van IP heeft geplaatst waarin hij aandacht besteedde aan dit intrigerende verschijnsel bij zoekvragen naar items waarvan het bestaan bekend is en waarbij de axioma's van de syntactische retrievalsystemen niet op lijken te gaan. Ik kan dat verhaal echter niet terugvinden. Als iemand het zich wel herinnert, of Eric zelf: graag!


technorati tags:

3 Comments:

Blogger Sim's 23 Thingies said...

Beste Jos,
Misschien 'De mythe van Google'?http://www.informatieprofessional.nl/bijdragen/7320-de-mythe-van-de-catalogus.html
Ik citeer: "Bij onderwerpsvragen is de situatie ronduit rampzalig als je het van een catalogus moet hebben. Wie een boek over een algemeen onderwerp als "economie", "fysiologie" of "meteorologie" wil hebben, vindt nog wel wat. Maar wie op zoek is naar iets heel specifieks, wat vast in bepaalde boeken wordt behandeld, maar alleen in een specifiek hoofdstuk en niet als onderwerp van het hele boek, blijft met lege handen staan."

Hartelijke groet, Simonette

8:49 p.m.  
Blogger Jos van Helvoort said...

@Simonette, daar dacht ik het aanvankelijk ook te vinden maar toch is dat niet het verhaal dat ik bedoel (hoe interessant het ook is). Hoe vervelend toch als ons geheugen ons in de steek laat!!

10:05 p.m.  
Blogger Jos van Helvoort said...

Naar aanleiding van een mail die ik vanmiddag van Eric kreeg en waarin hij meldde dat hij ook niet wist "welk stukkie" bedoelde kreeg ik met de fiets op weg naar huis een brainwave: en ja hoor, dit is wat ik bedoelde: http://www.library.uu.nl/medew/it/eric/bikring-sieverts.pdf

Het is alleen niet zo recent als ik meende; daarom niet minder waardevol.

7:07 p.m.  

Een reactie posten

<< Home