Bibliotheken zijn steeds meer betrokken bij de aanleg van digitale bibliotheekcollecties en andere repositories. Het is hoegenaamd niet ongewoon dat bibliotheken zich bezighouden met het digitaliseren van collecties van manuscripten, foto's, kranten, postkaarten of multimedia-content zoals audio-opnames en radio- of televisieprogramma's. Academische bibliotheken zijn steeds vaker actief bij het opbouwen van repositories voor content die binnen hun instellingen is geproduceerd, maar ook bij andere aspecten van de publicatie van academische content. Hoewel boeken en kranten – zowel in gedrukte als in elektronische vorm – de hoofdmoot blijven van het aanbod van de bibliotheek, zijn het de collecties van zeldzaam, historisch of lokaal materiaal die een bibliotheek de beste kans bieden om een impact te hebben op haar gemeenschap. Deze collecties van niet-traditionele content zijn de pareltjes van de bibliotheek, en door ze digitaal aan te bieden, kan een bibliotheek haar impact enorm verhogen.
Digitale collecties bieden nog een ander enorm voordeel voor bibliotheken – ze kunnen extra gebruikers naar de website van de bibliotheek lokken. Dat brengt mij bij een van mijn hoofdbekommernissen inzake bibliotheekstrategieën: de webstek van de bibliotheek moet de topbestemming zijn voor bibliotheekgebruikers, uiteraard voorafgegaan door de fysieke bibliotheekfaciliteiten (ik verwijs naar andere auteurs voor onderwerpen zoals De bibliotheek als fysieke/publieke ruimte). We mogen niet vergeten dat bibliotheken af te rekenen hebben met bikkelharde concurrentie op het vlak van informatieverstrekking via het internet. We moeten ons uiterste best doen om gebruikers aan te trekken zodat zij de vruchten kunnen plukken van de toonaangevende content en diensten die wij bieden, in plaats van dat ze simpelweg hun toevlucht nemen tot het open aanbod op het internet.
Aangezien digitale collecties zijn te benutten om de zichtbaarheid van de bibliotheek op het internet te verhogen, zouden ze deel moeten uitmaken van elke geharmoniseerde zoekomgeving die bibliotheken kiezen om de impact van dit bibliotheekaanbod te verrijken en te versterken. In de rubriek van deze maand bespreek ik drie technieken voor het maximaliseren van de content van digitale collecties: zoekmachine-optimalisatie, het gebruik van RSS-feeds, en de opname van content uit digitale collecties in discovery interfaces.
Zoekmachine-optimalisatie
Een van de essentiële elementen bij het aanleggen van een digitale collectie behelst de implementatie van de technische infrastructuur die ervoor zorgt dat de content wordt geïndexeerd door Google en andere zoekmachines. In de rubriek van april 20061 heb ik het traject beschreven dat we volgden om de content van de Vanderbilt Television Nieuwsarchieven vindbaar te maken voor zoekmachines, wat leidde tot een enorme toename in het gebruik. Het aantal zoekacties steeg en het aantal leenaanvragen nam toe. Dit leidde tot verhoogde inkomsten uit de bijdragen die we voor die diensten rekenen. De technieken voor zoekmachine-optimalisatie (search engine optimization, of ook wel SEO genoemd), zijn op bijna elke digitale collectie toe te passen om nieuwe bezoekers aan te trekken. De basistechniek houdt in dat de content van de collectie beschikbaar wordt gemaakt voor het indexeringsproces van Google en andere zoekmachines, en dat gemakkelijke toegang tot de bron wordt verzekerd wanneer de gebruikers klikken op de zoekresultaten. Het schema bestaat uit twee sleutelonderdelen. De eerste stap bij het voorbereiden van een digitaal repository omvat het creëren van een permanente URL voor elk item in de digitale collectie. Die URL is rechtstreeks gedieplinkt met de pagina van dat item in het systeem. Het is van groot belang een unieke en betrouwbare link te creëren, zonder sessie tokens en andere ingrepen. Dankzij deze URL is voor elk individueel item een dieplink te creëren in de repository.
Bij de tweede stap moeten de zoekmachines een systematische manier aangeboden krijgen om hun weg te vinden door alle URL's van de hele collectie. De meest efficiënte aanpak omvat het gebruik van het sitemap-protocol, dat een systematische beschrijving biedt van alle bronnen die beschikbaar zijn op uw site. Dankzij een sitemap navigeren de indexeringsbots een stuk efficiënter door de content van een site; het biedt ook de mogelijkheid om aan te duiden welke items prioriteit moeten krijgen bij het indexeren. De sitemap bestaat uit één of meer XML-documenten met daarin een lijst van alle unieke URL's die items in de collectie vertegenwoordigen, de datum waarop het item werd toegevoegd of gewijzigd, en de relatieve prioriteit ervan (zie www.sitemap.org). Dankzij de datum kunnen de zoekmachinebots steeds beter nieuwe content van de bron in hun index weergeven zonder constant de hele set opnieuw te hoeven doorlopen. Google heeft het sitemap-protocol oorspronkelijk aangeboden en alle belangrijke zoekmachines gebruiken het nu. Het sitemap-bestand is automatisch te produceren; meestal via een script dat samenwerkt met de software die u gebruikt om uw digitale collectie te beheren. Indien het systeem dat u gebruikt in deze mogelijkheid nog niet voorziet, kan een programmeur een script ontwikkelen om de sitemaps vrij makkelijk op te bouwen. Zodra u de sitemap-bestanden klaar heeft, kunt u een verwijzing plaatsen in het robots.txt-bestand op uw server. Bij Google kunt u uw sitemap registreren via de webmaster tools.
RSS-feeds
Een andere techniek om de zichtbaarheid van uw collectie te verbeteren, is het gebruik van RSS-feeds. Momenteel is RSS een van de toptechnologieën voor de distributie van content. Als het op correcte wijze wordt geïmplementeerd, kan het een doeltreffend instrument zijn om publiek naar uw site te leiden.
De basisstrategie voorziet het aanbieden van RSS-feeds die de belangstelling wekken van de potentiële gebruikers van uw site. Voor een digitale collectie kunnen de feeds ook prominente items omvatten die verwijzen naar de pareltjes uit uw collectie of naar de onlangs toegevoegde stukken. Handig is ook de mogelijkheid om zoekresultaten in RSS-weergave aan te bieden. Zo kunnen uw gebruikers zich abonneren op een feed waarin ze specifiek geïnteresseerd zijn – wat er ook meteen voor zorgt dat ze terugkeren telkens wanneer u nieuwe content binnen dat specifieke domein toevoegt. Als u met RSS het verkeer op uw site wilt verhogen, zijn de volgende vuistregels belangrijk: bied in de feed net genoeg informatie over elk contentonderdeel om de belangstelling te wekken en voorzie een link naar de volledige weergave van de content op de site. U moet RSS beschouwen als een syndicatiedienst voor het distribueren van content, maar ook als een reclametrucje om potentiële gebruikers ertoe te verleiden uw website te bezoeken.
Discovery interfaces
Een van de belangrijkste trends op het vlak van bibliotheekautomatisering is het toenemend gebruik van een nieuw soort discovery interfaces die een verbeterde toegang bieden tot bibliotheekcontent. Enkele van de topproducten in deze categorie zijn AquaBrowser van Medialab Solutions, Primo van Ex Libris, VuFind (een opensource-alternatief) dat oorspronkelijk is ontwikkeld op Villanova University, Encore van Innovative Interfaces, Enterprise van SirsiDynix, Summon van Serials Solutions, en Visualizer van VTLS. Ik heb deze nieuwe producten van nabij gevolgd. Wat ik bijzonder op prijs stel, is de manier waarop ze moderne webinterface- technieken aanbieden op dezelfde wijze die bibliotheken hanteren om hun content aan hun gebruikers voor te stellen. Ze bieden mogelijkheden zoals het rangschikken van de resultaten volgens relevantie, facetten om gebruikers van algemene zoekresultaten te verwijzen naar meer specifieke resultaten, een betere visuele weergave, zoeksuggesties in de trant van ‘bedoelde u dit?', en ratings, recensies en tags die de gebruikers aanleveren.
Voor mij is het belangrijkste aspect van al deze producten de mogelijkheid om het bredere contentaanbod in bibliotheken zichtbaar te maken. Bibliotheken hebben op hun websites lange tijd web-OPAC's aangeboden als hun belangrijkste zoekinstrument om toegang te krijgen tot de content van hun geïntegreerde bibliotheeksystemen (ILS of integrated library systems), waaronder boeken, tijdschriften en aanverwanten. Toegang tot de inhoud van artikelen werd dan verschaft via middelen, zoals databases van citaatindexen, A-Z-lijsten van e-journal-titels, of via een federated zoekplatform. Bibliotheken die digitale collecties van institutionele repositories aanbieden, bieden afzonderlijke links naar die bronnen.
Deze nieuwe discovery-producten slagen erin de content van al die bronnen samen te brengen in één zoekomgeving. Tot dusver was dat veelal een utopie. Bij de meeste implementaties van die nieuwe producten ligt de nadruk nog te veel op de inhoud van het ILS. Er worden maar aarzelende stapjes gezet om het ruimere aanbod van bibliotheekcontent erin te verwerken. Bibliotheken die een van deze nieuwe discovery interfaces hebben geïmplementeerd, zouden de exposure van hun digitale collecties moeten kunnen verhogen. Net zoals de MARC-bestanden uit de ILS in die producten worden geïntegreerd om het zoeken naar traditionele bibliotheekcontent te ondersteunen, zo moeten de metadata uit digitale collecties en andere repositories in de indexen van die discovery-platforms worden verwerkt. Door records uit digitale collecties in de resultaten van het belangrijkste zoekinstrument van de bibliotheek op te nemen, krijgt deze content een veel hogere mate van exposure. Deze nieuwe interfaces zijn te beschouwen als de eerste aanvalspoging om gebruikers toegang te verlenen tot de bronnen van de bibliotheek, omdat ze de gebruikers helpen bij het ontdekken van de vele soorten bronnen die beschikbaar zijn. De opname van digitale collecties en andere repositories in deze discovery-systemen doorbreekt het stereotype dat bibliotheken enkel draaien rond boeken en tijdschriften. De gebruikers kunnen met eigen ogen zien dat we ons ook bezighouden met andere vormen van content, zoals beeld en video, die ook voor hen relevant kunnen zijn.
Nieuwe bezoekers aantrekken
Het aanleggen van digitale collecties vergt heel wat inspanningen en kan een enorme investering betekenen, onder meer in personeel en technische infrastructuur. Zodra deze collecties zijn gecreëerd, is het volgens mij belangrijk te beseffen dat hun impact verder kan strekken dan pure content – ze kunnen integraal deel uitmaken van een bredere strategie ter verbetering van de positie van een bibliotheek binnen haar gemeenschap. Ze kunnen nieuwe bezoekers aantrekken en bijdragen tot een nieuw imago: dat van de bibliotheek als een moderne en relevante informatieverstrekker op het internet.