Acap

 

  

Omhoog


    Content beschermen met Acap

 Acap is hot. Da’s mooi, maar wat is het? Een paar regels slimme software die de waardevolle content van de website beschermt tegen ongewenste crawlers. Deze zoeken 24 uur per etmaal naar de krenten uit de pap en maken daar gratis goede sier mee. Een hoog hek? Kan, maar je wilt tegelijkertijd ook veel traffic. Acap belooft die spagaat op te lossen.

“Klem als een ezel die tussen twee hooischelven niet kan kiezen.” Kees Spaan, voorzitter Groep Nederlandse Dagbladpers van het NUV typeerde de positie van de uitgever die content op het web ontsluit met die van het suffe beest dat maar niet kan kiezen. Spaan heeft een punt. Zoekmachines leiden bezoekers naar de websites van de uitgever. Ze zorgen voor druk verkeer, waardoor er met banners geld valt te verdienen. Tegelijkertijd vreten die robots uit de nieuwsruif alle informatie op om deze vervolgens gratis op eigen websites aan te bieden. Moet je je beschermen tegen de honderden robots die onophoudelijk op jouw laatste nieuws jagen of niet?

Het NUV weet het antwoord al, hoewel de meningen van de leden verdeeld zijn. Webcontent is te mooi om weg te geven, zegt de brancheorganisatie die op 27 maart een symposium onder dat motto organiseert. Aanleiding voor de bijeenkomst in het Amsterdamse Rosarium is de komst Acap, het Automated Content Access Protocol. Op de keper beschouwt niet meer en niet minder dan klein softwaregereedschap van een paar regels. Zo weinig sexy als de naam, zo groot is de aantrekkingskracht. Met ruim 180 inschrijvingen is de zaal meer dan uitverkocht. Dagvoorzitter Eefke Smit meldt dat er een tweede sessie over Acap op 14 mei in de agenda staat.

Technische verdedigingslinies tegen zoekrobots worden door uitgevers opmerkelijk weinig opgeworpen. En enige inspanning op dat vlak is wel nodig, wil je ooit met goed gevolg een rechtszaak aanspannen tegen de zolderkamerstarter die jouw inhoud gebruikt om zijn site te laten floreren. Dat betoogt Dirk Visser, hoogleraar Intellectueel Eigendomsrecht. Het auteursrecht biedt weinig tot geen bescherming en is volledig achterhaald, vindt Visser. Er is een aantal nogal uiteenlopende auteursrechtzaken voor de rechter geweest, maar uitspraken tot in de Hoge Raad zijn zeldzaam. Jurisprudentie biedt daardoor nauwelijks houvast. Wat mogen zoekmachines? Linken mag, de kop van een artikel letterlijk overnemen ook, de inhoud van een website kopiëren weer niet.

Uiteenlopende cases van websites zoals kranten.com, paperboy.de in Duitsland, Google News in België, zoekallehuizen.nl, jaap.nl of gaspedaal.nl haalden alle om uiteenlopende redenen de rechtzaal, maar zorgden niet voor veel bescherming van de uitgevers. Van de juristen moeten uitgevers het dan ook niet hebben, vindt Visser. Wel is duidelijk dat een uitgever minstens minimale technische maatregelen moet nemen om zijn content te beschermen. Laat hij dat na, dan redeneert de rechter dat hij deze content kennelijk niet de moeite waard vindt en kunnen zoekmachines ongehinderd hun gang gaan.

Zet je een technisch hek om je dure informatie of niet? Hoe hoger dat hek, hoe lager het bezoek op je site. Je wilt een poort waarbij de ene zoekmachine wel naar binnen mag en de andere niet. Dat is al geregeld met een simpel scriptje. Wie robots.txt op zijn websites gebruikt kan crawlers de toegang ontzeggen. Robots.txt stamt uit de oertijd van het internet. In 1994 waren een paar regels code voldoende om de digitale snuffelaars buiten je website te houden. Maar met robots.txt schiet je nog geen vijftien jaar later in je eigen voet. Niemand kan je je meer vinden. Robots.txt betekent wel of geen toegang, er is geen subtiele middenweg.

Er moest iets nieuws komen en volgens de initiatiefnemers is dat Acap. De founding fathers van Acap zijn de World Association of Newspapers, de European Publishers Council en de International Publishers Association. Na een testperiode van twaalf maanden lanceerden zij begin dit jaar versie 1.0. Aan deze versie sleutelt Acap nog driftig verder. Hoog op het verlanglijstje staat bijvoorbeeld een tool om er voor te zorgen dat nieuws dat herroepen wordt, ook daadwerkelijk op andere sites verdwijnt en niet tot in lengte der dagen zichtbaar blijft.

Acap is een machinetaal die zorgt dat crawlers wel of geen toegang krijgen tot een website. Anders dan robots.txt kunnen er verschillende commando’s worden gegeven zodat er ook verschillende niveaus van toegang mogelijk zijn. Acap is geen standaard, hoewel de gelijknamige organisatie hoopt dat het ooit zover komt. Acap mikt op alle uitgeefactiviteiten: kranten, tijdschriften en boeken. Ook hopen de initiatiefnemers dat andere producenten van content, zoals de muziek- en filmindustrie Acap op hun websites zullen gaan gebruiken.

Het momentum voor Acap groeit, constateert Mark Bide, projectmanager bij Acap. Een aantal uitgeverijen onder wie Reed Elsevier in Amsterdam en De Persgroep in België investeerden in Acap door mensen beschikbaar te stellen. Zij dachten na over de manier waarop Acap in de markt gezet zou moeten worden en losten technische problemen op.

Acap zoekt ook bij de grote zoekmachine-exploitanten naar steun. De Franse zoekmachine Exalead deed volop mee met de ontwikkeling van versie 1. MSN Search en Yahoo kijken vanaf de zijlijn belangstellend toe. Google verzette zich aanvankelijk tegen Acap, maar begin maart liet Google CEO Eric Schmidt voorzichtig positieve geluiden horen.

Mark Bide: “Ook de Europese Commissie steunt Acap. Logisch, want in zelfregulering van de branche bestaat meer vertrouwen dan van boven opgelegde of door de rechter afgedwongen regelgeving.” Atex, leverancier van redactionele automatiseringssystemen, liet eind maart weten gereedschap om Acap gemakkelijk te gebruiken in de software op te nemen. Veel belangrijker is het volgens Bide dat uitgevers Acap daadwerkelijk gaan gebruiken. Technisch is dat niet zo ingewikkeld. Volgens Bride is een niet-technisch geschoolde medeweker met die klus een half uurtje bezig.

En gaan uitgevers Acap gebruiken? De paneldiscussie moet daar het antwoord op geven. De ideeën over nut en noodzaak blijken ver uit elkaar te liggen. Auke Visser van Sanoma geeft aan nog weinig van Acap te weten, maar ziet er niets in als door Apca traffic zou worden belemmerd. “Onze content heeft alleen waarde in de vorm van een tijdschrift. Informatie rangschikken we op een bepaalde manier. Sfeer en timing zijn belangrijk. Op onze website willen we zoveel mogelijk traffic genereren, dan leveren die advertenties nog wat op.”

Aan de andere kant van het spectrum staat Kees Spaan van de NDP. Hij vindt het onverteerbaar dat cowboys goede sier maken met de door professionele redacties verzameld nieuws. Spaan vindt dat de overheid regelend moet gaan optreden. Google dreigt volgens Spaan een oncontroleerbare machtsfactor te worden die alle regels aan zijn laars lapt. Volgens Spaan is de zakelijke ethiek ver te zoeken. “Je jat geen werk van anderen”.

Joachim Driessen, algemeen directeur van Malmberg, plaatst zich in het kamp van Visser. Ook hij had nog geen beeld van Acap, maar ziet er niets in als dit leidt tot het afschermen van informatie op het web. Uitgevers moeten in ieder geval niet proberen om om rechten te beschermen op precies dezelfde vorige-eeuw-manier waarop de muziekindustrie dat zo krampachtig doet.” Hij krijgt bijval van plaatsvervangend hoofdredacteur van Elsevier René van Rijckevorsel. Volgens Van Rijckevorsel mag iedereen alles van de Elsevier-website weghalen, mits de bron maar wordt vermeld. Sterker nog: daar worden de artikelen speciaal voor geschreven. De ‘echt waardevolle’ content uit het weekblad is alleen voor abonnees toegankelijk.

Nieneke van Dalen van de werkgroep Vak & Wetenschap van het NUV sluit zich aan bij Kees Spaan. “De vakbladen hebben het mede zwaar omdat ze inkomsten van zowel de lezers- als de advertentiemarkt mislopen. Als we onze content op een goede manier kunnen beschermen, zou ik niet weten waarom we dat zouden nalaten.” Uitgeefmanager Jaap van der Linden lijkt Acap wel een zinvol en sympathiek initiatief. Hij gaat de ontwikkelingen volgen en denkt na of hij zich wil aansluiten bij Acap.

Mark Bide zou graag een enthousiaster onthaal door de uitgevers zien, maar is realist. Bide: “Initiatieven zoals Acap hebben tijd nodig. Ik moet telkens uitleggen dat het technisch niet lastig is en we het hier niet hebben over een systeem om digital rights te managen. We zijn in korte tijd behoorlijk ver gekomen. De standpunten van de verschillende uitgevers weerspiegelen hun positie op de markt. Maar ik kan tientallen redenen noemen waarom het zinvol is dat uitgevers Acap op hun websites gaan gebruiken en zie eerlijk gezegd niet welke uitgever daar bezwaar tegen zou kunnen hebben.”

 Leon van Velzen

 [Media Facts, mei 2008]
 

 Wat doet Acap?

Volgens Edgar Schouten van Reed Business is het belangrijkste verschil tussen robots.txt en Acap dat deze laatste over zowel de syntax als de grammatica beschikt om in machinetaal nauwkeurig aan te geven wat je wel en niet op je website wilt toestaan. Zo zijn er al vijf verschillende commando’s om een crawler acties toe te staan of te verbieden.

bullet

Crawl: ophalen en verwerken (indien toegestaan);

bullet

Follow: volgen van een link op een pagina naar een andere pagina;

bullet

Index: tijdelijk opslaan van een kopie van de pagina en het verwerken daarvan in de index     van de zoekmachine;

bullet

Preserve: voor langere tijd opslaan van een kopie;

bullet

Present: beschikbaar stellen aan een gebruiker als een zoekresultaat.

Ook is het mogelijk met Acap aan te geven of bepaalde mappen wel of niet geïndexeerd mogen worden, of bestandstypes zoals jpg’s wel of niet geïndexeerd mogen worden, of content wel of niet voor langere periode mag worden opgeslagen als een ‘cached copy’ en of content mag worden weergegeven, en zo ja hoe. Om een idee te geven. Een Acap-regel die aangeeft dat alleen de eerste veertig woorden zichtbaar mogen zijn van de artikelen in de map 'TEXT' ziet er als volgt uit: ACAP-allow-present-snippet /TEXT/ max-length=40-words. Meer informatie: www.the-acap.org.

Vragen of opmerkingen naar: redactie§magazijn.nl
© 1998 - 2010 |  Uitgeverij Het Nederlands Magazijn bv
Laatst bijgewerkt:
22 juni 2010
Al het gepubliceerde werk op deze website valt onder de spelregels van creative commons.