Vandaag
Nieuws
Hardware
Software
Site
Tip
Oor
Archief nieuwsbrief
Abonneer
☰
Home
Vandaag
Nieuws |
Ook Wikimedia worstelt met overlast door AI crawlers, maar wel om een specifieke reden
Gepubliceerd op: 2025-04-03
We hebben het al eerder gehad over het feit dat de AI crawlers heel wat overlast veroorzaken. Zij lopen immers het hele internet af, op zoek naar content waarmee de Large Language Modellen gevoed kunnen worden. Hun bezoek betekent extra verkeer voor al die websites - verkeer waar de sites zelf geen baat bij hebben, want het zijn geen menselijke lezers. Maar dat extra verkeer betekent een hogere belasting voor de servers, meer onderhoudskosten, enz.
Veel open source projecten klagen over die overlast. Ook Wikimedia, de organisatie achter o.a. Wikipedia. Dat zag de bandbreedte voor het downloaden van multimedia sinds januari met maar liefst 50% stijgen. En dat is niet omdat menselijke lezers plots een grote honger hadden om Wikipedia artikels te lezen, of video's of multimediabestanden te downloaden van Wikimedia. Het waren de AI crawlers die de stijging veroorzaakten. En voor een probleem zorgen, om de volgende reden.
Het is namelijk zo dat menselijke lezers een bepaald onderwerp gaan opzoeken omdat het in het nieuws is, zoals de dood van een beroemd persoon. Wikimedia maakt van content die vaak geraadpleegd wordt, een cache in het datacenter dat het dichtste bij de gebruiker staat. Waardoor wordt de content sneller bij de lezer gebracht. Maar content die niet zo vaak geraadpleegd wordt, moet terug opgehaald worden van het core data center. En dat vraagt meer computerkracht, en kost Wikimedia dus meer geld.
Het is zelfs zo erg dat 65% van het verkeer dat veel computerbronnen vergt, afkomstig is van bots. Wat nu al voor problemen zorgt bij het Site Reliability team, dat tracht de crawlers af te stoppen zodat pagina's niet trager laden bij échte, menselijke lezers.
Een probleem voor Wikimedia, dat echt afhangt van donaties, onder het motto: Onze content is gratis, onze infrastructuur is het niet.
(1)
https://www.engadget.com/ai/wikipedia-is-struggling-with-voraciou...
Deel op
Deel per
Terug naar het overzicht
Nieuws
OpenAI en Microsoft sluiten akkoord over nieuwe structuur
Microsoft ontsnapt aan EU-onderzoek door Teams los te koppelen
Enkele nieuwigheden op AI-gebied: Open modellen en privacy
Verhalende podcasts zijn een uitstervend genre
YouTube's meertalige audio: wat is het?
Reddit's nieuwe tools voor publishers: wat is het?
De nieuwigheden van Apple kort samengevat
Reddit dumpt abonnee-aantallen: voortaan zie je échte activiteit
Nieuwe woordjes leren: RSL - worden uitgevers eindelijk betaald voor content?
Rechter fluit Anthropic terug in miljarden-schikking
Naar het Nieuws-archief...
Hardware
Kodak Charmera: Een piepkleine camera voor aan je sleutelhanger
GitHub-gebruikers en Linus Torvalds zien het even niet meer zitten
Pokémon Poke-nade: Tamagotchi 2.0?
OpenAI start een chipavontuur: steekt het Nvidia voorbij in 2026?
Garmin Fenix 8 Pro: een prijzige overwinning op Apple?
Dolby Vision 2: De TV-revolutie met een snufje AI
Even aan een bloemetje ruiken en je bent slimmer? Klinkt mooi - maar is het waar?
Meta’s Hypernova: Slimme brillen met een bescheiden start!
Plaud Note Pro lanceert nieuwe versie - maar wat is het?
Chatbot-schaamte na vliegschaamte? Google’s AI-energierapport onder de loep
Naar het Hardware-archief...
Oor
Spotify's Lossless: meer zuivere klank in je oren, nul extra euro's!
De Afspraak als podcast
Podcast: SoundTrek
De zaak ontleed: Officier van Justitie over vrouwenmoord
Apple breekt muren af van zijn walled garden om Spotify te tackelen
Muziekdiensten serveren steeds meer door AI gemaakte namaak
Podcast De Zaak Ontleed: over reclassering
All-In podcast: opnieuw voer voor nadenken
Podcast De Zaak ontleed: Verdeeldheid na dodelijk verkeersongeluk
Criminal: Kids on the Case
Naar het Oor-archief...
Site
Tapedeck: cassettes
Signwriting: gebarentaal
eBookAny: later lezen
Podsnacks: samenvattingen van je podcasts
You Don't Know Africa: quiz
Historical Tech Tree: geschiedenis van technologie
Sammy Labs: software leren
Interactive Avatar: je alter ego
SQL Noir: leer SQL door raadsels op te lossen
OpenAI Academy: leer omgaan met AI
Naar het Site-archief...
Tip
Sneltoetsen voor YouTube
De snelkoppelingen - het hele alfabet
Handig: vertaal tekst in Word
Tip: afstanden meten in Google Maps
Hoe gebruik je Google Maps offline?
Microsoft To Do: Maak taken van je e-mails in een paar kliks
Tip: kan je door binge-watching je verliezen in een fantasiewereld?
Zo blur je je huis op Google Maps (en waarom je dat zou willen)
Tip voor een rustige zomer: maak je smartphone dom!
Tip: Ruim je Gmail-inbox op met de nieuwe abonnementsbeheer-tool
Naar het Tip-archief...
Software
DoesNotBelong: dat hoort hier niet
Outside.so : je omgeving verkennen
Gigapixel: afbeeldingen upscalen
Microsoft Launcher voor Android
Photolab: foto's bewerken
Rules: automatische regels
Eindelijk: iPad App voor Instagram
AbleMouse: toegankelijkheid
Rock Identifier: de ene steen is de andere niet
PlantNet: planten identificeren in een burgerproject
Naar het Software-archief...
Bekijk hier de oudere artikels
Ons archief is wellicht het meest uitgebreide overzicht...
Alle rechten voorbehouden aan www.netties.be (c) 2025 - v50 - voor suggesties en vragen gebruik ons
contactformulier
.
Design en programmatie by PDL