| Home | Archief nieuwsbrief | Abonnement | Wie zijn wij ? | Contact | Adverteren |
Nieuwsberichten van 20/02/2024
[Nieuws]Zoeken wordt nooit meer zoals vroeger: heeft...
[Nieuws]Ook Amazon doet mee aan de AI-race
[Nieuws]EU: mogelijk 500 miljoen euro boete voor Appl...
[Oor]YouTube laat je muziek remixen in Shorts
[Site]Follow Up Then: herinnering
[Site]I Have No Tv: documentaires
[Software]Metro Commander: bestanden
De meeste populaire reacties
[14]Vragen van de lezers ...
[9]Vragen van de Netties-lezers ...
[8]Vrijdag alternatieve OS: Ubuntu 9.1 ...
[7]Netties vraagt hulp lezers bij oplo ...
[7]Linux - Deel 1 - Een korte inleidin ...
De meeste recente reacties
Tip: hoe kan je een foute Facebook posting me ...
Snapmail: zelf-vernietigende mails ...
De ene site om YouTube filmpjes naar MP3 om t ...
GDPR: Europa tracht de burger te beschermen ...
Robocops patrouilleren al in de straten ...
Zoeken met Google 


Reclame 

Volledig artikel

Zoeken wordt nooit meer zoals vroeger: heeft robots.txt nog zin?
Dat wij dingen aan Google kunnen vragen, is omdat zijn "spiders" dag na dag het web afspeuren en alle mogelijke teksten en websites indexeren. Die spiders worden daarbij geholpen door de robots.txt, die webmasters op hun website zetten. Dat is een simpel tekstbestand waarin de webmaster zet welke pagina's van zijn website wel en niet geïndexeerd mogen worden. Pagina's die regelmatig ververst worden bijvoorbeeld wel, pagina's die bijna nooit veranderen niet bijvoorbeeld. Dat bespaart de server waarop de website staat computerkracht, en maakt het anderzijds voor de zoekmachines eenvoudiger om het web sneller en efficiënter te indexeren.

Uiteraard kan een zoekmachine die instructies negeren, maar robots.txt is uitgegroeid tot een soort van onofficiële overeenkomst tussen websites en zoekmachines: jij mag mijn content crawlen, en in ruil zend jij mij verkeer.

Maar met de opkomst van de Large Language Modellen, de basis voor de huidige AI-tools, werkt die overeenkomst niet meer. De meeste AI-bedrijven negeren gewoonweg die robots.txt. Het is immers geen wettelijk document. En wat meer is: waar de zoekmachines nog verkeer zenden naar de websites, doen de LLM's dat zelden of nooit.

Met andere woorden: moet er niets in de plaats komen van de robots.txt, dat uitgevers meer controle kan geven over wat geïndexeerd mag worden, en waarvoor het gebruikt mag worden?
The Verge heeft hier een heel interessant artikel over;

https://www.theverge.com/24067997/robots-txt-ai-text-file-we ...
geef uw reactie hier

  
Archief per categorie

Nieuws
Stability brengt Stable Video 4D uit... 26/07
Nieuw weermodel... 26/07
Google vervangt Chromecast door The Goog... 26/07
Eerste dataset van Overture Maps gelance... 25/07
Adobe: nieuwe AI functies... 25/07
Nieuwe interface bij Amazon Prime Video... 25/07
Hackers die in oorlogstijd de verwarming... 25/07
Apple: dan toch een foldable iPhone? En ... 24/07
Google blaast (voorlopig) plan af om coo... 24/07
Meta lanceert Llama 3.1... 24/07
Meer artikels ....
Hardware
Enkele cijfers over elektriciteitsverbru... 26/07
DM13 van het Chinese Fijo: retro voor wi... 22/07
Slimme brillen doen het beter dan headse... 19/07
Onderzeese kabels hersteld in de Rode Ze... 18/07
Copilot pc s: op 1 hand te tellen... 15/07
Samsung: Galaxy Ring... 12/07
NATO steunt project om internet te route... 10/07
Aanvallen met ransomware zijn gevaarlijk... 08/07
Kernenergie in de VS: voorbehouden voor ... 04/07
Slimme bril van Solos... 03/07
Meer artikels ....
Oor
Het politiek salon - W16 podcast... 26/07
Populaire podcast app Overcast volledig ... 18/07
Napleiten: politieagent in het verdachte... 17/07
Podcast: Moorden in de jaren...... 15/07
Spotify: geef je commentaar op podcasts... 10/07
Napleiten: klusjesman steekt opdrachtgev... 08/07
Door AI gemaakte muziek: plagiaat?... 05/07
TuneIn heropent langzaam deur voor nieuw... 28/06
RIAA klaagt AI muziekdiensten Suno en Ud... 26/06
All-In Podcast spreekt met Donald Trump... 24/06
Meer artikels ....
Site
Apple Maps nu ook op het web... 26/07
Speech To Note... 26/07
Inbox Report voor Microsoft Mail en Gmai... 25/07
Moneystack: breng je financi?n in beeld... 25/07
YouOrMe: op wie lijkt de baby het meest?... 24/07
Bureau Dupin... 24/07
NotShipped: niet gelanceerde projecten... 23/07
Better Terminal voor OS... 23/07
ADHD Quiz... 22/07
Use Shorts: postings van je YouTube kana... 22/07
Meer artikels ....
Tip
Tip voor webmasters: het gebruik van H h... 22/07
Zo zet je het groene bolletje op Faceboo... 19/07
Tip: maak een PDF op je iPhone zonder ex... 12/07
Gesprekken forwarden op je smartphone... 05/07
En waarom niet ChatGPT gebruiken voor re... 27/06
Zo stap je over naar Mastodon... 13/06
Spotify en albums... 06/06
Tip Windows 11: je foto s van je Android... 22/05
Factchecking doe je met Search... 21/05
Evernote: zo laat je die vervelende Slas... 15/05
Meer artikels ....
Software
Audio Tracks Extractor... 26/07
Windows Photo App ... 25/07
EarthTim: tijdzones... 24/07
FastStream voor Chrome... 23/07
Audacity v3.6... 22/07
HW Monitor: je computer in het oog houde... 19/07
Microsoft Designer ... 18/07
Microsoft PC Manager... 17/07
Super Dark Modus voor Google Chrome... 16/07
LibreWolf: versie van Ifrefox... 15/07
Meer artikels ....
(c) www.netties.be 1.0 -- hosting & programmatie www.webdynamics.be (c)