Cloudflare-Daten verdeutlichen, wie erheblich der Datenvorsprung von Google gegenüber OpenAI und Anthropic durch die Verbindung von Suchanfragen und KI-Scraping ist.
Cloudflare-CEO Matthew Prince erläutert: „Sie haben diesen unglaublich privilegierten Zugang“ bezüglich der dominanten Stellung von Google beim Sammeln von Webdaten.
Laut Prince zeigen interne Analysen von Cloudflare, dass Google gegenwärtig 3,2-mal mehr Seiten im Internet erfasst als OpenAI. Der Abstand zu anderen Wettbewerbern ist noch gravierender: Google erfasst 4,6-mal mehr Inhalte als Microsoft und 4,8-mal mehr als Anthropic oder Meta. Diese Diskrepanz lässt sich laut Prince auf Googles Strategie zurückführen, den Such-Crawler mit dem KI-Crawler zu kombinieren: Webseitenbetreiber stehen vor dem Dilemma, dass sie das KI-Training nicht blockieren können, ohne gleichzeitig aus der Google-Suche ausgeschlossen zu werden – was Google einen einzigartigen Datenvorteil verschafft.
Bildquelle: The Pancake of Heaven! via Wikimedia Commons (CC BY-SA 4.0)