Auf der Konferenz Cloud Next ’26 hat Google seine neueste achte Generation der Tensor Processing Units (TPUs) präsentiert, zusammen mit einer aktualisierten Agenten-Plattform und einer innovativen KI-Schicht für Workspace-Anwendungen. Diese Entwicklungen werden unter dem Begriff „Agentic Enterprise“ zusammengefasst.
Erstmals unterteilt Google seine Tensor Processing Units in zwei unterschiedliche Modelle: die TPU 8t, die für Trainingszwecke konzipiert ist, und die TPU 8i, die für Inferenzaufgaben genutzt wird. Laut Amin Vahdat, Senior Vice President und Chief Technologist für KI und Infrastruktur, reagiert Google mit dieser Aufteilung auf die wachsenden Anforderungen an Inferenz, die durch Agenten entstehen, die in der Lage sind, zu planen, auszuführen und zu lernen.
Im Vergleich zu Nvidia verfolgt Google einen anderen Ansatz, indem es weniger Wert auf die Einzelperformance legt und stattdessen die Skalierbarkeit in den Vordergrund stellt. Berichten zufolge bieten Nvidias kommende Rubin-GPUs pro Chip eine höhere Rechenleistung und eine deutlich verbesserte Speicherbandbreite im Vergleich zur TPU 8t. Allerdings sei für das Training von hochentwickelten Frontier-Modellen nicht die Leistung eines einzelnen Chips entscheidend, sondern die Fähigkeit, mehrere Chips effizient zu vernetzen. Dies steht im Einklang mit der Überlegung, warum KI-Agenten bestehende Software nutzen werden und nicht ersetzen.
Zusätzlich hat Google kürzlich OpenAI neue Modelle vorgestellt, die die Möglichkeiten von KI-Agenten weiter erweitern könnten.