★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 25. Juni 2026
534 Artikel, 25 relevant
# KI-Tagesüberblick 2026-06-25
Highlights
1. [LLM-Judge Bias-Studie] — Systematische Verzerrungen in KI-Evaluierungen identifiziert
Anthropic, OpenAI, Google und Meta haben gemeinsam untersucht, wie Sprachmodelle bei der Bewertung anderer KI-Systeme systematisch voreingenommen sind. Die Studie vergleicht neun Debiasing-Strategien across fünf verschiedener Judge-Modelle und zeigt, dass die Evaluierungszuverlässigkeit durch diese Bias-Phänomene erheblich gefährdet wird. ([Quelle](https://arxiv.org/abs/2604.23178))
2. [Chinesische KI-Gefahr für westliche Margen] — GLM-5.2 erreicht Claude-Opus-Niveau bei 20% der Kosten
Zhipu AIs Modell GLM-5.2 schneidet in Coding-Benchmarks fast auf dem Niveau von Claude Opus 4.7 ab, verursacht aber nur ein Fünftel der Token-Kosten. Diese Kostenparität könnte zum Wendepunkt für westliche Geschäftsmodelle werden. ([Quelle](https://the-decoder.de/chinas-offene-guenstig-ki-koennte-zur-groessten-gefahr-fuer-die-westliche-ki-blase-werden/))
3. [Memory-Contagion-Problem] — Agenten-Bias kann sich über Speichersysteme ausbreiten
Forschung zeigt ein neues Phänomen: Wenn KI-Agenten Informationen speichern, können Verzerrungen von Evaluierern sich zeitlich fortpflanzen und die Qualität degradieren. ([Quelle](https://arxiv.org/abs/2606.23195))
4. [Claude Tag: Multiplayer-Agenten] — Anthropic bringt proaktive Slack-Agenten
Neue Claude-Funktionalität ermöglicht multiple, persistente Agenten in Slack, die proaktiv und asynchron arbeiten können. Teil eines breiter werdenden Trends zu Hintergrund-Agenten bei Stripe, Shopify und anderen. ([Quelle](https://www.latent.space/p/ainews-claude-tag-multiplayer-proactive))
5. [Meta-Harness-Ökosystem boomt] — Infrastruktur-Tools verdrängen manuelle Agent-Verwaltung
Conductor, OpenInspect, Cloudflares Flue und andere Meta-Harness-Systeme ersetzen zunehmend manuelle Agent-Orchestrierung. Zeigt Reifung des Agent-Infrastructure-Marktes. ([Quelle](https://www.latent.space/p/ainews-its-meta-harness-summer))
## Modell-Updates
- Claude Code v2.1.191: Neue `/rewind`-Funktion zum Zurückspulen vor `/clear`-Befehlen, Fehlerfix bei Background-Agenten, Voice-Fehlermeldungen verbessert. ([Quelle](https://github.com/anthropics/claude-code/releases/tag/v2.1.191))
- Claude Agent SDK v0.3.190: TypeScript SDK auf Parität mit Claude Code aktualisiert. ([Quelle](https://github.com/anthropics/claude-agent-sdk-typescript/releases/tag/v0.3.190))
## Forschung
- TheoremGraph: Neu entwickeltes System verbindet formale und informale Mathematik durch Statement-Level-Abhängigkeitsgraphen über 11,7M Theorem-Umgebungen. ([Quelle](https://arxiv.org/abs/2606.25363))
- Shepherd Framework: Ermöglicht programmierbare Meta-Agenten durch reversible Execution Traces für bessere Kontrolle über Agent-Hierarchien. ([Quelle](https://arxiv.org/abs/2605.10913))
- Agent-as-Router: Intelligente Routing-Systeme für Multi-Modell-Umgebungen, die Aufgaben basierend auf Modell-Stärken verteilen. ([Quelle](https://arxiv.org/abs/2606.22902))
- AGENTS.md-Evaluierung: Kontextdateien für Coding-Agenten unter wissenschaftlicher Lupe — erste rigorose Untersuchung ihrer tatsächlichen Effektivität. ([Quelle](https://arxiv.org/abs/2602.11988))
## Developer Tools
- Browser-Compat-DB: Simon Willison konvertierte Mozillas MDN-Kompatibilitätsdaten in SQLite-Datenbank inspiriert durch neuen MDN MCP Service. ([Quelle](https://simonwillison.net/2026/Jun/24/browser-compat-db/#atom-everything))
## Business & Policy
- Anthropic implementiert Ausweispflicht: EU-Nutzer müssen sich bei KI-Nutzung künftig identifizieren — Regulierungsdruck nimmt zu. ([Quelle](https://www.heise.de/news/Donnerstag-EU-Rueckzug-von-Binance-Anthropic-mit-Ausweispflicht-fuer-KI-Nutzer-11343838.html))
- OpenAI-Broadcom KI-Chip: Joint Venture arbeitet an eigenem Silicon für Training und Inferenz. Strategische Unabhängigkeit wird Priorität. ([Quelle](https://www.heise.de/news/Donnerstag-EU-Rueckzug-von-Binance-Anthropic-mit-Ausweispflicht-fuer-KI-Nutzer-11343838.html))
## Sonstiges
- Reid Hoffmans Kritik: LinkedIn-Gründer kritisiert xAI als "complete train wreck" und SpaceX als nicht primär KI-fokussiert. ([Quelle](https://fortune.com/2026/06/24/reid-hoffman-spacex-musk-openai-anthropic-gen-z-mistake/))
---
Fazit: Der Tag zeigt zwei Kerntrends: (1) Technische Reifung in Bias-Erkennung und Agent-Orchestrierung, (2) Intensivierung des Kostendrucks durch chinesische Konkurrenz und regulatorischer Druck in der EU.
Bereiche