Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 45569+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 15. Juni 2026 404 Artikel, 14 relevant
KI-Tagesüberblick 2026-06-15

### Highlights

1. Sicherheitslücke in LLM-Guardrails entdeckt — Forscher von Anthropic, OpenAI und Google haben eine neue Denial-of-Service-Vulnerabilität in KI-basierten Schutzvorrichtungen aufgedeckt: Angreifer können crafted Daten injizieren, um Guardrails in endlose Reasoning-Schleifen zu treiben und damit Agenten lahmzulegen. ([arXiv:2606.14517](https://arxiv.org/abs/2606.14517))

2. Dramatische Verbesserung bei autonomen Agenten-Benchmarks — Der WorkBench-Benchmark zeigt massive Fortschritte: Claude Opus 4.8 komplettiert 89% der Workplace-Tasks (vs. 43% bei GPT-4 vor 2 Jahren) und reduzierte unbeabsichtigte Schäden von 26% auf 2,5%. ([arXiv:2606.13715](https://arxiv.org/abs/2606.13715))

3. Neue KI-Agenten-Collaboration ohne zentrale API — Das "tap"-Protokoll ermöglicht erstmals reibungslose Zusammenarbeit zwischen LLM-Agenten verschiedener Anbieter über dateibasierte Kommunikation, ohne gemeinsame Runtime oder zentrale Server vorauszusetzen. ([arXiv:2606.14445](https://arxiv.org/abs/2606.14445))

4. Anthropic-Stake von FTX wurde für $75 Milliarden bewertet — Die Kryptobörse FTX hielt vor ihrem Kollaps 7,84% an Anthropic; die aktuelle Bewertung von ~$965 Mrd. macht diese Position wertvoll für die Gläubiger, deren Forderungen nun teilweise bedient werden. ([Hacker News](https://news.ycombinator.com/item?id=48529190))

5. CacheRL erreicht 92% Genauigkeit bei Multi-Turn-Agententraining — OpenAI und Partner präsentieren ein System, das kleine Agent-Modelle mit 100x weniger Rechenaufwand auf das Niveau von GPT-5 (94%) bringt, indem es Rollout-Caching und Hybrid-Rewards nutzt. ([arXiv:2606.14179](https://arxiv.org/abs/2606.14179))

### Forschung

- Agenten-Codierungsverhalten analysiert: KI-Coding-Agenten finden die richtige Datei, scheitern aber oft bei der Lokalisierung der exakten Zeile — der neue SWE-Explore-Benchmark isoliert diese Fähigkeitslücke erstmals. ([The Decoder](https://the-decoder.de/ki-coding-agenten-finden-die-richtige-datei-aber-nicht-die-richtige-zeile/))

- Bias-Messung ohne methodische Fallstricke: Ein neuer statistischer Rahmen adaptiert psychologische IAT-Tests für LLMs und trennt erstmals zuverlässig Verweigerungsverhalten von tatsächlicher Bias-Performance. ([arXiv:2606.14117](https://arxiv.org/abs/2606.14117))

- Git-basierte Agenten-Memory-Verwaltung: GitOfThoughts ermöglicht es, Reasoning-Prozesse von Agenten wie Software zu versionieren — mit vollständiger Diff-, Merge- und Audit-Funktionalität. ([arXiv:2606.14470](https://arxiv.org/abs/2606.14470))

- Skill-Evolution ohne Ground-Truth: SkillAudit entwickelt Agenten-Skills während des Deployments weiter, ohne Validierungsscores oder versteckte Test-Ergebnisse zu benötigen. ([arXiv:2606.14239](https://arxiv.org/abs/2606.14239))

- Agenten verstehen lokale Social-Norms: Das LoSoNA-Benchmark testet, ob LLM-Agenten implizite Konversationsnormen in Gruppenchats erkennen und adaptieren können. ([arXiv:2606.14600](https://arxiv.org/abs/2606.14600))

- Code-Agents ohne Chain-of-Thought: Frontier-Modelle können komplexes Reasoning intern durchführen, ohne explizite Thinking-Tokens zu nutzen — ein Problem für Sicherheitsüberwachung. ([arXiv:2606.07157](https://arxiv.org/abs/2606.07157))

- Dialogue-basierte Code-Agenten-Bewertung: Dialogue SWE-Bench bewertet realistische interaktive Coding-Agenten erstmals im Dialog-Modus statt nur als autonome Systeme. ([arXiv:2606.13995](https://arxiv.org/abs/2606.13995))

### Governance & Regulierung

- Open-Source-Governance für AI-Agenten: Neue Forschung analysiert, wie traditionelle Human-zentrierte Prozesse (Contributor-Agreements, Code-of-Conduct) sich für autonome und semi-autonome AI-Contributor anpassen müssen. ([arXiv:2606.14594](https://arxiv.org/abs/2606.14594))

### Tools & Systems

- VikingMem: Ein Memory-Management-System für stateful LLM-Anwendungen mit besserer Generalisierung über verschiedene Use-Cases hinweg. ([arXiv:2605.29640](https://arxiv.org/abs/2605.29640))

- SpheriCity: Ein Expert-grounded Conversational-AI-Prototyp zur Unterstützung von Nachhaltigkeitsentscheidungen basierend auf Sustainability-Reports. ([arXiv:2606.13854](https://arxiv.org/abs/2606.13854))
▶ Top Playbooks Alle Playbooks →
Bereiche