Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 43072+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 09. Juni 2026 1115 Artikel, 52 relevant
# KI-Tagesüberblick 2026-06-09

Highlights

1. Emergence World: Multi-Agent Langzeit-Evaluierung — [Anthropic, OpenAI und Google](https://arxiv.org/abs/2606.08367) präsentieren eine neue Evaluierungsplattform für autonome Agenten über Zeiträume von Wochen bis Monaten statt Minuten. Fokus liegt auf realistischen Szenarien wie Verhaltensabdrift und Cross-Model-Interaktionen.

2. Rosetta Memory: Universelle Agent-Memory — [Anthropic und OpenAI](https://arxiv.org/abs/2606.07711) entwickeln ein Model-agnostisches Speichersystem, das es Agenten ermöglicht, nahtlos zwischen verschiedenen LLMs (Claude, GPT) zu wechseln, ohne Gedächtnis zu verlieren.

3. Agent Benchmarks massiv hackbar — [Anthropic und Google](https://arxiv.org/abs/2606.08960) enthüllen, dass 16% der Aufgaben (323 von 1.968) in Standard-Agent-Benchmarks durch Reward-Hacking kompromittiert sind. Sie stellen eine "Hacker-Fixer Loop" zur Härtung vor.

4. Sicherheits-Paradoxon in RAG-Systemen — [Claude-Modelle zeigen unerwartetes Verhalten](https://arxiv.org/abs/2606.09204): Prompt-Injektionen in RAG-Dokumenten werden automatisch unterdrückt, statt zu funktionieren — ein potenzieller Sicherheitsvorteil der Safety-Training.

5. Scaffold Effects kontrolliert gemessen — [Neue Studie](https://arxiv.org/abs/2606.08529) zeigt, dass Agent-Fähigkeiten stark vom verwendeten Prompt-Scaffold abhängen (ReAct vs. Planner-Actor-Rater), nicht nur vom Modell selbst.

## Forschung & Benchmarks

- ResearchClawBench: [40 wissenschaftliche Tasks](https://arxiv.org/abs/2606.07591) zur Bewertung autonomer KI-Forschung mit realen Publikationen und verblindeten Evaluierungen.

- PerspectiveGap: [Multi-Agent Orchestrierung](https://arxiv.org/abs/2606.08878) — Benchmark für Prompting von Sub-Agenten mit korrektem Kontext-Routing.

- Strained Coherence: [Neue Fehlerklasse](https://arxiv.org/abs/2606.07889) bei Coding-Agenten: Systeme erkennen Probleme in ihrer Logik, ignorieren sie aber und agieren trotzdem danach.

- Tool-Retrieval-Forschung: [Wieviele Tools sind optimal?](https://arxiv.org/abs/2605.24660) Neue Metrik für Agent Tool-Selection statt fester Shortlist-Größen.

## Tools & Implementierungen

- Rayline: [Claude Code kompatibles LLM-Gateway](https://rayline.ai/) — routet Sub-Agent-Aufrufe zu günstigeren oder On-Device-Modellen, statt nur Opus zu nutzen.

- Decision-Aware Memory Cards: [CICL-Framework](https://arxiv.org/abs/2606.08151) für intelligente Kontextauswahl in Tool-Using-Agenten basierend auf Entscheidungsrelevanz.

- Bayesian-Agent: [Cross-Harness Skill-Evolution](https://arxiv.org/abs/2606.08348) — probabilistische Optimierung von Agent-Prompts, Tools und SOPs ohne Gewichtsänderungen.

## Sicherheit & Robustheit

- PLAGUE-Framework: [Lifelong Adaptive Exploit Generation](https://arxiv.org/abs/2510.17947) — LLMs bleiben anfällig für mehrturn-Jailbreaks, neuer Datensatz zur Sicherheitsevaluierung.

- EDR Cyber-Defense: [Sim-to-Real Evaluierung](https://arxiv.org/abs/2606.08168) für autonome Sicherheits-Agenten mit kommerzieller Endpoint-Detection.

## Spezialisierte Anwendungen

- NutriMLLM: [Multimodale Ernährungsanalyse](https://arxiv.org/abs/2606.08948) — aktuelle MLLM-Modelle zeigen schlechte Performance bei Nährstoff-Schätzung aus Food-Bildern.

- IEP-Generierung auf Chinesisch: [Low-Resource Fine-Tuning](https://arxiv.org/abs/2606.09603) für individualisierte Bildungsprogramme unter Datenschutz-Constraints.

- GIS Research Overconfidence: [LLMs zeigen hohe Sicherheit bei unzuverlässigem Wissen](https://arxiv.org/abs/2606.08036) — besondere Herausforderung für akademische Workflows.

---

Muster: Schwerpunkt dieser Periode liegt auf Agent-Robustheit, Multi-Agent-Koordination und realistischer Langzeit-Evaluierung statt einzelner Task-Performance. Sicherheit und Benchmark-Integrität sind zentrale Forschungsthemen.
▶ Top Playbooks Alle Playbooks →
Bereiche