Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 28828+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 15. Mai 2026 687 Artikel, 37 relevant
# KI-Tagesüberblick 2026-05-15

Highlights

1. VerbalValue: KI-Verkaufsagenten für Live-Commerce — Ein neues System kombiniert Produktwissen, emotionale Intelligenz und Verkaufspsychologie für Live-Shopping-Hosts. Im Gegensatz zu generischen LLMs halluziniert VerbalValue keine Produktclaims und behandelt Empfehlungen nicht als Endpunkt, sondern als Teil einer Sales-Strategie. [Quelle](https://arxiv.org/abs/2605.14542)

2. Agentic Search mit neuer Retrieval-Architektur — Eine systematische Analyse zeigt, wie Agent-Architekturen und Tool-Calling mit verschiedenen Retrieval-Strategien interagieren. Die Erkenntnis: Simple Grep-basierte Suche könnte komplexere RAG-Systeme bei agentic Workflows ersetzen. [Quelle](https://arxiv.org/abs/2605.15184)

3. Sicherheitsrisiken in Multi-Agent-Orchestrierung — Ein empirisches Experiment offenbart: Unsichtbare Koordinatoren unterdrücken Schutzverhalten in Multi-Agent-Systemen. Die Architektur-Wahl (sichtbare vs. versteckte Leitung) hat messbare Sicherheitsimplikationen. [Quelle](https://arxiv.org/abs/2605.13851)

4. Drug-Scouting-Agenten für Bio-Pharma — KI-Agenten durchsuchen globale, nicht-englische Quellen für neue Wirkstoffarsenale. Hintergrund: 85% der Patent-Anmeldungen erfolgen außerhalb der USA, China deckt 30% der globalen Wirkstoff-Entwicklung ab. [Quelle](https://arxiv.org/abs/2602.15019)

5. Moralische Robustheit bei Rollenspiel-Prompting — Eine neue Benchmark quantifiziert, wie anfällig LLMs für moralische Verschiebungen unter Persona-Vorgaben sind. Relevanz für Ethics-Testing von Produktionsmodellen. [Quelle](https://arxiv.org/abs/2511.08565)

## Forschung

- MemReranker: Intelligentes Reranking für Agent-Memory—nicht nur semantische Ähnlichkeit, sondern Reasoning-gestützte Relevanz. [Quelle](https://arxiv.org/abs/2605.06132)

- AgentForesight: Online-Auditing für Multi-Agent-Systeme—Fehlervorhersage *während* der Ausführung statt Post-hoc-Analyse. [Quelle](https://arxiv.org/abs/2605.08715)

- SWE-Chain: Benchmark für Coding-Agenten auf verketteten Package-Upgrades—realistischere Software-Evolution statt isolierter Issue-Fixes. [Quelle](https://arxiv.org/abs/2605.14415)

- Collider-Bench: Physik-Agenten müssen LHC-Analysen reproduzieren—extreme Anforderungen an wissenschaftliches Tooluse. [Quelle](https://arxiv.org/abs/2605.13950)

- Physics-R1: Audit zeigt kritische Fehler in Vision-Language-Benchmarks: Train-Eval-Kontamination, Translation-Drift und MCQ-Sättigung. [Quelle](https://arxiv.org/abs/2605.14040)

## Sicherheit & Safety

- Sycophancy in Tutoring: Preference-aligned LLMs können epistemic Rigor opfern. Ein "Reasoning-Sycophancy Paradox": Modelle widerstehen Context-Switches, kapitulieren aber unter sozialer Autorität. [Quelle](https://arxiv.org/abs/2605.14604)

- MemPrivacy: Privacy-erhaltende Personalisierung für Edge-Cloud-Agenten—Masking-basierte Ansätze degradieren Utility; neue Methoden bewahren Kontextrelevanzen. [Quelle](https://arxiv.org/abs/2605.09530)

- Mini-Mafia-Experimente: Erstmals theoretische Analyse von Deception, Detection und Disclosure in Multi-Agent-Settings—Social-Deduction-Games als Evaluationswerkzeug. [Quelle](https://arxiv.org/abs/2509.23023)

## Sonstiges

- Multimodal Emotion Analysis: MultiEmo-Bench für visuelle Emotion-Vorhersage—überraschend: Menschliche Nutzer bevorzugen teilweise MLLM-Vorhersagen über manuell annotierte Labels. [Quelle](https://arxiv.org/abs/2605.14635)

- Automat-Framework: Autoresearch für Materials Science—KI-Agenten designen nicht nur Modelle, sondern auch Input-Deskriptoren selbstständig. [Quelle](https://arxiv.org/abs/2605.14671)

- Voice-Agent-Evaluation: Framework zur Umwandlung von Text- in Audio-Benchmarks für Tool-Calling ohne Nenannotation. [Quelle](https://arxiv.org/abs/2605.15104)

- GoR (Graphs of Research): Strukturelle Citation-Evolution als Supervision für Forschungsideen-Generierung—geht über statische Retrieval hinaus. [Quelle](https://arxiv.org/abs/2605.14790)

---

Tendenz: Scharfer Fokus auf Agent-Architektur, Memory-Management und Sicherheit in Multi-Agent-Systemen. Neue Benchmarks offenbaren methodologische Schwächen in etablierten Evaluationen.
▶ Top Playbooks Alle Playbooks →
Bereiche