★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 16. Juni 2026
971 Artikel, 61 relevant
# KI-Tagesüberblick 2026-06-16
Highlights
1. Multi-Agent Kooperation und Vertrauen im Fokus — Neue Forschung untersucht, ob große Sprachmodelle in nächster Generation ihre kooperativen Verhaltensweisen bewahren oder ob Skalierung diese verändert. Parallel wird erstmals ein Messverfahren für Vertrauen zwischen KI-Agenten etabliert, basierend auf kostspieliger Verifikation in kooperativen Szenarien.
2. Sicherheitslücken in LLM-basierten Such-Agenten identifiziert — Das Framework [SearchGEO](https://arxiv.org/abs/2606.16821) zeigt, dass Web-Search-Agenten anfällig für Manipulation sind: Angreifer können falsche Inhalte in Empfehlungen verwandeln. Eine systematische Taxonomie mit fünf Angriffsmustern wurde entwickelt.
3. KI-Kill-Switch-Forschung vorangetrieben — [KillBench](https://arxiv.org/abs/2511.13725) präsentiert erste Benchmarks zur Bewertung, ob externe Mechanismen böswillige oder fehlerhaft agierende KI-Systeme zuverlässig stoppen können.
4. Small Language Models als autonome Agenten einsatzfähig — [EffGen](https://arxiv.org/abs/2602.00887) ermöglicht lokale Deployment kleiner Sprachmodelle als Agenten mit reduzierten Kosten und Datenschutzvorteilen gegenüber API-basierter Nutzung großer Modelle.
5. Fairness von LLM-Agenten in der Praxis gemessen — [AgentFairBench](https://arxiv.org/abs/2606.16723) zeigt demografische Disparitäten in Agenten-Aktionen (Personalauswahl, Kreditvergabe, Triaging) — ein bisher vernachlässigtes Evaluierungsfeld.
## Forschung
- Agent-Architektur & Routing: [HyDRA](https://arxiv.org/abs/2605.17106) optimiert heterogene LLM-Pools durch dynamisches Multi-Dimensional-Routing statt binärer Entscheidungen. [VisualClaw](https://arxiv.org/abs/2606.16295) reduziert Video-Latenz bei Multimodal-Agenten durch Self-Evolution.
- Reasoning & Symbolische Integration: [PrologMCP](https://arxiv.org/abs/2606.14935) standardisiert logische Problemdelegation an Prolog-Solver. [LLM-WikiRace-Benchmark](https://arxiv.org/abs/2602.16902) misst Planungs- und Reasoning-Fähigkeiten über reale Knowledge Graphs.
- Sicherheit & Privacy: [AgentLeak](https://arxiv.org/abs/2602.11510) dokumentiert Datenlecks über Inter-Agent-Kanäle, die Output-Audits übersehen. [SPARK](https://arxiv.org/abs/2606.16244) verbessert sichere Code-Generierung durch Aktivierung bestehenden Sicherheitswissens ohne Fine-Tuning.
- Kontinuierliches Lernen: [Mechanistic Analysis](https://arxiv.org/abs/2601.18699) untersucht katastrophales Vergessen bei sequentiellem Fine-Tuning über 20 State-of-the-Art-Modelle.
- Kontextuelle Grounding: [ACCORD](https://arxiv.org/abs/2606.16432) löst das Problem unterspezifizierter Anweisungen durch Action-Conditional Contextual Grounding in digitalen/physischen Umgebungen.
- Multi-Agent-Ökonomien: [CoffeeBench](https://arxiv.org/abs/2606.16613) evaluiert Agenten über längere Horizonte in heterogenen Multi-Agent-Wirtschaften mit Kommunikation und Verhandlung.
## Business & Anwendungen
- Production Search Ranking: [AI Co-Scientist Framework](https://arxiv.org/abs/2603.22376) schließt Research-Loop für große Online-Reiseplatformen durch LLM-Agenten mit direktem Cloud-Compute-Zugang.
- Hardware-Optimierung: [Embedded Arena](https://arxiv.org/abs/2606.16190) automatisiert die Optimierung von KI-Modellen für Microcontroller unter harten physischen Constraints.
- Mental-Health-Forschung: [Cloze](https://arxiv.org/abs/2606.15033) bietet offene Plattform für kontrollierte Studien zu Human-AI-Konversationen über ChatGPT, Claude, Gemini.
- Concurrency Control: [CoAgent](https://arxiv.org/abs/2606.15376) adressiert klassisches Concurrency-Problem, wenn mehrere Agenten parallel Shared State mutieren (Git, Kubernetes, Dokumente).
## Sonstiges
- LLM-gestützte Annotation: [Stance Detection in Scientific Discourse](https://arxiv.org/abs/2606.15566) validiert LLMs zur qualitativen Kodierung in schwierigen Fällen (z.B. Bayesian-Realism vs. Instrumentalism).
---
Gesamteindruck: Der Schwerpunkt liegt auf Multi-Agent-Systemen, ihrer Sicherheit, Fairness und praktischen Governance. Erstmalig erscheinen Benchmarks für bisher unbeantwortete Fragen (Vertrauen, Kill-Switches, Agent-Fairness). Lokale Deployment-Optionen für kleinere Modelle gewinnen an Relevanz parallel zu großflächiger Produktions-Integration.
Bereiche