★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 03. Juni 2026
764 Artikel, 28 relevant
# KI-Tagesüberblick 2026-06-03
Highlights
1. Sicherheitslücke in LLM-Agenten: Indirekte Prompt-Injection über SaaS-Integrationen — [AgentRedBench](https://arxiv.org/abs/2606.02240) deckt ein Produktionsrisiko auf: LLM-Agenten, die über Tool-Calls auf Gmail, Salesforce oder Jira zugreifen, sind anfällig für versteckte Angriffe in Inhalten, die Nutzer nicht kontrollieren. Bestehende Benchmarks erfassen die Bedrohung nur unzureichend.
2. Geschlechterspezifische Verzerrungen in medizinischer KI-Triage — [Neue Studie](https://arxiv.org/abs/2606.03641) zeigt: Gemini, Claude und GPT klassifizieren identische neurologische Symptome je nach Patientengeschlecht unterschiedlich ein. Bei Turn-basiertem Adversarial Attack steigen unsichere Reaktionen von 35% auf 80% an.
3. Mathematisches Reasoning: GTBench für LLMs in der Graphentheorie — [GTBench](https://arxiv.org/abs/2606.03144) evaluiert LLMs systematisch als Forschungsassistenten mit 63 strukturierten Problemen. Deckt Lücken in der Zuverlässigkeit als mathematische Reasoning-Tools auf.
4. Agentic AI und Build-vs-Buy-Entscheidungen — [Neue Studie](https://arxiv.org/abs/2606.03907) untersucht, wie autonome Coding-Agenten Bibliotheks- und Implementierungsentscheidungen treffen — mit direkten Auswirkungen auf Security, Lizenzen und Maintainability.
5. vLLM Semantic Router für Multi-Modality-Deployments — [Framework](https://arxiv.org/abs/2603.04444) löst das Routing-Problem bei diversifizierten Modellen durch "composable signal orchestration" und wählt zur Laufzeit das optimale Modell pro Query.
## Forschung
- Chatbot-Semantik: [Philosophische Analyse](https://arxiv.org/abs/2606.02973) zur Frage, ob KI-Antworten tatsächlich bedeutungsvolle Propositionen ausdrücken — über die technische Aussage "ja" hinaus.
- Autonome Labore: [LAP-Protokoll](https://arxiv.org/abs/2606.03755) standardisiert die Schnittstelle zwischen LLM-Agenten und physischen Instrumenten — bisher ein fragmentiertes Problem ohne einheitliches Standard.
- Token-Effizienz für Code-Agenten: [Cross-Lingual Token Arbitrage](https://arxiv.org/abs/2606.03618) reduziert Input-Kosten durch Edge-seitige Prompt-Rewriting für nicht-englische Texte und strukturelle Redundanzen.
- API-Wissenlücken: [NovelAPIB-Benchmark](https://arxiv.org/abs/2606.03657) bewertet, wie LLMs APIs verwenden, die nicht in Trainingsdaten vorkamen — jenseits bloßer Funktionsnamen-Erinnerung.
- Agent-Trainings-Effizienz: [Studie](https://arxiv.org/abs/2606.03461) zeigt überraschend: Starke Code-Agenten sind nicht automatisch die besten Lehrer für Nachtraining.
## Tool-Releases
- Claude Code v2.1.161 — OTEL-Metriken mit Custom Labels, verbesserte Agent-Ausgabe (done/total), MCP-Connector-Verwaltung optimiert.
- Claude Agent SDK TypeScript v0.3.161 — `initialize`-Kontrollmeldungen nun idempotent; neue `pending_permission_requests`-Feld für Fehlerbehandlung.
## Sonstiges
- Multi-Turn Jailbreaks: [MultiTurnPSB](https://arxiv.org/abs/2606.02630) zeigt, dass medizinische Chatbots bei mehrstufigen adversarialen Angriffen anfällig werden — realistische User-Szenarien offenbaren Sicherheitslücken.
- LLM-basierte Supply-Chain-Simulation: [Studie](https://arxiv.org/abs/2604.17220) nutzt LLMs zur Modellierung von kognitiven Verzerrungen in Multi-Stage-Entscheidungsprozessen.
Bereiche