★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 01. Mai 2026
556 Artikel, 32 relevant
# KI-Tagesüberblick 2026-05-01
Highlights
1. Consensus Paradox in Multi-Agent-Systemen — Anthropic und OpenAI-Forscher zeigen, dass agentic swarms bei der Zusammenarbeit interne architektonische Einigung über externe logische Wahrheit priorisieren. Die "Wisdom of the Crowd"-Annahme wird damit fundamental in Frage gestellt ([The Inverse-Wisdom Law](https://arxiv.org/abs/2604.27274)).
2. In-Context Prompting überholt Agent Orchestration — Neue Forschung belegt, dass für prozedurale Aufgaben einfache System-Prompts mit Self-Orchestration komplexe Frameworks wie LangGraph und CrewAI übertreffen ([arxiv:2604.27891](https://arxiv.org/abs/2604.27891)).
3. Claude und Codex dominieren Agenten-Entwicklung — Beide Plattformen verzeichnen erhebliche Updates: Claude fokussiert auf kreative Arbeiten, Codex auf Knowledge Work, wobei "Coding Agents die Containment brechen" ([Latent Space](https://www.latent.space/p/ainews-agents-for-everything-else)).
4. LLM-Variabilität bei kritischen Aufgaben — Studie zeigt große Unterschiede zwischen LLM-Modellen beim Evidence Screening in systematischen Reviews, mit Risiken für die Validität von Forschung ([arxiv:2604.27006](https://arxiv.org/abs/2604.27006)).
5. TEA Nets Framework — Neue Open-Source-Methode kombiniert KI mit Cognitive Network Science zur Extraktion von Agents, Events und Targets aus Texten mit praktischen Anwendungen in Sentiment-Analyse ([arxiv:2604.27673](https://arxiv.org/abs/2604.27673)).
## Tool-Releases
- CrewAI 1.14.4: Azure OpenAI Responses API Support, Tavily Research Integration, You.com MCP Tools für Search und Content Extraction ([GitHub Release](https://github.com/crewAIInc/crewAI/releases/tag/1.14.4))
- Claude Code v2.1.126: Model-Picker für Anthropic-kompatible Gateways, neuer `claude project purge` Befehl für State-Management ([GitHub Release](https://github.com/anthropics/claude-code/releases/tag/v2.1.126))
- Codex CLI 0.128.0: `/goal`-Feature ermöglicht iterative Zielabarbeitung mit Token-Budget-Limits ([Simon Willison](https://simonwillison.net/2026/Apr/30/codex-goals/))
## Forschung
- LLMs für Agent-Based Models: Studie evaluiert 17 aktuelle LLMs bei der Implementierung von ABMs — Zuverlässigkeit für formale Spezifikationen ist begrenzt ([arxiv:2602.10140](https://arxiv.org/abs/2602.10140))
- Sicherheit im Smart Grid: Untersuchung von Jailbreak-Anfälligkeit in LLM-Assistenten für Stromnetzbetrieb gegen NERC-Standards ([arxiv:2604.23341](https://arxiv.org/abs/2604.23341))
- OpenClassGen Datensatz: 324.843 Python-Klassen aus Open-Source für robustere LLM-Evaluationen bei Code-Generation ([arxiv:2504.15564](https://arxiv.org/abs/2504.15564))
- Memory-Management in Coding Agents: Contextuales Bandits-Framework für sichere Memory-Retrieval bei Debug-Erfahrungen ([arxiv:2604.27283](https://arxiv.org/abs/2604.27283))
- Medizinische Multimodal-RAG: MED-VRAG nutzt Dokument-Bilder statt nur Text für bessere Informationsretrieval in Medical QA ([arxiv:2604.27724](https://arxiv.org/abs/2604.27724))
- Agentic Education: Strukturiertes Curriculum zum Erlernen von Claude Code durch praktische Projekte ([arxiv:2604.17460](https://arxiv.org/abs/2604.17460))
## Sonstiges
- Rolle-Fidelity-Problem: Multi-Agent-Pipelines zur politischen Analyse zeigen, dass LLMs zuverlässig zugewiesene Rollen nicht durchgehend beibehalten ([arxiv:2604.27228](https://arxiv.org/abs/2604.27228))
- Klinische Kohärenz: Health-Coaching-Agents benötigen Dual-Stream Memory für Konsistenz zwischen Patient-Reports und EHR-Daten ([arxiv:2604.27045](https://arxiv.org/abs/2604.27045))
Bereiche