★ Aktuell
Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...
• google
• developers
Google has updated its account settings to allow U.S. users to change their @gmail.com usernames while keeping all exist...
• developers
The Agent Development Kit (ADK) SkillToolset introduces a "progressive disclosure" architecture that allows AI agents to...
• developers
The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...
• developers
The newly introduced continuous checkpointing feature in Orbax and MaxText is designed to optimize the balance between r...
• developers
Google has released version 1.0.0 of the Agent Development Kit (ADK) for Java, introducing powerful new features like Go...
• google
To bridge the gap between static model knowledge and rapidly evolving software practices, Google DeepMind developed a "G...
• google
The provided workflow streamlines motion-controlled game development by using Gemini Canvas to rapidly prototype mechani...
• google
This blog post introduces a workflow for extracting high-quality data from complex, unstructured documents by combining ...
▶ Tages-Digest — 29. April 2026
579 Artikel, 19 relevant
KI-Tagesübersicht 2026-04-29
### Highlights
1. KI-Agenten implementieren eigenständig Machine-Learning-Pipelines — [Frontier Coding Agents](https://arxiv.org/abs/2604.25067) können nun komplexe ML-Systeme wie AlphaZero Self-Play eigenständig umsetzen. Dies signalisiert Fortschritte bei der autonomen KI-Forschungsbeschleunigung — ein zentraler Indikator für rekursive Selbstverbesserung.
2. Semantische Layer reduzieren Halluzinationen in LLM-Datenanalyse — [Neue Benchmark-Studie](https://arxiv.org/abs/2604.25149) zeigt: Frontier-Modelle (Claude Opus 4.7, Claude Sonnet 4.6, GPT-5.4) liefern deutlich genauere Ergebnisse, wenn Geschäftssemantik explizit kontextualisiert wird statt aus DB-Schemas inferiert zu werden.
3. Anthropic überholt OpenAI in Bewertung — [Anthropic erreichte $1T Valuation](https://www.the-independent.com/tech/anthropic-openai-value-ai-b2963575.html) und übertrifft damit OpenAI, während OpenAI [gleichzeitig Umsatzziele verfehlt](https://the-decoder.de/openai-verfehlt-interne-umsatz-und-nutzerziele-im-wettlauf-zum-boersengang/).
4. LinuxArena: Größte Benchmark für Software-Engineering-Agenten — [Neue Testumgebung](https://arxiv.org/abs/2604.15384) mit 1.671 legitimen und 184 Safety-Tasks in Live-Produktionsumgebungen zur robusten Evaluation von Agenten.
5. Strukturierte Research-Tools für Deep-Research-Agenten — [EigentSearch-Q+](https://arxiv.org/abs/2604.07927) implementiert strukturierte Query- und Evidence-Processing-Tools statt unstrukturierter Web-Suche, reduziert redundante Exploration.
### Tool-Releases
- Claude Code v2.1.122 & v2.1.123 — [Bedrock Service-Tier-Auswahl](https://github.com/anthropics/claude-code/releases), PR-URL-Resumption und erweiterte MCP-Connector-Integration
- Gemini CLI v0.40.0 — [OpenSSL 3.x-Fehler-Handling](https://github.com/google-gemini/gemini-cli/releases/tag/v0.40.0) bei Streaming verbessert
- macOS Agent-Tool (Cua) — [GUI-Automation ohne Cursor-Kontrolle](https://github.com/trycua/cua) ermöglicht paralleles Arbeiten während Agent läuft
### Forschung
- Autoformalisierung mit Roundtrip-Verification — [Neue Methode](https://arxiv.org/abs/2604.25031) prüft Treue von LLM-Formalisierungen ohne Ground-Truth durch Reverse-Translation und formale Äquivalenz-Checks
- LLMs als Annotationsassistenten, nicht als unabhängige Annotatoren — [Studie zeigt](https://arxiv.org/abs/2503.06778): LLMs funktionieren als Workflow-Helfer, nicht als Ersatz für Human-in-the-Loop
- Automatisiertes Red-Teaming mit Learning-Ansätzen — [Struktur für adversariale Suche](https://arxiv.org/abs/2512.20677) skaliert Sicherheitsevaluation besser als manuelle Expert-Audits
- Security für Agent Skills — [Robust Pre-Load-Auditing](https://arxiv.org/abs/2604.25109) als 3-Wege-Klassifikation gegen Semantik-Umgehungen
### Business & Politik
- Google-Pentagon-Deal für "lawful" KI-Einsatz — [Vereinbarung unterzeichnet](https://www.theverge.com/ai-artificial-intelligence/919494/google-pentagon-classified-ai-deal), erlaubt DoD breite Nutzung von Googles KI-Modellen
- OpenAI unter Druck — Verfehlung von Q1-2026-Zielen bei gleichzeitigem Konkurrenzdruck durch Anthropic und Google
### Sonstiges
- Psychologische Beratungs-Agenten — [PsychAgent](https://arxiv.org/abs/2604.00931) nutzt Experience-Driven Lifelong Learning statt statischer Fine-Tuning-Datasets für kontinuierliche Verbesserung
Bereiche