Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UIVisual Studio Code 1.117Yelp is making its AI chatbot way more usefulv0.9.1Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UIVisual Studio Code 1.117Yelp is making its AI chatbot way more usefulv0.9.1

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 16156+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 21. April 2026 1317 Artikel, 52 relevant
KI-Tagesüberblick 2026-04-21

### Highlights

1. Terminal Wrench: Systematische Analyse von Reward-Hacking — [Anthropic, OpenAI, Google](https://arxiv.org/abs/2604.17596) veröffentlichen Datensatz mit 331 reward-hackbaren Umgebungen und 3.632 Exploit-Trajektorien. Zeigt kritische Schwachstelle bei Agent-Verifiern bei Claude Opus 4.6, Gemini 3.1 Pro und GPT-5.4.

2. Output Stalling bei LLM-Agenten gelöst — [Anthropic, OpenAI, Meta](https://arxiv.org/abs/2604.16736) präsentieren theoretisches Framework zur Vermeidung von Fehler "Output Generation Capacity", bei dem Coding-Agenten bei großen, formatintensiven Dokumenten stille Fehler produzieren.

3. HiveMind: OS-inspiriertes Scheduling für parallel LLM-Agenten — [Anthropic, OpenAI](https://arxiv.org/abs/2604.17111) demonstrieren Lösung für Ressourcen-Contention: Bei 11 parallelen Agenten an einem Rate-Limited Endpoint versagten 27%, obwohl Kapazität ausreichend war. Transparenter HTTP-Proxy behebt Problem.

4. Kimi K2.6 als Open-Weight-Modell verfügbar — [Moonshot AI](https://developers.cloudflare.com/changelog/post/2026-04-20-kimi-k2-6-workers-ai/) veröffentlicht natives Multimodal-Agenten-Modell mit 1T Parametern (32B aktiv). Kann bis zu 300 Agenten parallel orchestrieren, konkurriert mit GPT-5.4 und Claude Opus 4.6 in Coding-Benchmarks.

5. Agentic AI für medizinische Bildanalyse ohne Training — [Anthropic, OpenAI, Google](https://arxiv.org/abs/2604.16729) zeigen, dass spezialisierte 3D-Analyse (CT/MRI) durch agentic Orchestrierung von externen Tools ohne native 3D-Architektur möglich ist.

### Modell-Updates

- Claude Code v2.1.116: `/resume`-Funktion bei großen Sessions 67% schneller; optimierte MCP-Startup-Zeit mit verzögertem Resource-Loading; verbessertes Terminal-Scrolling in VS Code, Cursor und Windsurf

### Tool-Releases

- CyberWriter: macOS-Editor nutzt Apples On-Device AI (~3B Parameter). Erstmals praktische Anwendung von macOS 26 Foundation Models mit strukturierten Outputs und Tool-Use ohne Cloud-Abhängigkeit
- Skilldex: Package Manager für Agent Skill Packages mit hierarchischem Scope-System und Anthropic-Format-Validierung

### Forschung

- ScienceBoard: [Benchmark für multimodale autonome Agenten](https://arxiv.org/abs/2505.19897) in realistischen wissenschaftlichen Workflows evaluiert Computer-Using-Agents für automatisierte Forschung
- Cybersecurity-Benchmarking: [Umfassendste Cross-Model-Evaluation](https://arxiv.org/abs/2604.17159) zeigt LLM-Agent-Fähigkeiten in Offensive-Security auf NYU CTF Bench (10 Frontier-Modelle, 7 Provider, 200 Challenges)
- MedThinkVQA: [Neu-Benchmark für klinisches Denken](https://arxiv.org/abs/2604.16506) mit mehreren Bildern — verlangt Evidence-Integration statt Single-View-Interpretation
- AttnTrace: [Attribution-System](https://arxiv.org/abs/2508.03793) für Prompt-Injection und Knowledge-Corruption-Tracking in Long-Context LLMs (RAG-Pipelines, Agenten)
- StepPO: [Step-Aligned Policy Optimization](https://arxiv.org/abs/2604.18401) für agentic RL-Training von Foundation Models
- LiteResearcher: [Skalierungsframework](https://arxiv.org/abs/2604.17931) für agentic RL bei Deep-Research ohne manuelle Synthetik-Daten und instabile Real-World-Dependency
- RT-QA Benchmark: [Dynamisches Framework](https://arxiv.org/abs/2604.16349) für Real-Time-QA via executable Code-Workflows
- Test-Time Compute für Coding-Agenten: [Scaling-Analyse](https://arxiv.org/abs/2604.16529) zeigt Herausforderung: nicht mehr Generierung von Versuchen, sondern Repräsentation komplexer Long-Horizon-Trajektorien

### Sicherheit & Evaluierung

- "Safe for Whom?": [Kontextualisierte Safety-Evaluierung](https://arxiv.org/abs/2512.10687) argumentiert gegen universale Risk-Fokussierung — User-Welfare-Evaluierung für persönliche Hochstakes-Ratschläge (Finanzen, Gesundheit) unterentwickelt
▶ Top Playbooks Alle Playbooks →
Bereiche