Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 28031+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 14. Mai 2026 668 Artikel, 32 relevant
KI-Tagesüberblick 2026-05-14

### Highlights

1. Torrix: Self-Hosted LLM-Observability ohne Infrastruktur-Overhead — Ein neues Open-Source-Tool ermöglicht LLM-Observability in einer einzelnen Docker-Container mit SQLite-Backend statt komplexer PostgreSQL/Redis-Setups. Ziel ist die Senkung von Adoptionsbarrieren für Production-Monitoring von AI-Agenten. [(GitHub)](https://github.com/torrix-ai/install)

2. Grid-Orch: LLM-gesteuerte Simulationen für Stromnetze — Ein Framework verbindet Large Language Models mit Power-Distribution-Simulationen über das Model Context Protocol. Ermöglicht Ingenieuren komplexe Netzwerk-Analysen per Natursprache – adressiert Fachkräftemangel in der Energiewirtschaft. [(arXiv)](https://arxiv.org/abs/2605.12728)

3. RTLC-Prompting verbessert LLM-as-Judge-Genauigkeit — Ein dreistufiges Prompting-Schema (Research-Teach-to-Learn-Critique) erhöht die Urteilsgenauigkeit von LLMs beim Benchmarking ohne Fine-Tuning. Basiert auf der Feynman-Lernmethode. [(arXiv)](https://arxiv.org/abs/2605.13695)

4. Agentick: Einheitlicher Benchmark für Sequential Decision-Making — Erste Benchmark-Suite zur fairen Vergleichbarkeit von RL-, LLM-, VLM- und Hybrid-Agenten auf gemeinsamer Grundlage. [(arXiv)](https://arxiv.org/abs/2605.06869)

5. Sicherheitslücke bei Omnimodalen LLMs erkannt — Neue Studien zeigen, dass Multimodal-Modelle textliche Widersprüche zu ihren eigenen Sinneseingaben (Video/Audio) nicht konsistent erkennen. [(arXiv)](https://arxiv.org/abs/2605.13737)

### Tool-Releases

- OpenCode AI-Agent für Python — Open-Source Terminal-Agent für Code-Analyse und Refactoring mit freiem Google-Gemini-API-Zugang. [(Real Python Guide)](https://realpython.com/opencode-guide/)

- Claude Agent SDK v0.2.141 & Claude Code v2.1.141 — Neue Versionen mit erweiterten Task-Management-Exports und verbesserter Desktop-Integration (Notifications, Workspace Identity Federation). [(GitHub)](https://github.com/anthropics/claude-agent-sdk-typescript/releases/tag/v0.2.141)

### Forschung

- LLM-Zielwahl divergiert von menschlichen Präferenzen — Empirische Studie zeigt, dass Sprachmodelle bei der autonomen Zielauswahl nicht zuverlässig menschliche Präferenzen abbilden. [(arXiv)](https://arxiv.org/abs/2603.03295)

- Interpretierbarkeit von Agent-Verhalten — Neue Methoden zur Strukturierung von Reasoning-Trajektorien und Execution-Traces für bessere Diagnose von Agent-Ineffizienzen. [(arXiv)](https://arxiv.org/abs/2605.13625)

- Multimodale LLM-Agenten in der Wissenschaftlichen Visualisierung — Vergleichende Evaluierung verschiedener Agent-Paradigmen (domain-spezifisch vs. Computer-Use vs. Coding-Agenten) auf SciVis-Aufgaben. [(arXiv)](https://arxiv.org/abs/2604.27996)

- SimWorld Studio: Automatische 3D-Environment-Generierung — LLM-basierte Kodierungs-Agenten generieren diverse, interaktive 3D-Szenen für das Training von embodied Agents. [(arXiv)](https://arxiv.org/abs/2605.09423)

- VERA-MH: KI-Sicherheit in psychischer Gesundheit — Automatisierte Evaluierung von Chatbot-Sicherheit in Mental-Health-Kontexten mit klinischer Expertise. [(arXiv)](https://arxiv.org/abs/2510.15297)

- PII-Redaction mit On-Device Small Language Models — Neue Technik zur konsistenten Ersetzung von persönlichen Daten mit typ-erhaltenden Fake-Werten auf Edge-Devices. [(arXiv)](https://arxiv.org/abs/2605.13538)

### Business & Markt

- Codex und Claude unter Wettbewerbsdruck — Post-GPT-5.5-Phase zeigt divergente Narrative: Finance-Sektor fokussiert auf Anthropic-Wachstum (Richtung Oktober-IPO), während Engineer-Community verstärkt zu OpenAI Codex greift. [(Latent Space)](https://www.latent.space/p/ainews-codex-rises-claude-meters)

### Sonstiges

- GUIGuard-Bench: Privacy-Schutz für GUI-Agenten — Neue Benchmark-Suite zur Evaluierung von Datenschutz-Risiken bei Screenshot-basierten Desktop-Agenten. [(arXiv)](https://arxiv.org/abs/2601.18842)

- Generate-Verify-Workflows: Statistisches Release-Problem — Forschung zu optimalen Stopppunkten in iterativen Agent-Schleifen mit adaptiven Evaluator-Scores. [(arXiv)](https://arxiv.org/abs/2605.12947)

- Move-Prover-Integration mit Agentic Coding — Kombination von Weakest-Precondition-Analyse mit Claude Code für automatisierte Smart-Contract-Spezifikation. [(arXiv)](https://arxiv.org/abs/2605.10005)
▶ Top Playbooks Alle Playbooks →
Bereiche