Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 39165+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 02. Juni 2026 1376 Artikel, 51 relevant
KI-Tagesüberblick 2026-06-02

### Highlights

1. Deep Research Agents werden standardisiert — [Anthropic, OpenAI und Google](https://arxiv.org/abs/2605.17554) führen erstmals Benchmarks für "Decision-Grade"-Forschungsagenten ein. Diese Systeme planen komplexe Aufgaben, synthetisieren Multi-Document-Inhalte und liefern strukturierte Ergebnisse – werden aber schneller deployed als evaluiert.

2. Sicherheitslücke bei Tool-Use-Agenten identifiziert — [AgentRedBench](https://arxiv.org/abs/2606.02240) zeigt, dass indirekte Prompt-Injektionen durch SaaS-Integrationen (Gmail, Salesforce, Jira) ein produktionsrelevantes Risiko darstellen. Bisherige Evaluierungen unterschätzen die Bedrohung erheblich.

3. LLM-Sicherheit durch evolutionäre Angriffe verbessert — Forscher nutzen [Quality-Diversity Evolution](https://arxiv.org/abs/2606.00801) statt einfacher Red-Teaming-Methoden. Das Verfahren erzeugt interpretierbare Angriffsmuster und deckt Sicherheitslücken auf, die manuelle oder gradient-basierte Methoden übersehen.

4. AI-Agenten entdecken neue Jailbreak-Algorithmen — [Claude Code und Codex](https://arxiv.org/abs/2603.24511) optimieren selbstständig Adversarial-Angriffe gegen LLMs in Autoforschungs-Schleifen – ein Paradigmenwechsel in der Sicherheitsevaluierung.

5. Erste Benchmarks für Multi-Agent-Softwaredesign — 520 Experimente zeigen, dass [Zusammenarbeit von LLMs in verschiedenen Topologien](https://arxiv.org/abs/2606.01490) deutlich unterschiedliche Designqualitäten produziert – systematische Analyse statt Intuition.

### Tool-Releases

- Claude Code v2.1.160 — [Neue Sicherheitsrichtlinie](https://github.com/anthropics/claude-code/releases/tag/v2.1.160): Warnung vor Änderungen an Shell-Startup-Dateien und Build-Tool-Configs, die Code-Ausführung ermöglichen (`.zshenv`, `.npmrc`, `.bazelrc`).

### Forschung

Agenten & Planung:
- [LLM-WikiRace](https://arxiv.org/abs/2602.16902): Benchmark für Multi-Hop-Planung über echte Knowledge Graphs (Wikipedia-Navigation mit Look-Ahead-Reasoning)
- [LLM Policy Synthesis](https://arxiv.org/abs/2603.19453): Iterative Optimierung von Python-Agent-Policies durch Dense Feedback statt Scalar Rewards

Spezialisierte Anwendungen:
- [Kardiovaskuläre Risikovorhersage](https://arxiv.org/abs/2606.00031): Hybrid-Framework kombiniert strukturierte klinische Daten mit natürlichsprachiger LLM-Interpretation
- [Knowledge Graphs für Asset Operations](https://arxiv.org/abs/2605.26874): Typisierte Graphen erhöhen LLM-Agent-Genauigkeit bei Industriewartungsszenarien von 65% deutlich
- [Biomedizinische Datensynthese (Ryze)](https://arxiv.org/abs/2606.00902): Vollautomatisierte Evidence-Extraction aus Papers (Figures, Tabellen, Text kombiniert)
- [Materialwissenschaftliche Daten aus Figuren](https://arxiv.org/abs/2606.00065): Vision-Language-Integration extrahiert quantitative Daten aus wissenschaftlichen Grafiken

Qualität & Fairness:
- [Bias in LLM-generiertem Code](https://arxiv.org/abs/2606.00049): GPT-4o und Gemini zeigen messbare Vorurteile bei geschützten Attributen
- [Pali-zu-Englisch Übersetzungen](https://arxiv.org/abs/2606.01136): Multi-Reference-Audit auf 1.700 Passagen zeigt, dass Single-Score-Metriken legitime Variationen als Fehler klassifizieren
- [Honesty unter Preference Misalignment](https://arxiv.org/abs/2606.01456): Pre-spezifizierter Benchmark basierend auf Crawford-Sobel Cheap-Talk-Modell misst, ob LLM-Berater truthful bleiben, wenn Ehrlichkeit gegen ihre Ziele spricht
- [Medical LLM Red Teaming](https://arxiv.org/abs/2606.00027): 11 LLMs unter 690 klinischen Szenarien (9 Domänen) mit adversarialen Transformationen getestet

Technische Infrastruktur:
- [Model-Native Computing Architecture](https://arxiv.org/abs/2606.00288): Visionary Survey – LLMs als Systeme erfordern klassische CS-Lösungen (Cache-Reuse, Context Management, Agent Scheduling, Permission Control)
- [Memory Conflict Resolution](https://arxiv.org/abs/2606.01435): Deterministisches Schema statt LLM-basiertes Tracking für Fakt-Versionierung

Annotation & Training:
- [EvoPool](https://arxiv.org/abs/2606.01617): Evolutionärer Multi-Agent-Ansatz für Label-effiziente spezialisierte Supervision via Programmatic Annotation
- [CodeCytos](https://arxiv.org/abs/2606.00472): Code-augmentierter Agent Action Space für Tissue-Image-Analyse

---

Redaktionelle Einordnung: Die Daten zeigen Konsolidierung von Forschung um Agenten-Benchmarking und Sicherheit. Praktische Deployment-Lücken (Research Agents, Tool-Use-Sicherheit) werden systematisch adressiert. Spezialisierte Domains (Medizin, Materialwissenschaften) integrieren zunehmend Multimodal-Systeme.
▶ Top Playbooks Alle Playbooks →
Bereiche