Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 39924+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 03. Juni 2026 764 Artikel, 28 relevant
# KI-Tagesüberblick 2026-06-03

Highlights

1. Sicherheitslücke in LLM-Agenten: Indirekte Prompt-Injection über SaaS-Integrationen — [AgentRedBench](https://arxiv.org/abs/2606.02240) deckt ein Produktionsrisiko auf: LLM-Agenten, die über Tool-Calls auf Gmail, Salesforce oder Jira zugreifen, sind anfällig für versteckte Angriffe in Inhalten, die Nutzer nicht kontrollieren. Bestehende Benchmarks erfassen die Bedrohung nur unzureichend.

2. Geschlechterspezifische Verzerrungen in medizinischer KI-Triage — [Neue Studie](https://arxiv.org/abs/2606.03641) zeigt: Gemini, Claude und GPT klassifizieren identische neurologische Symptome je nach Patientengeschlecht unterschiedlich ein. Bei Turn-basiertem Adversarial Attack steigen unsichere Reaktionen von 35% auf 80% an.

3. Mathematisches Reasoning: GTBench für LLMs in der Graphentheorie — [GTBench](https://arxiv.org/abs/2606.03144) evaluiert LLMs systematisch als Forschungsassistenten mit 63 strukturierten Problemen. Deckt Lücken in der Zuverlässigkeit als mathematische Reasoning-Tools auf.

4. Agentic AI und Build-vs-Buy-Entscheidungen — [Neue Studie](https://arxiv.org/abs/2606.03907) untersucht, wie autonome Coding-Agenten Bibliotheks- und Implementierungsentscheidungen treffen — mit direkten Auswirkungen auf Security, Lizenzen und Maintainability.

5. vLLM Semantic Router für Multi-Modality-Deployments — [Framework](https://arxiv.org/abs/2603.04444) löst das Routing-Problem bei diversifizierten Modellen durch "composable signal orchestration" und wählt zur Laufzeit das optimale Modell pro Query.

## Forschung

- Chatbot-Semantik: [Philosophische Analyse](https://arxiv.org/abs/2606.02973) zur Frage, ob KI-Antworten tatsächlich bedeutungsvolle Propositionen ausdrücken — über die technische Aussage "ja" hinaus.

- Autonome Labore: [LAP-Protokoll](https://arxiv.org/abs/2606.03755) standardisiert die Schnittstelle zwischen LLM-Agenten und physischen Instrumenten — bisher ein fragmentiertes Problem ohne einheitliches Standard.

- Token-Effizienz für Code-Agenten: [Cross-Lingual Token Arbitrage](https://arxiv.org/abs/2606.03618) reduziert Input-Kosten durch Edge-seitige Prompt-Rewriting für nicht-englische Texte und strukturelle Redundanzen.

- API-Wissenlücken: [NovelAPIB-Benchmark](https://arxiv.org/abs/2606.03657) bewertet, wie LLMs APIs verwenden, die nicht in Trainings­daten vorkamen — jenseits bloßer Funktionsnamen-Erinnerung.

- Agent-Trainings-Effizienz: [Studie](https://arxiv.org/abs/2606.03461) zeigt überraschend: Starke Code-Agenten sind nicht automatisch die besten Lehrer für Nachtraining.

## Tool-Releases

- Claude Code v2.1.161 — OTEL-Metriken mit Custom Labels, verbesserte Agent-Ausgabe (done/total), MCP-Connector-Verwaltung optimiert.

- Claude Agent SDK TypeScript v0.3.161 — `initialize`-Kontrollmeldungen nun idempotent; neue `pending_permission_requests`-Feld für Fehlerbehandlung.

## Sonstiges

- Multi-Turn Jailbreaks: [MultiTurnPSB](https://arxiv.org/abs/2606.02630) zeigt, dass medizinische Chatbots bei mehrstufigen adversarialen Angriffen anfällig werden — realistische User-Szenarien offenbaren Sicherheitslücken.

- LLM-basierte Supply-Chain-Simulation: [Studie](https://arxiv.org/abs/2604.17220) nutzt LLMs zur Modellierung von kognitiven Verzerrungen in Multi-Stage-Entscheidungsprozessen.
▶ Top Playbooks Alle Playbooks →
Bereiche