Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLIBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffBuilding with Gemini Embedding 2: Agentic multimodal RAG and beyondProduction-Ready AI Agents: 5 Lessons from Refactoring a MonolithSubagents have arrived in Gemini CLIBuild Long-running AI agents that pause, resume, and never lose context with ADKMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsAgents CLI in Agent Platform: create to production in one CLI

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 44393+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 11. Juni 2026 617 Artikel, 32 relevant
# KI-Tagesüberblick 2026-06-11

Highlights

1. Frontier LLMs für Cybersecurity evaluiert — [Anthropic, OpenAI und Google](https://arxiv.org/abs/2605.23243) haben frontier LLMs (GPT-5.4, Claude Opus/Sonnet, Gemini) auf Sicherheitslücken-Erkennung getestet. Die Studie nutzt ein Dual-Mode-Benchmark mit White-Box-Vulnerability-Detection und Black-Box-Web-Application-Security-Testing mit 118 echten Vulnerabilities.

2. KI-Coding-Agents können wissenschaftliche Findings reproduzieren — [Anthropic-Forschung](https://arxiv.org/abs/2606.11447) zeigt systematisch, dass AI-Agenten publizierte sozialwissenschaftliche Studien mit Original-Daten reproduzieren können. Dafür wurde die SocSci-Repro-Bench mit 221 Aufgaben entwickelt.

3. Autonome Forschungs-Agenten im Test — [ResearchClawBench](https://arxiv.org/abs/2606.07591) evaluiert End-to-End autonome Forschung über 40 Tasks aus 10 wissenschaftlichen Domänen. Das Benchmark stammt von echten publizierten Papers und nutzt Expert-Curated Rubrics.

4. Hypothesis-Tree-Refinement für generalisierte autonome Forschung — [Arbor-Framework](https://arxiv.org/abs/2606.11926) von Anthropic und OpenAI kombiniert langfristige Koordination mit kurzfristigen Executors für iterative Forschungsschleifen (Exploration, Experimentation, Abstraction).

5. Nested Sub-Agents in Cursor verfügbar — [Cursor v2.1.172](https://github.com/anthropics/claude-code/releases/tag/v2.1.172) ermöglicht Sub-Agents, die eigene Sub-Agents spawnen können (bis 5 Ebenen tief), und verbessert AWS Bedrock Integration.

## Modell-Updates

- LLM-Benchmarking für Industrial Safety — [Studie zu Safety Data Sheets](https://arxiv.org/abs/2606.11204) vergleicht Gemini 1.5 Pro, GPT-4o und Claude 3.7 Sonnet bei strukturierter Datenextraktion aus heterogenen Dokumentformaten.

- Multimodale Social Intelligence — [MODF-SIR Framework](https://arxiv.org/abs/2606.12018) nutzt leichte MLLMs mit Multi-Agent-Kollaboration und Knowledge Distillation für Social Intelligence Reasoning.

## Tool-Releases

- datasette-agent 0.2a0 — [Neue Features](https://simonwillison.net/2026/Jun/10/datasette-agent/#atom-everything) ermöglichen Tools, während der Ausführung Nutzer-Fragen zu stellen (Yes/No, Multiple-Choice, Free-Text).

- MemToolAgent — [Framework](https://arxiv.org/abs/2606.07909) verbessert Tool-Nutzung von LLM-Agents durch Speichermechanismen für langfristige historische Events und Agent-Environment-Interaktionen.

## Forschung

- Vector Search Dilution in RAG-Systemen — [Studie zu großen, heterogenen Dokumentsammlungen](https://arxiv.org/abs/2606.11350) zeigt, dass Dense Similarity bei Skalierung Diskriminativkraft verliert. Hybrid Dense+Sparse-Retrieval wird untersucht.

- Sicherheits-Audit von LLM Skills — [Analyse von 98.380 Skills](https://arxiv.org/abs/2602.06547) aus Community-Registern offenbart Sicherheitsrisiken bei Third-Party Extensions mit Nutzer-Privilegien.

- Sprachabhängige ideologische Divergenz — [Forschung mit Claude und GPT](https://arxiv.org/abs/2601.12164) zeigt, dass LLM-Outputs bei politischen Analysen systematische Biases aufweisen, die von der Prompt-Sprache (Russisch vs. Ukrainisch) abhängen.

- MPC-Code-Reparatur für Cryptography — [MPC-Patch-Bench](https://arxiv.org/abs/2606.11416) adressiert fehlende Repository-Level Benchmarks für LLM-Code-Repair bei Secure Multi-Party Computation.

## Business

- OpenAI-IPO verzögert sich möglicherweise — [Sam Altman signalisiert](https://the-decoder.de/sam-altman-bremst-beim-ipo-openai-koennte-erst-2027-an-die-boerse-gehen/), dass Fortschritte bei Self-Improving-KI den geplanten Börsengang von 2026 auf 2027 verschieben könnten. Intern werden Aktienverkäufe zu $687,69 angeboten.

## Sonstiges

- Papermill Press als PDF-Alternative — [YC News-Diskussion](https://news.ycombinator.com/item?id=48477708) zu AI-freundlicher Markup-Sprache für Dokumentgenerierung mit Print-First-Design.

- NightFeats für RAG-Wettbewerbe — [System für MMU-RAGent NeurIPS 2025](https://arxiv.org/abs/2606.11199) erhielt Auszeichnung für Best Dynamic Evaluation mit strukturierter Multi-Agent-Pipeline (Retrieval, Curation, Composition).
▶ Top Playbooks Alle Playbooks →
Bereiche