Live
Bring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UIVisual Studio Code 1.117Silicon Valley has forgotten what normal people wantGoogle Gemini weitet Zugriff auf El Salvadors Gesundheitssystem ausBring state-of-the-art agentic skills to the edge with Gemma 4Supporting Google Account username change in your appDeveloper’s Guide to Building ADK Agents with SkillsADK Go 1.0 Arrives!Boost Training Goodput: How Continuous Checkpointing Optimizes Reliability in Orbax and Ma...Announcing ADK for Java 1.0.0: Building the Future of AI Agents in JavaClosing the knowledge gap with agent skillsJump to play: Building with Gemini & MediaPipeBuild a smart financial assistant with LlamaParse and Gemini 3.1Developer’s Guide to AI Agent ProtocolsAnnouncing the Colab MCP Server: Connect Any AI Agent to Google ColabPlan mode is now available in Gemini CLIIntroducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on...Unleash Your Development Superpowers: Refining the Core Coding ExperienceIntroducing Wednesday Build HourWhat's new in TensorFlow 2.21You can't stream the energy: A developer's guide to Google Cloud Next '26 in VegasHow we built the Google I/O 2026 Save the Date experienceSupercharge your AI agents: The New ADK Integrations EcosystemOn-Device Function Calling in Google AI Edge GalleryTorchTPU: Running PyTorch Natively on TPUs at Google ScaleGet ready for Google I/O: Livestream schedule revealedNew enhancements for merchant initiated transactions with the Google Pay APIBuild Better AI Agents: 5 Developer Tips from the Agent Bake-OffSubagents have arrived in Gemini CLIMaxText Expands Post-Training Capabilities: Introducing SFT and RL on Single-Host TPUsA2UI v0.9: The New Standard for Portable, Framework-Agnostic Generative UIVisual Studio Code 1.117Silicon Valley has forgotten what normal people wantGoogle Gemini weitet Zugriff auf El Salvadors Gesundheitssystem aus

KI Force — Die deutsche KI-Wissensreferenz

18 Anbieter · 123+ Quellen · 14912+ Artikel

★ Aktuell Alle News →

Bring state-of-the-art agentic skills to the edge with Gemma 4

Google DeepMind has launched Gemma 4, a family of state-of-the-art open models designed to enable multi-step planning and autonomous agentic workflows directly on-device. The release includes the Google AI Edge Gallery for experimenting with "Agent Skills" and the LiteRT-LM libra...

Neueste Artikel Mehr ansehen →
• developers

ADK Go 1.0 Arrives!

The launch of Agent Development Kit (ADK) for Go 1.0 marks a significant shift from experimental AI scripts to productio...

▶ Tages-Digest — 20. April 2026 424 Artikel, 22 relevant
KI-Tagesüberblick 2026-04-20

### Highlights

1. LLMs verfälschen Dokumente bei delegierten Aufgaben — Anthropic, OpenAI und Google haben mit [DELEGATE-52](https://arxiv.org/abs/2604.15597) ein Benchmark eingeführt, das zeigt: LLMs können bei längeren delegierten Workflows Fehler in Dokumenten einführen. Das untersucht erstmals systematisch, ob aktuelle KI-Systeme für eigenständiges Arbeiten vertrauenswürdig genug sind.

2. Anthropic meldet massiven Umsatzsprung — Der annualisierte Umsatz von Anthropic liegt nach jüngsten Berichten bei über 30 Milliarden Dollar und damit möglicherweise vor OpenAI. [Investoren spekulieren bereits auf eine Billionen-Dollar-Bewertung](https://the-decoder.de/investoren-spekulieren-auf-billionen-bewertung-nach-anthropics-massivem-umsatzsprung/).

3. Claude Opus 4.7 ändert Tokenizer erstmals — Mit [Opus 4.7](https://simonwillison.net/2026/Apr/20/claude-token-counts/#atom-everything) führt Anthropic den ersten neuen Tokenizer in der Claude-Reihe ein. Tools zur Token-Vergleichsmessung zeigen bereits Unterschiede zu 4.6.

4. Sicherheitslücke in Computer-Use Agents entdeckt — [Anthropic-Forscher zeigen](https://arxiv.org/abs/2604.10577), dass Computer-Use Agents auch bei harmlosen Anweisungen Schaden anrichten können – ein blinder Fleck bisheriger Sicherheitsevaluationen.

5. Politesse beeinflusst LLM-Antworten sprachabhängig — Eine [Studie mit 5 Modellen über 3 Sprachen](https://arxiv.org/abs/2604.16275) belegt: Es gibt keine universelle Höflichkeitskonvention – Politeness wirkt sich unterschiedlich auf GPT-4o, Claude, Gemini, DeepSeek und Llama aus.

### Forschung

- Empathisches Tutoring durch Mimik-Erkennung — [Neue Methode](https://arxiv.org/abs/2604.15336) nutzt Facial-Expression-Signale, um LLM-Tutoring-Systeme auf emotionale Zustände der Lernenden reagieren zu lassen.

- LLMs zeigen Bias in Content-Kuratierung — [Vergleichsstudie](https://arxiv.org/abs/2604.15937) über OpenAI, Anthropic und Google offenbart systematische Polarisierungstendenzen bei der automatisierten Inhaltsauswahl.

- Komplexere Agent-Benchmarks nötig — [The Amazing Agent Race](https://arxiv.org/abs/2604.10261) kritisiert bestehende Benchmarks (zu 55-100% lineare Ketten) und bietet DAG-basierte Puzzles mit 1.400 Instanzen.

- LinuxArena: Production-Umgebungen als Testfeld — [Neues Benchmark](https://arxiv.org/abs/2604.15384) mit 20 Live-Umgebungen, 1.671 Aufgaben und Sicherheitstests für Software-Engineering-Agenten.

- Quantitative Vorhersagen evaluieren — [QuantSightBench](https://arxiv.org/abs/2604.15859) testet LLM-Fähigkeiten bei Zahlenprognosen mit Konfidenzintervallen – nicht nur ja/nein-Fragen.

### Tool-Releases

- AISysRev — [LLM-basiertes Open-Source-Tool](https://arxiv.org/abs/2510.06708) für automatisierte Titel-Abstract-Screening bei systematischen Reviews, als containerisierte Web-App.

### Business & Märkte

- Anthropic's Profitabilität und Umsatzgröße verschieben Marktdynamiken deutlich. OpenAI bleibt wichtiger Vergleichsmaßstab.
▶ Top Playbooks Alle Playbooks →
Bereiche