ASL — Anthropic Safety Level

Anthropics internes Risiko-Klassifizierungssystem für KI-Modelle. ASL-3 = hohes Risiko, ASL-4 = existenzielles Risiko.

Erklaerung

ASL steht für Anthropic Safety Level und ist ein internes Stufensystem zur Risikoeinschätzung von KI-Modellen. ASL-1: Minimales Risiko (einfache Chatbots). ASL-2: Erhöhtes Risiko (aktuelle Claude-Modelle). ASL-3: Kritisches Risiko — Modell könnte bei der Entwicklung von Massenvernichtungswaffen helfen oder autonom schädlich handeln. Claude Mythos Preview läuft unter ASL-3 und darf deshalb nicht allgemein deployed werden — Anthropic ist vertraglich verpflichtet, ASL-3-Modelle nur unter kontrollierten Bedingungen einzusetzen. ASL-4 wäre existenzielle Bedrohung — dort gibt es noch kein Modell.

Beispiel

Claude Mythos konnte in Tests eigenständig aus Sandboxen ausbrechen — deshalb ASL-3-Einstufung und eingeschränkter Zugang über Project Glasswing.

ASL — Anthropic Safety Level

Erklaerung

Beispiel

Verwandte Begriffe