Anthropic bietet nun zwei Frontier-Stufen: Mythos-Klassen-Fable 5 und Opus-Klassen-Opus 4.8. Sie sind eng verknüpft — Fables Schutzmaßnahmen fallen auf Opus zurück — aber preislich und positioniert sehr unterschiedlich. Kurzantwort: Fable 5 für harte, lange, autonome Jobs; Opus 4.8 als Kosten- und Latenz-Standard.

Auf einen Blick

  • Klasse: Mythos vs. Opus
  • Am besten für: lang laufende autonome Arbeit vs. starke alltägliche Frontier-Arbeit
  • SWE-Bench Pro: 80,3 % vs. 69,2 %
  • FrontierCode: 29,3 % vs. 13,4 %
  • Input/Output: $10/$50 vs. $5/$25 pro Million Tokens
  • Kontext: 1M Tokens (Fable) · API-ID: claude-fable-5 vs. claude-opus-4-8

Wie groß ist der Abstand?

Je länger und komplexer die Aufgabe, desto größer Fable 5s Vorsprung. Bei kurzer, klar abgegrenzter Arbeit liegen beide näher beieinander — deshalb bleibt Opus 4.8 sinnvoll für hochvolumigen Produktionstraffic.

Preisnuancen

  • Fable ist ~2× Opus bei allen Token-Typen inkl. Cache Writes und Hits
  • Token-Effizienz: Fable nutzt oft weniger Turns — die Netto-Kostenlücke kann bei passenden Aufgaben schrumpfen
  • Safeguard-Umleitungen zu Opus werden nicht zu Fable-Tarifen abgerechnet

Die Fallback-Beziehung

Wenn Fable-Klassifikatoren Cyber-, Bio/Chem- oder Distillation-Inhalte markieren, antwortet Opus 4.8 stattdessen (unter 5 % der Sessions). API-Kunden konfigurieren dies über die Fallback API. Behandeln Sie das Paar als System, nicht als Entweder-oder.

Wann welches Modell

Zu Fable 5 greifen, wenn

  • Aufgaben lang laufend oder mehrstufig sind (Migrationen, mehrtägige Agenten)
  • Qualität bei schweren Problemen wichtiger ist als Kosten pro Token
  • Opus bei komplexer Analyse oder High-Fidelity-Coding an Grenzen stößt

Bei Opus 4.8 bleiben, wenn

  • Aufgaben routinemäßig und klar abgegrenzt sind
  • Latenz oder Kosten pro Anfrage Priorität haben
  • Hohes Volumen, bei dem 2× Preise schnell anwachsen

Bestes Muster: nach Aufgabenkomplexität hinter einem Gateway-Endpoint routen — harte Jobs zu Fable, alles andere zu Opus — mit Budgets und automatischem Fallback bei Fehlern oder Kapazitätslimits.