Anthropic En Güçlü Modelini Kamuya Açtı — Ama Bir Koşulla

Birkaç gün önce Anthropic, yapay zekanın “tehlikeli hale gelmeye başladığı” konusunda kamuoyunu uyardı. Bugün, şimdiye kadar herkese açık kullanıma sunduğu en güçlü modelini yayınladı.

Bu çelişki tesadüf değil — kasıtlı bir pozisyon.

Claude Fable 5 Nedir?

Fable 5, Anthropic’in Mythos sınıfı modellerinin ilk kamuya açık versiyonu. Mythos şimdiye kadar yalnızca 15 ülkedeki kritik altyapı kuruluşlarına sunuluyordu. Bugüne kadar.

Yetenekler bakımından Fable 5 neredeyse her test edilen kıyaslamada lider:

Güvenlik Mekanizması: Fallback Sistemi

Fable 5’in dağıtımını mümkün kılan şey sınıflandırıcı katmanı.

Model, her sorguyu yüksek riskli kategorilere göre filtreler. Eğer sorgu bu kategorilerden birine giriyorsa — siber güvenlik, biyoloji/kimya, model distilasyonu — Fable 5 yanıt vermek yerine sorguyu otomatik olarak Claude Opus 4.8’e devreder.

Anthropic, bu sistemi 1.000+ saatlik harici red-teaming ile test etmiş. Evrensel bir jailbreak bulunamadı. Erken verilere göre oturumların %95’inden fazlası Fable 5’in kendi yanıtlarıyla tamamlanıyor — %5 ya da altı fallback’e düşüyor.

Siber güvenlik kategorisi özellikle dar tutulmuş: açık bulma, exploit geliştirme ve ajansal hacking sorguları tetikliyor. Savunma odaklı sorular değil.

Claude Mythos 5: Diğer Yüz

Fable 5’in yanı sıra Anthropic, Claude Mythos 5’i de aynı gün yayınladı — ama çok daha dar bir kitleye.

Mythos 5, Fable 5 ile aynı temel model. Fark: siber güvenlik ve biyoloji alanlarındaki kısıtlamalar kaldırılmış. Hedef kitle siber savunmacılar ve güvenilen araştırmacılar; Project Glasswing kapsamında dağıtılıyor.

Mythos 5’in bildirilen yetenekleri:

Basitçe özetlemek gerekirse: Fable 5 kamuya açık versiyonun adı, Mythos 5 ise hem daha yeni hem de kısıtlamaları kaldırılmış versiyonun adı.

Fiyatlandırma ve Erişim

API’de şu an kullanılabilir:

TokenÜcret
Giriş (input)$10 / milyon token
Çıkış (output)$50 / milyon token

Opus 4.8’in iki katı. Mythos Preview’ın yarısından az.

Abonelik planlarında (Pro, Max, Team, Enterprise) 22 Haziran’a kadar ek ücret yok. Sonrasında kullanım kredisi gerekecek.

Bir not: Fable 5 kullanan tüm API müşterileri için 30 günlük zorunlu trafik saklama getirildi — önceden sıfır-saklama anlaşması imzalamış olanlar dahil. Anthropic bunu güvenlik izleme için zorunlu görüyor.

Önemli Olan Şey

Anthropic bugün iki mesaj verdi.

Birincisi: Güçlü modeller artık kamuya sunulabilir — ama bu güvenlik sisteminin olgunlaşmasını gerektiriyor. Fallback mimarisi, sınıflandırıcı katmanı ve dış red-teaming bu eşiği geçmek için yeterli görüldü.

İkincisi: Aynı modelin farklı versiyonları farklı kitleler için var olabilir. Fable 5 geniş erişim için kısıtlandı, Mythos 5 savunma araştırması için açıldı. Bu ayrım kalıcı bir politika gibi görünüyor.

Recursive self-improvement uyarısı ve en güçlü modelin kamuya açılması aynı hafta gerçekleşti. Anthropic’in bu tansiyonla nasıl yaşadığını anlamak için Fable 5’i kullanmak belki de en iyi test olacak.


Kaynaklar: Anthropic Blog · TechCrunch · The Decoder

EOF.