An update on our preliminary evaluations of Claude 3.5 Sonnet and o1

Preliminary evaluations of Claude 3.5 Sonnet (New) and o1, as well as some discussion of challenges in making capability-based safety arguments for AI models.

Claude

Open original