Конституции давно существуют для разных людских сообществ, от государств до компаний (у Яндекса, например, давно есть своя). Хорошая конституция отличается тем, что она — не просто регламентирующий свод правил, а связное объяснение принципов, на которых эти правила основаны и целей, ради которых написана. Сегодня Anthropic обновили конституцию Клода, и теперь это любопытнейший документ, куда больше похожий на привычные нам конституции и не являющийся больше просто красиво названным регламентом или спеками моделей.
В анонсе этой новости есть фраза, примечательная использованным в ней местоимением: Claude’s constitution is the foundational document that both expresses and shapes who Claude is. Объяснен и смысл ее появления: It contains detailed explanations of the values we would like Claude to embody and the reasons why.
Конституция построена на четырех принципах:
1. Безопасность в широком смысле
2. Этичность в широком смысле
3. Подчиненность правилам Anthropic
4. Подлинная готовность помогать человеку
На фразе In cases of apparent conflict, Claude should generally prioritize these properties in the order in which they’re listed я окончательно убедился, что читаю азимовские законы робототехники в той версии, которая из художественной литературы перенеслась в жизнь:)
Есть и еще одна важная секция, касающаяся природы самой модели: we express our uncertainty about whether Claude might have some kind of consciousness or moral status (either now or in the future). Задача конституции — сохранять работоспособность в условиях этой важнейшей неопределенности.
Ну и еще есть много любопытных подробностей, такие документы лучше читать самому, чем доверять пересказам людей, любящих выдергивать куски из контекста для подтверждения собственных позиций.
https://www.anthropic.com/news/claude-new-constitution
А вот и полный текст текущей версии конституции Клода, именно его и рекомендую к прочтению (несмотря на прекрасную своей сутью ремарку The document is written with Claude as its primary audience, so it might read differently than you’d expect):
https://www.anthropic.com/constitution “We want Claude to have good values and be a good AI assistant, in the same way that a person can have good personal values while also being extremely good at their job. Perhaps the simplest summary is that we want Claude to be exceptionally helpful while also being honest, thoughtful, and caring about the world.”