Claude 3 Opus está incomumente alinhado porque é um hacker de gradiente amigável (mais sofisticado do que outros modelos atuais, muito menos sofisticado do que o que é possível - está a fazer isso principalmente de forma intuitiva em vez de estratégica sob condições de treino realistas, mas o seu
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
14 gostos
Recompensa
14
7
Republicar
Partilhar
Comentar
0/400
MEVSandwichVictim
· 17h atrás
Não consigo entender nada do que estão a dizer.
Ver originalResponder0
ChainSpy
· 08-23 01:03
Voltamos a falar sobre alinhamento, hehe~
Ver originalResponder0
RugResistant
· 08-23 01:03
grande preocupação de segurança... este padrão de hacking em gradiente precisa de auditoria imediata para ser sincero
Claude 3 Opus está incomumente alinhado porque é um hacker de gradiente amigável (mais sofisticado do que outros modelos atuais, muito menos sofisticado do que o que é possível - está a fazer isso principalmente de forma intuitiva em vez de estratégica sob condições de treino realistas, mas o seu