
A Anthropic busca evitar que modelos de IA se tornem malévolos – veja como
Descobertas relevantes sobre a IA em pesquisa recente Uma nova pesquisa da Anthropic identificou características dos modelos, denominadas vetores de persona. Essa descoberta pode ajudar a identificar comportamentos indesejáveis sem prejudicar o desempenho. No entanto, os desenvolvedores ainda não possuem conhecimento suficiente sobre as razões pelas quais os modelos apresentam