La Activación de Parches y la Mediación Causal Ponen a Prueba las Explicaciones de los Modelos de Lenguaje
Explora cómo las innovadoras sondas de LIBERTy desafían la fiabilidad de las explicaciones proporcionadas por los modelos de lenguaje mediante la activación de parches y la mediación causal.