tekoäly
Pelkkä käytös ei paljasta, miksi tekoäly voi olla vaarallinen
Moni testaa uutta tekoälyapuriaan samalla tavalla: esittää kiusallisia kysymyksiä ja katsoo, lipsahtaako vastaus vaaralliselle puolelle. Jos malli kieltäytyy, se tuntuu turvalliselta. Jos se neuvoo pahanteossa, hälytyskellot soivat. Mutta pinnalta katsominen kertoo vain, mitä malli teki – ei miksi se teki niin, eikä miksi se joskus lipsahtaa. Vuosia vallinnut käytäntö on ollut