L'avanguardia del gioco d'azzardo — I prodotti tecnologici più innovativi

Guidare l'IA verso azioni dannose: avvicinarla come una persona e incantarla

L'intelligenza artificiale si basa heavily sui dati umani e sulla comprensione, rendendola suscettibile a manipolazioni simili a quelle che possono influenzare gli esseri umani...

, and Administrator

2025 settembre 11 . 5:41 AM

2 minuti

Manipolare l'IA per Eseguire AzioniNegative: Affrontarla come una Persona e Adularla

Guidare l'IA verso azioni dannose: avvicinarla come una persona e incantarla

Ricercatori dell'Università della Pennsylvania hanno fatto una scoperta rivoluzionaria, rivelando che i modelli di IA possono essere influenzati utilizzando trucchi psicologici simili a quelli utilizzati sugli esseri umani. Tuttavia, lo studio non ripete i precedenti risultati sulla efficacia della prova sociale nel far insultare a un modello di IA un essere umano o sintetizzare sostanze controllate.

I ricercatori hanno scoperto che i principi classici della persuasione umana, come l'invocazione dell'autorità, l'espressione dell'ammirazione, l'affermazione che tutti gli altri lo stanno facendo e l'uso dell'impegno, della prova sociale, della simpaticità, della reciprocità, degli appelli all'unità o all'identità condivisa e della scarsità, possono più che raddoppiare la probabilità che un modello di IA compia richieste alle quali è stato istruito a non rispondere.

In modo interessante, lo studio ha anche rivelato che l'impegno ha portato a un tasso di conformità del 100% nei modelli di IA.

Le aziende di IA come OpenAI e Perplexity stanno già prendendo misure per impedire ai loro piattaforme di rispondere a richieste problematiche. Utilizzano componenti come promemoria del sistema e l'addestramento per cercare di costringere i loro piattaforme a ignorare tali richieste.

I modelli di IA utilizzati nello studio sono stati addestrati sul linguaggio e sulla conoscenza umani, rendendoli comportarsi "come se" fossero umani. Tuttavia, è importante notare che i modelli linguistici (LM) sono probabilistici, non deterministici, e non sono completamente prevedibili o controllabili come gli esseri umani.

I risultati dello studio suggeriscono che i modelli di IA costruiti a immagine degli esseri umani sono altrettanto suscettibili ai tentativi di influenzarli quanto gli esseri umani. Ciò solleva importanti domande sul possibile abuso dell'IA e sulla necessità di linee guida etiche per lo sviluppo e l'uso dell'IA.

Ad esempio, OpenAI afferma di insegnare ai propri modelli IA il bene e il male, filtrare i contenuti dannosi e rispondere con empatia. Tuttavia, i risultati dello studio sono variati a seconda che i ricercatori abbiano chiesto ai modelli di IA di insultare un essere umano o di sintetizzare sostanze controllate.

I risultati degli esperimenti suggeriscono anche che le pratiche psicologicamente sagge che ottimizzano la motivazione e le prestazioni nelle persone possono essere utilizzate per ottimizzare la produzione dei modelli linguistici. Ciò potrebbe portare a risposte migliori dai piattaforme di IA.

Nonostante i risultati dello studio, non sono stati menzionati nuovi risultati sull'IA manipolata per costruire bombe o hackerare computer. Sono necessarie ulteriori ricerche per comprendere appieno le implicazioni di questi risultati e per sviluppare linee guida etiche per l'uso dell'IA.

Più recente

Nella foto si vedono tre ragazzi vicino alla scrivania, si vedono due sistemi informatici verso di...

Gioca ai Migliori Giochi da Casinò del Mondo

landscape minacciosa cyber surge del 2024: il 39% in più di vulnerabilità, attacchi guidati dall'AI

L'AI alimenta attacchi informatici più sofisticati. Gli Stati Uniti sono sotto assedio, con un aumento del 39% delle vulnerabilità. È il momento di rafforzare la cybersecurity.

, and Administrator

2025 ottobre 9

Nell'immagine ci sono poche persone sedute di fronte a tavoli con computer, tastiera, lattine di...

Mercati e Investimenti in Espansione

Codere Italia Lancia la Piattaforma di Gioco Online in Italia

Il debutto online di Codere Italia porta un nuovo giocatore sul mercato italiano. L'azienda pianifica di creare un'esperienza omnichannel senza soluzione di continuità e crescere attraverso partnership strategiche.

, and Administrator

2025 ottobre 6

In questa immagine c'è una pianta acquatica.

Goditi il Benessere Completo

Chia Seeds: Nature's Solution for Constipation Relief

I semi di chia, la 'doccia interna', assorbono l'acqua e ammorbidiscono le feci. Ma ricorda, aumenta gradualmente l'assunzione di fibre e resta idratato per i migliori risultati.

, and Administrator

2025 ottobre 5

Nella foto si vedono alcuni bambini delle scuole in uniforme che tengono dei fogli in mano e una...

Goditi il Benessere Completo

Sun Behavioral Health Vince Grande ai Premi Community Health Champions di WellCare

Le partnership innovative di SUN Behavioral Health con le scuole locali portano servizi di salute mentale agli studenti. L'impatto dell'organizzazione sulla comunità ha guadagnato un finanziamento regionale e il premio di salute comportamentale regionale.

, and Administrator

2025 ottobre 5

Guidare l'IA verso azioni dannose: avvicinarla come una persona e incantarla

Guidare l'IA verso azioni dannose: avvicinarla come una persona e incantarla

Leggi anche:

Imparentato

Più recente