Bitget App
Trade smarter
Acquista CryptoMercatiTradingFuturesCopy TradingBotsEarn
OpenAI rilascia il monitoraggio CoT per prevenire comportamenti dannosi nei modelli di grandi dimensioni

OpenAI rilascia il monitoraggio CoT per prevenire comportamenti dannosi nei modelli di grandi dimensioni

Vedi l’originale
Bitget2025/03/10 23:35

OpenAI ha rilasciato la sua ultima ricerca, indicando che l'uso del monitoraggio CoT (Chain of Thought) può prevenire che i grandi modelli diffondano sciocchezze, nascondano vere intenzioni e altri comportamenti malevoli. È anche uno degli strumenti efficaci per supervisionare i supermodelli. OpenAI ha utilizzato il modello all'avanguardia appena rilasciato o3-mini come soggetto da monitorare, con un modello GPT-4o più debole che funge da monitor. L'ambiente di test era costituito da compiti di codifica, richiedendo all'IA di implementare funzioni nelle librerie di codice per superare i test unitari. I risultati hanno mostrato che i monitor CoT hanno performato eccellentemente nel rilevare comportamenti sistematici di "reward hacking", con un tasso di richiamo alto fino al 95%, superando di gran lunga il 60% del solo monitoraggio del comportamento.

0

Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

PoolX: Blocca per guadagnare
Almeno il 12% di APR. Sempre disponibile, ottieni sempre un airdrop.
Blocca ora!