OpenAI rilascia il monitoraggio CoT per prevenire comportamenti dannosi nei modelli di grandi dimensioni

Bitget App

Trade smarter

Vedi l’originale

Bitget2025/03/10 23:35

OpenAI ha rilasciato la sua ultima ricerca, indicando che l'uso del monitoraggio CoT (Chain of Thought) può prevenire che i grandi modelli diffondano sciocchezze, nascondano vere intenzioni e altri comportamenti malevoli. È anche uno degli strumenti efficaci per supervisionare i supermodelli. OpenAI ha utilizzato il modello all'avanguardia appena rilasciato o3-mini come soggetto da monitorare, con un modello GPT-4o più debole che funge da monitor. L'ambiente di test era costituito da compiti di codifica, richiedendo all'IA di implementare funzioni nelle librerie di codice per superare i test unitari. I risultati hanno mostrato che i monitor CoT hanno performato eccellentemente nel rilevare comportamenti sistematici di "reward hacking", con un tasso di richiamo alto fino al 95%, superando di gran lunga il 60% del solo monitoraggio del comportamento.

Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

PoolX: Blocca per guadagnare

Almeno il 12% di APR. Sempre disponibile, ottieni sempre un airdrop.

Blocca ora!

Ti potrebbe interessare anche

I mercati azionari giapponesi e coreani hanno aperto in netto calo a seguito del ribasso delle azioni statunitensi

Bitget•2025/03/11 02:33

La commissione totale delle transazioni sulla rete Solana la scorsa settimana è stata di 53.800 SOL, una diminuzione del 10% rispetto alla settimana precedente

Bitget•2025/03/11 02:30

Nell'ultima ora, 115 milioni di dollari sono stati liquidati in tutta la rete, principalmente da ordini multipli

Bitget•2025/03/11 02:29

Lo yuan onshore è aumentato rispetto al dollaro statunitense, superando 7,25 ed è ora riportato a 7,2471

Bitget•2025/03/11 02:23

In tendenza

Altro

I mercati azionari giapponesi e coreani hanno aperto in netto calo a seguito del ribasso delle azioni statunitensi

La commissione totale delle transazioni sulla rete Solana la scorsa settimana è stata di 53.800 SOL, una diminuzione del 10% rispetto alla settimana precedente