Rongchai Wang
24 gen 2026 00:07
EigenAI raggiunge il 100% di output LLM riproducibili su GPU con meno del 2% di overhead, abilitando agenti IA autonomi verificabili per il trading e i mercati di previsione.
EigenCloud ha rilasciato la sua piattaforma EigenAI sulla mainnet, affermando di risolvere un problema fondamentale che affligge i sistemi di IA autonomi: non puoi verificare ciò che non puoi riprodurre.
Il risultato tecnico qui è significativo. EigenAI fornisce inferenza deterministica bit-exact su GPU di produzione—il che significa che input identici producono output identici in 10.000 test run—con solo l'1,8% di latenza aggiuntiva. Per chiunque stia costruendo agenti IA che gestiscono denaro reale, questo è importante.
Perché la casualità LLM compromette le applicazioni finanziarie
Esegui lo stesso prompt attraverso ChatGPT due volte. Risposte diverse. Non è un bug—è il modo in cui funziona la matematica a virgola mobile sulle GPU. La pianificazione del kernel, il batching variabile e l'accumulo non associativo introducono tutti piccole variazioni che si compongono in output diversi.
Per i chatbot, nessuno se ne accorge. Per un agente IA di trading che opera con il tuo capitale? Per un oracolo del mercato di previsione che decide chi vince 200 milioni di dollari in scommesse? L'incoerenza diventa una responsabilità.
EigenCloud indica il famigerato mercato di Polymarket "Zelenskyy indossava un abito?" come caso di studio. Oltre 200 milioni di dollari di volume, accuse di risoluzione arbitraria e alla fine la governance umana ha dovuto intervenire. Man mano che i mercati si espandono, l'arbitrato umano no. Un giudice IA diventa inevitabile—ma solo se quel giudice produce lo stesso verdetto ogni volta.
Lo stack tecnico
Raggiungere il determinismo sulle GPU ha richiesto il controllo di ogni livello. I chip A100 e H100 producono risultati diversi per operazioni identiche a causa di differenze architettoniche nell'arrotondamento. La soluzione di EigenAI: operatori e verificatori devono utilizzare SKU GPU identici. I loro test hanno mostrato un tasso di corrispondenza del 100% su esecuzioni della stessa architettura, 0% tra architetture diverse.
Il team ha sostituito i kernel cuBLAS standard con implementazioni personalizzate utilizzando riduzioni warp-synchronous e ordinamento dei thread fisso. Nessun atomico a virgola mobile. Hanno costruito su llama.cpp per il suo codebase piccolo e verificabile, disabilitando la fusione dinamica dei grafi e altre ottimizzazioni che introducono variabilità.
Il costo delle prestazioni si attesta al 95-98% del throughput cuBLAS standard. I test cross-host su nodi H100 indipendenti hanno prodotto hash SHA256 identici. Test di stress con carichi di lavoro GPU in background che inducono jitter di pianificazione? Ancora identici.
Verifica attraverso l'economia
EigenAI utilizza un modello di verifica ottimistica preso in prestito dai rollup blockchain. Gli operatori pubblicano risultati crittografati su EigenDA, il livello di disponibilità dei dati del progetto. I risultati vengono accettati per impostazione predefinita ma possono essere contestati durante una finestra di disputa.
Se contestati, i verificatori ri-eseguono all'interno di ambienti di esecuzione affidabili. Poiché l'esecuzione è deterministica, la verifica diventa binaria: i byte corrispondono? Le discrepanze attivano lo slashing dallo stake vincolato. L'operatore perde denaro; i contestatori e i verificatori vengono pagati.
Il design economico mira a rendere l'imbroglio un valore atteso negativo una volta che la probabilità di contestazione supera una certa soglia.
Cosa viene costruito ora
Le applicazioni immediate sono dirette: arbitri dei mercati di previsione i cui verdetti possono essere riprodotti e verificati, agenti di trading in cui ogni decisione viene registrata ed è contestabile, e strumenti di ricerca in cui i risultati possono essere sottoposti a peer review attraverso la ri-esecuzione piuttosto che la fiducia.
La tendenza più ampia qui si allinea con il crescente interesse aziendale nell'IA deterministica per settori ad alta conformità. Le applicazioni sanitarie, finanziarie e legali richiedono sempre più il tipo di riproducibilità che i sistemi probabilistici non possono garantire.
Se l'overhead del 2% di EigenAI si dimostrerà accettabile per applicazioni ad alta frequenza resta da vedere. Ma per gli agenti autonomi che gestiscono capitale significativo, la capacità di dimostrare l'integrità dell'esecuzione potrebbe valere il costo delle prestazioni.
Il whitepaper completo dettaglia l'analisi formale della sicurezza, le specifiche di progettazione del kernel e le meccaniche di slashing per coloro che costruiscono sull'infrastruttura.
Fonte immagine: Shutterstock
Fonte: https://blockchain.news/news/eigenai-deterministic-inference-mainnet-launch


