Tether Data ha annunciato QVAC Genesis I come il primo dataset sintetico della linea QVAC, costituito da 41 miliardi di token generati artificialmente e destinati all’addestramento di modelli linguistici avanzati per le discipline STEM. La società dichiara che il corpus è stato validato su benchmark scientifici e didattici, con particolare attenzione alle capacità di ragionamento e risoluzione di problemi complessi in matematica, fisica, biologia e medicina. L’intento è creare un’infrastruttura dati di alta qualità, accessibile e non vincolata a piattaforme proprietarie, in modo da sostenere la ricerca aperta e la sperimentazione indipendente.
Contestualmente, Tether Data ha introdotto QVAC Workbench, un ambiente operativo progettato per l’esecuzione locale di modelli linguistici e multimodali. L’applicazione è disponibile per Windows, macOS, Linux e Android, con una versione iOS in fase di rilascio, e offre compatibilità con modelli open source come Llama, Medgemma, Qwen, SmolVLM e Whisper. Il suo elemento tecnico più innovativo è la funzione di Delegated Inference, che consente alla versione mobile di delegare il calcolo a un computer collegato via rete peer‑to‑peer. In questo modo l’elaborazione avviene su macchine di proprietà dell’utente, mantenendo i dati sul perimetro personale e riducendo la dipendenza dal cloud.
Il CEO Paolo Ardoino definisce questa strategia come un ritorno dell’intelligenza artificiale “nelle mani degli utenti”, attraverso un modello di decentralizzazione che mira a spostare la potenza di calcolo e la capacità cognitiva dei modelli verso i dispositivi edge: computer domestici, robot, wearable e sistemi embedded. La visione si basa su una filosofia local‑first, dove l’elaborazione distribuita e la sovranità dei dati diventano i pilastri dell’infrastruttura AI.
L’SDK QVAC, descritto nella documentazione tecnica, è il motore di questo ecosistema. Fornisce un runtime e un toolkit per creare agenti intelligenti modulari in grado di collaborare su una rete peer‑to‑peer priva di nodi centrali. L’obiettivo è costruire un’infrastruttura flessibile per applicazioni che vanno dalla traduzione automatica all’analisi scientifica e alla gestione della conoscenza, garantendo sicurezza, autonomia e interoperabilità tra dispositivi eterogenei.
Sul piano legale e operativo, la Privacy Statement aggiornata al 6 ottobre 2025 chiarisce che QVAC Workbench è sviluppato da Tether Data S.A. de C.V. e specifica i principi di trattamento dei dati, che restano in larga misura sul dispositivo dell’utente. Sono previste limitate elaborazioni aggregate a fini di miglioramento del servizio e meccanismi di tutela per gli utenti europei conformi al GDPR, inclusi i diritti di accesso, rettifica e cancellazione. La sicurezza delle comunicazioni e l’uso di fornitori esterni sono regolati con l’obiettivo di preservare l’approccio local‑first.
I Termini d’Uso definiscono Workbench come un’interfaccia verso modelli linguistici di terze parti. L’utilizzo è consentito per scopi personali o di ricerca, con licenza fee‑free e diritti di proprietà intellettuale che restano in capo all’utente, salvo diverse previsioni legate ai modelli impiegati. È inclusa una clausola di arbitrato e un elenco di buone pratiche d’uso, oltre al richiamo alla responsabilità individuale nella verifica dei risultati prodotti dai modelli in contesti sensibili.
La pagina ufficiale dedicata a QVAC Genesis I rimanda a un white paper tecnico intitolato “The Largest and Highest‑Quality Multi‑domain Educational Synthetic Dataset for Pre‑training”, che descrive la metodologia di generazione, validazione e valutazione del corpus. Questo documento costituisce la base empirica del progetto e dimostra che l’iniziativa va oltre un’operazione promozionale, inserendosi in un percorso di ricerca sull’uso controllato dei dati sintetici per l’addestramento di modelli generalisti e specialistici.

