Non è quello il punto. I driver sono stati installati e le librerie di CUDA anche. Infatti come detto con HQPlayer desktop funziona.
Il punto è che con la versione embedded di default l'offload su CUDA non è abilitato, e nell'interfaccia web non c'è ancora modo di abilitarlo.
La soluzione (che alla fine ho scoperto da solo) è editare a mano il file XML di configurazione.
Al solito, la documentazione lascia a dir poco a desiderare...