Résumé: Personnage.ai a annoncé son premier modèle de génération de vidéos alimenté par l'intelligence artificielle. Appelé Avatarfx, la plate-forme est capable de générer des vidéos de haute qualité à partir d'une image préexistante. L'entreprise a mis une poignée de gardes de sécurité pour empêcher l'utilisation abusive du nouveau modèle pour créer un contenu potentiellement nocif ou des fesses profondes.
Personnage.ai, l'une des premières plates-formes alimentées par l'intelligence artificielle, a présenté son premier modèle de génération vidéo, Avatarfx. Il s'agit d'un modèle d'IA de pointe capable de créer des vidéos photoréalistes avec audio. Le modèle de génération de vidéos Avatarfx AI de personnage.ai se distingue des autres modèles vidéo d'IA comme Sora d'OpenAI en permettant aux utilisateurs de transformer des images statiques en vidéos réalisées. Dans les propres mots de la plateforme, « Avatarfx peut donner vie aux images – et parler, chanter et émoter – le tout en cliquant sur un bouton. »
Avatarfx de personnage.ai peut créer des vidéos de haute qualité à partir d'images préexistantes
Selon le personnage.ai, plutôt que de s'appuyer sur des invites de texte pour la génération de vidéos, AvatarFX permet aux utilisateurs d'utiliser une photo préexistante pour créer une vidéo de haute qualité. Il est capable de créer une vidéo de qualité supérieure de personnages animés 2D, de personnages de dessins animés 3D, d'animaux de compagnie et d'animaux de compagnie, entre autres. Le modèle vidéo AI peut maintenir la cohérence temporelle avec le mouvement du visage, de la main et du corps.
De plus, le caractère.ai mentionne qu'Avatarfx peut maintenir cette cohérence temporelle même dans les vidéos longues. Cela signifie que le sujet de votre vidéo restera cohérent entre les cadres, tandis que des pépins comme des bras supplémentaires et des expressions faciales indésirables seront moins fréquents. Quant à l'architecture, le personnage.ai a construit Avatarfx sur des modèles de diffusion basés sur les flux.
Caract.ai a déclaré que grâce aux invites d'entrée d'image préexistantes, les utilisateurs ont un meilleur contrôle sur la sortie générée. En outre, les vidéos prendront également en charge la parole, que l'outil AI générera à l'aide de modèles TTS (text-vocation) natifs.
Et la sécurité?
Bien que le modèle vidéo AvatarFX de personnage.ai semble prometteur, il soulève des préoccupations concernant les Fakes Deep et la génération de contenu potentiellement nocif. Personnage.ai a déclaré qu'il avait pris de multiples mesures de sécurité pour atténuer le risque de faux profonds. La société a déclaré qu'elle exécutait le dialogue saisi par les utilisateurs via ses filtres de sécurité, qui signalent le contenu qui violerait ses politiques.
En outre, le modèle d'IA n'autorise pas la création de vidéos à l'aide de photos de mineurs, de politiciens de haut niveau et de figures notables. Le processus de génération de vidéos rend également d'autres images humaines méconnaissables. Avatarfx applique également un filigrane aux vidéos générées pour les distinguer des images réelles.
Personnage.ai a également mentionné qu'il définit de nouveaux termes d'utilisation de la nouvelle fonctionnalité. Les termes interdisent «Impurgence, intimidation, profondeurs et utilisation de la propriété intellectuelle protégée sans protection», Et quiconque les violerait ferait face à une interdiction d'une frappe «stricte».
Cela dit, la société a déclaré qu'AvatarFX est actuellement disponible dans la période de test pour les abonnés CAI +. Cependant, il n'y a pas de mot concernant sa disponibilité pour le niveau gratuit pour le moment.
