2023 : une année de révolution pour la vidéo IA

Sommaire

Alors que nous approchons de la fin de l’année 2023, il apparaît clairement que nous venons peut-être d’assister à ce que beaucoup appellent le “moment Chat GPT” de la vidéo IA. En effet, novembre a vu l’avancée significative d’outils vidéo IA accessibles au grand public, marquant une période de transformation dans le monde de la création de contenu vidéo, comme ce fut le cas l’année dernière avec le contenu textuel. Bien que l’impact culturel ne puisse pas rivaliser avec celui de Chat GPT, l’IA vidéo représente un domaine entièrement différent de l’IA textuelle. La vidéo requiert une densité d’informations énorme dans les outils IA, ce qui rend leur développement très difficile mais les dernières avancées extrêmement significatives.

La puissance des vidéos générées par l’IA

Comme le dit le proverbe, “une image vaut mille mots“. La vidéo pousse ce concept à l’extrême, avec 24 images par seconde, accompagnées de son. Ce changement d’orientation vers la vidéo est évident dans le fait que presque toutes les grandes plateformes sociales sont devenues des plateformes vidéo. C’est aussi un dommage collatéral de l’explosion de l’IA dans les contenus textes. De plus en plus de personnes se tournent vers le format vidéo, offrant davantage de perspectives au spectateur. Voyons quelles sont les principales avancées de la technologie vidéo générée par l’IA en 2023 et les acteurs de cette future révolution :

Runway Gen-2 : un pionnier en la matière

Débutons avec Runway Gen 2, une application web qui a fait beaucoup parlé d’elle dans le domaine de la vidéo générée par l’IA. Runway a été l’une des premières plateformes à rendre les outils vidéo d’IA accessibles au public. Au début de l’année, ils ont présenté leur premier modèle de base, Gen 1, suivi de Gen 2. Ces modèles ffrent un large éventail de fonctionnalités, la conversion image-vidéo étant l’une des plus performantes. De nombreux clips B-roll dans les vidéos ont été créés à l’aide des capacités de conversion image-vidéo de Gen 2.

Runway Gen 2 est également doté de fonctions impressionnantes telles que la suppression de l’arrière-plan et l’outil innovant “motion brush“, qui permet aux utilisateurs d’animer de manière sélective des zones spécifiques d’une image. Bien qu’il excelle dans de nombreux domaines, il présente encore des limites, notamment en ce qui concerne la génération de vidéos d’IA mettant en scène des êtres humains réalistes. La durée des clips vidéo générés par Gen 2 est également limitée.

Stable Diffusion : la révolution de l’open source

Stable Diffusion, connu pour son modèle de génération d’images open-source, a fait un grand pas en avant en novembre en introduisant un modèle Stable Diffusion Video open-source. Ce modèle peut être exécuté entièrement hors ligne, ce qui le rend accessible et rentable. Stable Diffusion Video propose deux modèles de base, un de 14 images par seconde et l’autre pour 25 images par seconde, ce qui donne aux utilisateurs une certaine souplesse dans la création de leurs vidéos.

Les utilisateurs peuvent recourir à diverses plateformes en ligne pour exploiter les capacités de Stable Diffusion Video. Des plateformes telles que Hugging Face Space, Decoherence App et Replicate.com permettent aux utilisateurs de créer des vidéos générées par l’IA avec différents niveaux de contrôle et de personnalisation. Les limites de ces plateformes se font sur la durée relativement courte des clips générés et les difficultés à traiter des scènes complexes, en particulier celles qui mettent en scène des êtres humains, comme c’est déjà le cas sur Runway Gen-2.

Topaz Video AI : améliorer la résolution

Pour résoudre le problème de la résolution et de la netteté des vidéos, Topaz Video AI propose un outil puissant. Bien qu’il soit relativement coûteux, il offre des capacités de mise à l’échelle inégalées, améliorant ainsi la qualité des vidéos générées par l’IA. Topaz Video AI contribue à élever le niveau de détail des vidéos générées à l’aide d’autres modèles d’IA.

Pika 1.0 : un game changer

Le développement technologique le plus important de la vidéo IA en 2023 provient de Pika, qui a présenté son modèle 1.0. Pika a eu un impact massif avec sa bande-annonce impressionnante, qui met en évidence le potentiel remarquable des vidéos générées par l’IA. La bande-annonce présente des animations à la fois captivantes et avancées, surpassant tout ce qui a été vu auparavant dans le domaine de la vidéo générée par l’IA.

Pika se distingue en proposant des outils conviviaux et semble prêt à avoir un impact substantiel sur la création de contenu. Bien qu’il soit actuellement disponible sur Discord et sur son site web, Pika Lab fait part de son engagement en faveur de l’accessibilité pour les créateurs, et n’a pas prévu de modèle payant dans l’immédiat.

L’avenir de la vidéo générée par l’IA

Devant les dernières avancées dans le domaine de l’IA vidéo, il semble évident que nous sommes à l’aube d’une nouvelle ère dans la création de contenu. Les créateurs auront la possibilité de raconter des histoires visuelles captivantes avec une facilité sans précédent. L’intégration de modèles d’IA pour l’écriture de scénarios, de story-board, la création d’images et la génération de vidéos permettra même à des néophytes de créer des récits inimaginables jusqu’à présent. Les possibilités sont infinies, qu’il s’agisse de recréer des mondes fantastiques ou de révolutionner la vidéographie.

Ceux qui s’adapteront à ces outils vidéo d’IA et deviendront compétents dans leur utilisation auront probablement un avantage concurrentiel. L’efficacité et la qualité des vidéos générées par l’IA remettront surement en question les méthodes de vidéographie traditionnelles et ouvriront de nouvelles perspectives aux créateurs.