Tech

DALL-E vs Midjourney : Comparaison des générateurs d’images par intelligence artificielle en 2023

Les générateurs d’images par intelligence artificielle ont révolutionné le domaine de la création visuelle. DALL-E vs Midjourney sont deux des outils les plus populaires dans ce domaine. Bien qu’ils partagent le même objectif de générer des images à partir de descriptions textuelles, ces deux outils présentent des différences notables en termes de propriété, d’accès, de développement, de rendu et de tarification. Dans cet article, nous allons examiner en détail les caractéristiques et les spécificités de DALL-E et Midjourney.

À qui appartiennent DALL-E vs Midjourney ?

DALL-E

DALL-E est un générateur d’images par intelligence artificielle développé par OpenAI, une société de renommée mondiale spécialisée dans l’IA. OpenAI est également l’éditeur d’autres outils populaires tels que ChatGPT. DALL-E a été dévoilé en janvier 2021 dans sa première version, et en avril 2022, OpenAI a annoncé DALL-E 2, une version plus avancée capable de créer des images et des œuvres d’art originales et réalistes à partir d’une description textuelle.

Midjourney

Midjourney, quant à lui, est un laboratoire de recherche indépendant basé à San Francisco. Fondé par David Holz en juillet 2022, Midjourney se concentre sur l’exploration de nouveaux médias de pensée et le développement du pouvoir imaginatif de l’espèce humaine. David Holz, également co-fondateur de Leap Motion, a une solide expérience dans le domaine de la réalité augmentée et du contrôle gestuel. En mars 2023, la version 5 de Midjourney était rendue disponible en alpha.

Accès à DALL-E vs Midjourney

DALL-E

DALL-E 2 est accessible à tous en version bêta depuis juillet 2022. Pour y accéder, il vous suffit de vous rendre sur le site web d’OpenAI et de vous connecter avec votre compte OpenAI. Une fois connecté, vous pouvez rédiger vos descriptions textuelles dans la boîte de discussion dédiée, et les images correspondantes seront générées en temps réel.

Midjourney

L’accès à Midjourney se fait via un serveur Discord dédié. Vous devez posséder un compte Discord et rejoindre le serveur Midjourney. Une fois que vous êtes sur le serveur, vous pouvez utiliser les différentes fonctionnalités de Midjourney en utilisant des commandes spécifiques dans les salons de discussion appropriés.

État de développement de DALL-E et Midjourney

DALL-E

DALL-E 2, comme tout modèle d’IA, est en constante évolution et développement. OpenAI a lancé une version preview limitée à un nombre restreint d’utilisateurs de confiance afin de mieux comprendre les capacités et les limites de la technologie. En juillet 2022, DALL-E 2 a été rendu disponible en version bêta publique, permettant à tous les développeurs d’utiliser l’API DALL-E pour créer des applications.

Midjourney

Depuis sa première version en février 2022, Midjourney a connu plusieurs mises à jour rapides. L’équipe de développement travaille régulièrement sur de nouvelles fonctionnalités et des versions améliorées de l’outil. Selon les indications de David Holz, la version 6 de Midjourney pourrait arriver courant juillet. Midjourney se concentre également sur la création d’un site web et d’une application mobile indépendants, afin de faciliter l’accès à ses fonctionnalités sans passer par Discord.

Entraînement des modèles de DALL-E et Midjourney

DALL-E

DALL-E 2 a été entraîné sur environ 650 millions de paires image-texte extraites d’internet. Ces données ont permis à DALL-E d’apprendre les relations entre les images et les mots utilisés pour les décrire. Des filtres ont été mis en place pour exclure les contenus violents, sexuels ou haineux. DALL-E 2 utilise un modèle de diffusion pour générer des images à partir de descriptions textuelles, en modifiant progressivement un motif aléatoire de points pour former une image.

Midjourney

Les détails sur l’entraînement des modèles de Midjourney sont moins clairs. La formation de Midjourney est basée sur un agglomérat de contenus web, en utilisant des ensembles de données ouvertes disponibles publiquement. Selon David Holz, Midjourney utilise ces ensembles de données pour entraîner son modèle à travers différentes tâches de génération d’images. Le processus de génération de Midjourney utilise une technique de diffusion latente pour créer des images à partir de prompts textuels.

Différences de rendu entre DALL-E et Midjourney

Lors de nos tests comparatifs, nous avons observé plusieurs différences de rendu entre DALL-E et Midjourney. Tout d’abord, Midjourney semble avoir une nette avance en termes de réalisme et de détails par rapport à DALL-E. Les images générées par Midjourney sont souvent plus réalistes et les détails sont plus fins. DALL-E, quant à lui, peut parfois avoir du mal à générer des détails complexes, en particulier lorsqu’il s’agit de sujets spécifiques comme les visages.

De plus, Midjourney semble être plus créatif et capable de mieux comprendre les consignes données. Lorsque nous avons demandé une image dans un style particulier, Midjourney a mieux respecté les spécifications que DALL-E. Cependant, il est important de noter que DALL-E a également montré des capacités impressionnantes dans des versions avancées, telles que celle utilisée par Bing Image Creator.

Tarification de DALL-E et Midjourney

En ce qui concerne la tarification, DALL-E propose un modèle basé sur l’achat de crédits. Chaque prompt utilisé pour générer une image coûte un crédit. Les tarifs proposés par OpenAI commencent à 15 $ pour 115 crédits, sans dégressivité en fonction de la quantité achetée.

Midjourney, quant à lui, propose plusieurs plans tarifaires différents. Le plan de base coûte 10 $ par mois et offre environ 200 générations d’images. Les plans intermédiaire et pro offrent des « heures de génération rapide », avec 15 heures pour le premier et 30 heures pour le second. Midjourney propose également des tarifs dégressifs pour les utilisateurs qui s’engagent sur une période plus longue.

En conclusion, bien que DALL-E et Midjourney partagent le même objectif de générer des images par IA à partir de descriptions textuelles, ils présentent des différences notables en termes de propriété, d’accès, de développement, de rendu et de tarification. Chaque outil a ses propres spécificités et avantages, il est donc important de choisir celui qui correspond le mieux à vos besoins et à votre budget.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *