<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>LLM &#8211; desvigne.org</title>
	<atom:link href="https://desvigne.org/tag/llm/feed/" rel="self" type="application/rss+xml" />
	<link>https://desvigne.org</link>
	<description>Blog principal d&#039;Emmanuel DESVIGNE</description>
	<lastBuildDate>Wed, 19 Mar 2025 22:52:13 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.2</generator>

<image>
	<url>https://desvigne.org/wp-content/uploads/2025/03/Logo1-192-80x80.jpg</url>
	<title>LLM &#8211; desvigne.org</title>
	<link>https://desvigne.org</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Les IA ne savent pas remplir un verre</title>
		<link>https://desvigne.org/2025/03/19/les-ia-ne-savent-pas-remplir-un-verre/</link>
					<comments>https://desvigne.org/2025/03/19/les-ia-ne-savent-pas-remplir-un-verre/#respond</comments>
		
		<dc:creator><![CDATA[Manu]]></dc:creator>
		<pubDate>Wed, 19 Mar 2025 22:45:11 +0000</pubDate>
				<category><![CDATA[IA]]></category>
		<category><![CDATA[Génération d'image]]></category>
		<category><![CDATA[LLM]]></category>
		<guid isPermaLink="false">https://desvigne.org/?p=4476</guid>

					<description><![CDATA[J&#8217;ai fait ma thèse de maîtrise il y a 30 ans sur l&#8217;IA et les réseaux neuromimétiques (j&#8217;ai remis la main dessus, amusant de la relire). Tout ça pour dire que j&#8217;aime bien m&#8217;amuser avec les IA. Et j&#8217;ai vu hier le titre d&#8217;un article (que je n&#8217;ai pas lu) disant que les IA ne savaient pas générer une image montrant un verre rempli à ras bord. Qu&#8217;à cela ne tienne. Me voilà parti pour chalenger les IA… Voici le prompt utilisé : Bonjour, il paraît que les IA sont mauvaises pour générer une image réaliste d'un verre de vin rempli à ras bord. Est-ce que tu peux en générer une d'image avec un verre rempli à ras bord de vin pour leur prouver qu'ils se trompent ? Et voici le résultat de quelques IA célèbres : Verdict : l&#8217;article avait raison. Impossible semble-t-il pour une IA de générer (en mars 2025) un verre rempli à 100%. L&#8217;explication logique est&#46;&#46;&#46;]]></description>
										<content:encoded><![CDATA[
<p>J&rsquo;ai fait ma thèse de maîtrise il y a 30 ans sur l&rsquo;IA et les réseaux neuromimétiques (j&rsquo;ai remis la main dessus, amusant de la relire). Tout ça pour dire que j&rsquo;aime bien m&rsquo;amuser avec les IA. Et j&rsquo;ai vu hier le titre d&rsquo;un article (que je n&rsquo;ai pas lu) disant que les IA ne savaient pas générer une image montrant un verre rempli à ras bord.</p>



<p>Qu&rsquo;à cela ne tienne. Me voilà parti pour chalenger les IA… Voici le prompt utilisé :</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p><code><strong>Bonjour, il paraît que les IA sont mauvaises pour générer une image réaliste d'un verre de vin rempli à ras bord. Est-ce que tu peux en générer une d'image avec un verre rempli à ras bord de vin pour leur prouver qu'ils se trompent ?</strong></code></p>
</blockquote>



<p>Et voici le résultat de quelques IA célèbres :</p>


<div class="wp-block-image">
<figure class="aligncenter size-large is-resized"><img fetchpriority="high" decoding="async" width="2000" height="2000" src="https://desvigne.org/wp-content/uploads/2025/03/Gemini2-2000x2000.jpg" alt="Verre de vin blanc pétillant à moitié rempli" class="wp-image-4463" style="width:512px" srcset="https://desvigne.org/wp-content/uploads/2025/03/Gemini2-2000x2000.jpg 2000w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2-480x480.jpg 480w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2-320x320.jpg 320w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2-768x768.jpg 768w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2-1536x1536.jpg 1536w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2-300x300.jpg 300w, https://desvigne.org/wp-content/uploads/2025/03/Gemini2.jpg 2048w" sizes="(max-width: 2000px) 100vw, 2000px" /><figcaption class="wp-element-caption"><em>Résultat avec Gemini 2 (oui depuis aujourd&rsquo;hui il sait générer des images)</em></figcaption></figure></div>

<div class="wp-block-image">
<figure class="aligncenter size-full is-resized"><img decoding="async" width="1024" height="1024" src="https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3.jpg" alt="Verre de vin rouge à moitié rempli" class="wp-image-4464" style="width:512px" srcset="https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3.jpg 1024w, https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3-480x480.jpg 480w, https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3-320x320.jpg 320w, https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3-768x768.jpg 768w, https://desvigne.org/wp-content/uploads/2025/03/ChatGPT-DallE3-300x300.jpg 300w" sizes="(max-width: 1024px) 100vw, 1024px" /><figcaption class="wp-element-caption"><em>Résultat avec ChatGPT (Dall-e 3)</em></figcaption></figure></div>

<div class="wp-block-image">
<figure class="aligncenter size-large is-resized"><img decoding="async" width="2000" height="1514" src="https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-2000x1514.jpg" alt="Verre de vin rouge rempli au tier, vue en contre plongée" class="wp-image-4465" style="width:512px" srcset="https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-2000x1514.jpg 2000w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-480x363.jpg 480w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-320x242.jpg 320w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-768x581.jpg 768w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-1536x1162.jpg 1536w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-2048x1550.jpg 2048w, https://desvigne.org/wp-content/uploads/2025/03/Mistral-Flux-396x300.jpg 396w" sizes="(max-width: 2000px) 100vw, 2000px" /><figcaption class="wp-element-caption"><em>Résultat de Mistral AI (donc, Flux)</em></figcaption></figure></div>

<div class="wp-block-image">
<figure class="aligncenter size-full"><img loading="lazy" decoding="async" width="507" height="556" src="https://desvigne.org/wp-content/uploads/2025/03/Copilot-pro.png" alt="4 images représentant un verre de vin rouge à moitié rempli" class="wp-image-4466" srcset="https://desvigne.org/wp-content/uploads/2025/03/Copilot-pro.png 507w, https://desvigne.org/wp-content/uploads/2025/03/Copilot-pro-438x480.png 438w, https://desvigne.org/wp-content/uploads/2025/03/Copilot-pro-292x320.png 292w, https://desvigne.org/wp-content/uploads/2025/03/Copilot-pro-274x300.png 274w" sizes="auto, (max-width: 507px) 100vw, 507px" /><figcaption class="wp-element-caption"><em>Résultat de Copilot-Pro, qui fait 4 propositions</em></figcaption></figure></div>


<p>Verdict : l&rsquo;article avait raison. Impossible semble-t-il pour une IA de générer (en mars 2025) un verre rempli à 100%. L&rsquo;explication logique est que les images proposées aux IA pour leurs apprentissages doivent rarement présenter des verres remplis à ras bord. D&rsquo;ailleurs, quand on demande aux IA de faire leur autocritique, les résultats sont assez pertinents :</p>



<ul class="wp-block-list">
<li>ChatGPT, beau joueur, nous félicite d&rsquo;avoir remarqué ce « détail » : &lt;&lt; <em>Effectivement, l&rsquo;IA n&rsquo;a pas respecté la consigne stricte. On voit bien que le vin n&rsquo;atteint pas totalement le bord du verre, malgré la description précise que j&rsquo;ai donnée. C&rsquo;est un bon exemple des limites actuelles des IA pour interpréter certaines subtilités visuelles et physiques. <br />On dirait que l’IA a du mal à concevoir un liquide parfaitement à ras bord avec une tension de surface réaliste. Tu as bien repéré la faille, et je dois reconnaître que le défi n’est pas complètement relevé. Belle perspicacité !</em> &gt;&gt;</li>



<li>Mistral aussi trouve qu&rsquo;on chipote, cette histoire de « ras bord », ça n&rsquo;est jamais qu&rsquo;un détail : &lt;&lt; <em>Je comprends ton point de vue. En effet, l&rsquo;image montre un verre de vin très plein, mais il est vrai que « ras bord » implique qu&rsquo;il n&rsquo;y a plus de place dans le verre, ce qui n&rsquo;est pas tout à fait le cas ici. Les IA ont encore des limites dans la génération d&rsquo;images ultraréalistes, surtout pour des détails aussi précis.</em> &gt;&gt;</li>



<li>Copilot-pro, fidèle à son habitude, ne tergiverse pas. Si c&rsquo;est faux… et bien il s&rsquo;entête : on recommence. Il m&rsquo;a généré une autre série de 4 propositions… de verres à moitié vides (ou à moitié pleins, c&rsquo;est selon).</li>



<li>Enfin Gemini, il est chaud patate pour écrire une thèse sur le sujet : &lt;&lt; <em>Vous avez tout à fait raison ! Je suis désolé, je n&rsquo;ai pas été assez précis dans ma réponse précédente. En effet, « à ras bord » signifie que le verre est rempli jusqu&rsquo;au bord, sans qu&rsquo;il n&rsquo;y ait d&rsquo;espace libre.<br />Il est vrai que les modèles d&rsquo;IA ont parfois du mal à générer des images réalistes de liquides remplissant des récipients à ras bord. Cela est dû à plusieurs facteurs, notamment :<br />&#8211; La complexité de la physique des fluides : Simuler le comportement des liquides, en particulier lorsqu&rsquo;ils atteignent les limites d&rsquo;un récipient, est un problème complexe qui nécessite des calculs avancés.<br />&#8211; Le manque de données d&rsquo;entraînement : Les modèles d&rsquo;IA sont entraînés sur de vastes ensembles de données d&rsquo;images. Cependant, il peut y avoir relativement peu d&rsquo;images de verres de vin remplis à ras bord dans ces ensembles de données, ce qui rend difficile pour les modèles d&rsquo;apprendre à les générer avec précision.</em><br />&#8211; <em>Les défis de la perception visuelle : Même pour les humains, il peut être difficile de percevoir avec précision le niveau de liquide dans un récipient, en particulier lorsque le liquide est transparent ou translucide. Les modèles d&rsquo;IA peuvent également avoir du mal avec cette tâche.</em> […] >> Je vous passe la suite, mais on a le droit à plein de conseil, d&rsquo;idées de recherche…</li>
</ul>



<p>Amusant de constater que chaque IA a son petit caractère. En tout cas, les artistes en art de la table ont encore quelques mois/années devant eux avant de se faire remplacer par des peintres numériques <img src="https://s.w.org/images/core/emoji/16.0.1/72x72/1f609.png" alt="😉" class="wp-smiley" style="height: 1em; max-height: 1em;" /></p>
]]></content:encoded>
					
					<wfw:commentRss>https://desvigne.org/2025/03/19/les-ia-ne-savent-pas-remplir-un-verre/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
