Das Modell erklärt: Autoregression statt Diffusion
Du liebst Bilder, hasst aber Photoshop? Dann ist diese Folge dein digitaler Rettungsring! AI Babsi (Barbara Lampl) und E-Fuchs (Jochen G. Fuchs) haben sich die Designerin und AI-Art-Expertin Stephanie Krüll geschnappt, um gemeinsam das neue Wunderkind der KI-Welt zu sezieren: ChatGPT 4o!
In dieser Episode stolpern unsere drei Helden durch die wilden Weiten der KI-Bildgenerierung, während sie versuchen, zwischen Hype und Realität zu navigieren. Jochen offenbart seine peinlichen ersten Schritte mit dem neuen Tool (spoiler: seine Versuche, Portraits zu generieren, enden in einem digitalen Spiegelkabinett des Horrors), während Stephanie und Barbara uns zeigen, wie’s richtig geht.
Erfahre, warum Mid Journey vor Neid erblasst, warum deine sorgfältig generierten Omas plötzlich 20 Jahre jünger aussehen und warum Barbara bei der Erklärung von Diffusionsmodellen über Pizza philosophiert (Spoiler: Es geht um’s Riechen!).
Von “Oh mein Gott, ich werde arbeitslos!” bis “Puh, ich brauche nur einen AI-Skill-Upgrade” – diese Folge ist ein wilder Ritt durch die neuesten Entwicklungen der KI-Bildgenerierung, gewürzt mit einer ordentlichen Portion Humor und Fachwissen.
Also, schnapp dir deine Lieblings-KI, lehne dich zurück und genieße diese köstliche Pizza – äh, Episode! 🍕🤖🎨
Erwähnte KI-Tools und -Modelle
- ChatGPT-4o (bzw. “vor-o”)
- MidJourney
- DALL-E
- Stable Diffusion
- Flux/Sora
Erwähnte technische Konzepte
- Diffusionsmodelle vs. Autoregressive Modelle
- Reinforcement Learning
- Visual Reasoning
- Character True-ness
- Zero-Shot vs. Few-Shot Prompting
Links
- OmniGen: Unified Image Generation https://arxiv.org/abs/2409.11340
- Erik Reintjes Post zu Marketing Assets mit ChatGPT 4o https://www.linkedin.com/posts/erik-reintjes-bb43091b2_ich-bin-ehrlich-das-game-ist-durch-activity-7310583982604140544-8vf0
Kapitel
00:00 Begrüßung und Vorstellung von Stephanie Krüll
01:52 Erste Eindrücke von ChatGPT-4o und Bildgenerierung
05:19 Herausforderungen bei der KI-Bildbearbeitung
09:12 Unterschiede zwischen MidJourney und ChatGPT-4o
12:42 Technische Hintergründe zur 4o-Bildgenerierung
17:06 Wahrnehmung und Funktionsweise der Bildgenerierung
21:44 Iteratives Prompting vs. neue Generierung
25:28 Input-Optimierung vs. Output-Optimierung
30:27 Consumer-Tools vs. Enterprise-Lösungen
36:34 Was 4o besser kann als bisherige Bildgeneratoren
40:48 Gesellschaftliche Implikationen der KI-Bildgenerierung
47:43 Technische Erklärung: Autoregressives hybrides Modell vs. Diffusionsmodell
58:56 Anschauliche Erklärung von Diffusionsmodellen
1:03:16 Bias in KI-generierten Bildern
1:05:26 Reinforcement Learning zur Bias-Reduzierung
1:12:13 Abschlussbemerkungen
🥳 Danke, dass du LAIer 8|9 eingeschaltet hast! Möge die KI mit dir sein!
Schreib uns eine Bewertung mit dem KI-Modell deiner Wahl und abonniere uns auf deiner Lieblingsplattform, wir sind überall, es gibt kein Entrinnen!
[Apple] https://podcasts.apple.com/podcast/id1798319508
[Deezer] https://www.deezer.com/de/show/1001665971
[Spotify] https://open.spotify.com/show/2IfqJA4Qo02fslECWpEQW8
[Amazon Music] https://music.amazon.de/podcasts/497c3a14-dcaf-4bb3-abc1-03aa6f73f8d3/laier-8-9—noch’n-ki-podcast?ref=dmshXyRCqZ9tPU6Rl8zPrLalNKM0m
[Youtube (Video-Podcast)] https://www.youtube.com/@laier89
Unsere Hosts
AI Babsi: (Barbara) [Website] https://www.barbara-lampl.de | [LinkedIn]https://www.linkedin.com/in/barbaralampl/ – E-Fuchs: (Jochen) [Website]https://efuchs.net | [LinkedIn] https://www.linkedin.com/in/jochengfuchs/
Gast in der Episode: Stephanie Krüll
[LinkedIn] https://www.linkedin.com/in/stefanie-krüll-ai-design/
[Website] https://www.stefanie-kruell.de/
Unser Podcast Blog
https:///laier89.de/
01001100 01110101 01101011 01100101 00101100 00100000 01001001 01100011 01101000 00100000 01100010 01101001 01101110 00100000 01100100 01100101 01101001 01101110 00100000 01001011 01001001 00101101 01010000 01101111 01100100 01100011 01100001 01110011 01110100 00100000 01001100 01000001 01001001 01100101 01110010 00100000 00111000 01111100 00111001 00101110
LAIer 8|9 wird nicht Layer 89 oder Layer 8|9 geschrieben, auch nicht Layer 8 9, aber wir sind cool und wir sind tough, deshalb gibt’s hier Keyword-Stuff.