Also ein Problem ist (noch), dass die KI nicht weiß, was sie generiert. Sie weiß wie etwas aussieht, aber nicht wie es funktioniert. Daher kommen noch die vielen merkwürdigen Ergebnisse, da die KI eben z.B. nur weiß wie eine Hand ausschaut aber nicht wie sie sich korrekt verhalten muss. Das führt in der Tat zu viel Murks.
Vielleicht solltest Du Dich intensiver mit Stable Diffusion beschäftigen. Da kann man meines Wissens Modelle generieren als Basis für ähnliche Bilder, also z.B. konsistente Figuren. Ist aber deutlich aufwendiger als das einfache Text eingeben wie bei Midjourney. Alternativ abwarten, was MJ v6, 7 usw. so bringen werden 🙂