Maniac Mansion Mania Forum

Allgemein => Allgemeine Diskussionen => Thema gestartet von: Kiwa am 08. Februar 2023, 23:36:16

Titel: Was KI alles kann
Beitrag von: Kiwa am 08. Februar 2023, 23:36:16
Hallo zusammen,

die KI chatGPT scheint immer bekannter zu werden aber es gibt noch weitere interessante KI-Maschinen die zum Teil auf ganz bestimmte Aufgaben zugeschnitten sind.
Wer chatGPT noch nicht kennt, einfach mal bei youtube eingeben, man bekommt zahlreiche Videos dazu.
In dem hier verlinkten Video werden weitere Ki Systeme vorgestellt.
So kann man sich anhand einer textuellen Beschreibung Bilder zeichnen lassen, oder man lässt sich Videoclips erstellen oder spielt ein Text-Adventure mit einer KI usw.

Finde ich ganz interessant zumal die meisten (noch) kostenlos sind. Bei der KI die einem Bilder zeichnen kann habe ich sofort an MMM gedacht. Wie genial wäre es wenn diese KI nach textueller Beschreibung die Hintergründe, Gegenstände etc. für neue Epis zeichen könnte.

Hat sowas schonmal jemand ausprobiert?  :cl

Hier werden 7 weitere dieser KIs vorgestellt:

Titel: Re: Was KI alles kann
Beitrag von: MalleTheRedPhoenix am 10. Februar 2023, 12:58:47
So schön es sein mag, was die KI mittlerweile zustande bringen kann, so unberechenbar wirkt sie auch auf mich, was ich persönlich beunruhigend finde. Es ist irgendwie schon beängstigend, wie täuschend echt "Personen" aussehen, die von der KI erstellt worden sind oder das man auch die Stimmen von Prominenten nachbilden kann, so dass man glauben könnte, dass es die echte Person sein könnte. Mit einfachen Worten: Die KI kann leicht für Manipulationszwecke eingesetzt werden. Entsprechend kann ich die Entwicklung nicht gut heißen.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 10. Februar 2023, 21:30:19
Für mich als gelernter Anwendungsentwickler ist das Thema total spannend. Es ist schon sehr beeindruckend (und ja, auch ein bisschen gruselig), was so eine Kl alles kann.
So groß die Bedenken der Manipulation auch sein mögen: Der Fortschritt kann sowohl zu Gutem, als auch zu Schlechtem eingesetzt werden. Die Bedenken sind für mich aber nicht größer als für manch andere Dinge. So hatte meine Oma Angst vor Computern, weil sie für Ihre Welt eben auch ein Wunderding war, das sie bedrohlich fand.
Die Entwicklung von Kls ist jedenfalls nicht mehr aufzuhalten, das ist ein riesiges Thema geworden und die Entwicklung ist rasant. Und da die Kl da ist, nutze ich sie auch. Die auseinandersetzung mit der technischen Weiterentwicklung ist auch ein Grund, weshalb ich mehr staune, als dass ich ihr skeptisch gegenüberstehe.
Und ja, sobald sie mir vernünftige Bilder zeichnen kann, werde ich die Kl auch dafür nutzen. :-)
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 15. November 2023, 14:58:11
Ich habe gerade mal aus Spaß den Bing-Chat befragt:

Zitat
Erstelle ein eine Story für ein Point and Click Adventure im Maniac Mansion Universum.

Zitat
Hier ist eine mögliche Story für ein Point and Click Adventure im Maniac Mansion Universum:

Du bist Alex, ein junger Hacker, der von einem mysteriösen Anrufer beauftragt wird, in das Maniac Mansion einzubrechen und einen geheimen Datenträger zu stehlen. Der Anrufer verspricht dir eine hohe Belohnung, wenn du erfolgreich bist, aber er warnt dich auch vor den Gefahren, die dich im Haus erwarten. Du entscheidest dich, zwei deiner Freunde mitzunehmen, die dir bei der Mission helfen können. Du kannst aus folgenden Charakteren wählen:

Lisa, eine Journalistin, die immer auf der Suche nach einer guten Story ist. Sie kann mit ihrer Kamera Beweise sammeln und Leute interviewen.
Max, ein Musiker, der ein Talent für Improvisation hat. Er kann mit seiner Gitarre Türen öffnen, Gegner ablenken und Stimmungen verändern.
Sam, ein Erfinder, der gerne mit Elektronik bastelt. Er kann mit seinem Multitool Geräte reparieren, hacken und manipulieren.
Zusammen macht ihr euch auf den Weg zum Maniac Mansion, wo ihr auf die verrückte Familie Edison trefft, die unter dem Einfluss eines bösen Meteors steht. Ihr müsst euch vor dem wahnsinnigen Dr. Fred, seiner nymphomanen Frau Edna, seinem nerdigen Sohn Ed, seinem rebellischen Sohn Weird Ed, seinem mutierten Sohn Tentakel und seinem sprechenden Hamster verstecken. Außerdem trefft ihr auf andere merkwürdige Gestalten, wie den grünen Tentakel, der ein Rockstar werden will, den lila Tentakel, der die Weltherrschaft anstrebt, den Meteorpolizisten, der den Meteor verhaften will, und den Meteor-Messias, der den Meteor anbetet.

Um den Datenträger zu finden, müsst ihr das Haus erkunden, Rätsel lösen, Gegenstände kombinieren und mit den Bewohnern interagieren. Dabei entdeckt ihr viele Geheimnisse, wie zum Beispiel eine Zeitmaschine, eine Alien-Basis, eine Geisterbahn und eine Atombombe. Ihr erfahrt auch, dass der Anrufer in Wirklichkeit der lila Tentakel ist, der den Datenträger braucht, um seine Weltherrschaftspläne zu verwirklichen. Ihr müsst euch also entscheiden, ob ihr ihm den Datenträger gebt, ihn zerstört oder ihn für euch behaltet. Je nach eurer Wahl gibt es verschiedene Enden, die das Schicksal des Maniac Mansion und der Welt bestimmen.

Mal ganz ehrlich: Aus der Antwort kann man ein ziemlich geiles Spiel erstellen, das ich sofort spielen wollen würde.
Titel: Re: Was KI alles kann
Beitrag von: Cone Arex am 16. November 2023, 06:37:08
Der Bing-Chat basiert auf GPT-4 oder? Ich habe letztes Jahr schon mal ChatGPT (GPT-3.5) nach Ideen für eine MMM-Episode gefragt. Das war seiner Zeit aber noch deutlich primitiver ausformuliert.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 16. November 2023, 07:56:17
Nein, die KI von Bing wurde von Microsoft entwickelt (angeblich  :cl)
Titel: Re: Was KI alles kann
Beitrag von: Bòógieman am 16. November 2023, 10:16:03
naja, von OpenAI, MS hat die aber gekauft/gesponsored
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 16. November 2023, 18:49:11
Der Bing-Chat basiert auf GPT-4 oder?
Ich habe gerade nochmal nachgesehen, GPT-4 ist doch richtig.
Titel: Re: Was KI alles kann
Beitrag von: Kaktus am 10. Dezember 2023, 12:19:48
Bernards Zimmer in verschiedenen Stilrichtungen:
(https://i.imgur.com/BNtSyNt.png)
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 10. Dezember 2023, 13:41:00
Auf den ersten Blick dachte ich, WOAH, mir steht die Kinnlade offen. Auf den zweiten Blick finde ich mit Ausnahme der beiden Bilder bei Nacht keines, was zum echten Standort des Hauses in Ronville passen würde - es stört mich die Sicht aus dem Fenster:

Mittelalterliche Waldhütte, orientalisch angehauchtes Zimmer, das eine sieht aus wie aus der Wüste (ich musste unweigerlich an It came from the Desert denken), dann ein seltsamen verblumtes Zimmer, das passt eher zu Britney, dann bayrisch-bergig, gefolgt von eindeutig karibischem Flair.

Aber pixeltechnisch sind die einfach toll!
Titel: Re: Was KI alles kann
Beitrag von: Cone Arex am 10. Dezember 2023, 14:22:26
Welches Tool hast du verwendet, Kaktus? Dall-E?
Titel: Re: Was KI alles kann
Beitrag von: Kaktus am 10. Dezember 2023, 16:58:49
Ich habe Stable Diffusion XL (mit Control net ) benutzt.
Gibt verschiedene UIs zu StableDiffusion, z.B. ComfyUI, Automatic1111, invokeAI (was ich hier verwendet habe).

Auf den zweiten Blick finde ich mit Ausnahme der beiden Bilder bei Nacht keines, was zum echten Standort des Hauses in Ronville passen würde
Das ist in dem Fall beabsichtigt und liegt natürlich an den Prompts, die ich verwendet habe. Man kann natürlich auch ein bisschen mit den Prompts rumprobieren, um ein typisches amerikanisches Nerd Zimmer oder was auch draus immer draus zu machen.
Das erste Bild ist übrigens von Maniac Mansion inspiriert oder dem was Stable Diffusion davon "kennt", ich denke man kann schon einige Elemente identifizieren.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 15. Dezember 2023, 15:09:46
Die Bilder find ich sehr cool! Vor allem das zweite erinnert mich total an Kings Quest. Da spielt meine Phantasie direkt verrückt: eine Traumfolge, in der Bernard plötzlich in seinem Zimmer "aufwacht", das zu einer Waldhütte wurde, wenn er sie verlässt, findet er sich in der Welt von KQ wieder.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 15. Dezember 2023, 22:41:19
Kann man das kostenlos testen? Und kannst du beschreiben, wie du das gemacht hast? Ich glaube, das wird hier den Einen und Anderen interessieren.

Allein mit Stable Diffusions XL Base 1.0 (kurz über InvokeAI angeworfen) kommt nur nicht wieder erkennbarer Müll raus. Das hier war mal das Wink Smiley Studio:
(https://i.imgur.com/fZqmI6F.png)
Titel: Re: Was KI alles kann
Beitrag von: Kaktus am 16. Dezember 2023, 02:30:30
Ob man das GUI kostenlos im Internet benutzen kann, dazu kann ich leider nicht viel sagen, da es bei mir lokal läuft (RTX 3060 12GB), möglicherweise über Google Colab.

Noch zu erwähnen ist, dass ich die Grafik zunächst von 320x128 auf 1024x408 hochskaliert habe (ist nicht ganz die gleiche aspect ratio, aber nah dran).
Bei Verwendung der Originalauflösung gab es auch nur Pixelsalat, wahrscheinlich weil SDXL mit  hohen Auflösungen trainiert wurde. Vielleicht wäre eine Auflösung von 960x384 optimal, da exakt gleiche aspect ratio von 5:2 , um Blurriness beim runterskalieren möglichst gering zu halten.

Dann brauchst du die ControlNet Models für SDXL (von https://models.invoke.ai/ für invokeiAI). Hab hier einfach controllnet-canny verwendet und das hochskalierte Bild von Bernards Zimmer in den Control Adapter hineingedrag und -dropped. Hab dann als weight etwa 0.75 verwendet und Control Mode auf "Prompt". Gibt natürlich unzählige Möglichkeiten mit den verschiedenen Parametern herumzuspielen.

Mit den prompts kannst du natürlich dann auch wieder rumprobieren. Hier mal beispielhaft das prompt für das karibische Flair:
16 bit pixelart, beach bedroom, nerd room, palm tapestry, floyd steinberg, pirates, monkey island style, guybrush, carribean

Ach ja, als Model habe ich juggernautXL verwendet, was ein recht beliebtes general purpose Model ist. Die Ergebnisse waren etwas besser als beim base SDXL Model.
Gibt auch einige spezielle Pixelart Modelle, hab da noch nicht so viel rum probiert.
Und auch einige LoRAs, die mit Adventure Hintergründen trainiert wurden:
https://civitai.com/models/151539/lucasarts-style-1990s-pc-adventure-games-sdxl-lora-dreambooth-trained
https://civitai.com/models/192214/bill-tiller-style-sdxl
https://civitai.com/models/206150/tscale-style
https://civitai.com/models/174301

Gäbe auch die Möglichkeit beispielsweise ein Model / LoRA speziell mit den Hintergründen von MMM zu trainieren mittels kohya_ss, hab das bei mir allerdings noch nicht zum laufen gebracht, aufgrund von Python- und Library-Versions-Wirrwarr.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 16. Dezember 2023, 22:50:04
Ich habe fast den ganzen Tag mit InvokeAI rumgespielt (Da verfliegt die Zeit, das sage ich euch...) und das ganze Geheimnis ist, die berechnete Bildgröße so hoch wie möglich zu konfigurieren. Erst als ich das auf 1280x512 Pixel gesetzt habe, bekam ich das erste gute Ergebnis. Alles andere davor war nicht wirklich zu gebrauchen.

(https://i.imgur.com/bbkQ14B.png)
(Berechnungsdauer auf einer RTX2060 SUPER ca. 30 Minuten - 8 GB Video-RAM sind hierfür wohl das Minimum und genau das hat meine Karte)

Nachfolgend die zu diesem Bild gehörigen Metadaten für Invoke AI (Die Werte werden mit in die Extradaten des PNG Bilds geschrieben. Alle Werte sind wichtig, damit man be einer erneuten Berechnung auch dasselbe Bild erhält. Der "Seed" Wert steht Standardmäßig auf Zufall und wird bei jeder Berechnung neu berechnet. Man muss den also fix angeben, damit man dasselbe Ergebnis erhält:

Ergänzung:
Im nachfolgenden Abschnitt "controlnets" fehlt der passende "Processor" Modus mit dem Wert "Canny". Damit werden von der Eingabegrafik die "Outlines" (also die Konturen mit einem harten Kontrast) berechnet und als Eingabe für die AI genutzt, damit diese weiß, worauf sie sich beziehen soll.
{
  "generation_mode": "sdxl_txt2img",
  "positive_prompt": "16 bit pixelart, beach bedroom, nerd room, palm tapestry, floyd steinberg, pirates, monkey island style, guybrush, carribean",
  "negative_prompt": "",
  "width": 1280,
  "height": 512,
  "seed": 296104323,
  "rand_device": "cpu",
  "cfg_scale": 7,
  "cfg_rescale_multiplier": 0,
  "steps": 50,
  "scheduler": "euler",
  "model": {
    "model_name": "juggernautXL_v7Rundiffusion",
    "base_model": "sdxl",
    "model_type": "main"
  },
  "controlnets": [
    {
      "image": {
        "image_name": "cb6ecade-d172-4c40-992c-e03e21bd9676.png"
      },
      "control_model": {
        "model_name": "controlnet-canny-sdxl-1.0",
        "base_model": "sdxl"
      },
      "control_weight": 0.75,
      "begin_step_percent": 0,
      "end_step_percent": 1,
      "control_mode": "more_prompt",
      "resize_mode": "just_resize"
    }
  ],
  "positive_style_prompt": "",
  "negative_style_prompt": ""
}

Downloads:
- InvokeAI: https://github.com/invoke-ai/InvokeAI/releases/ (https://github.com/invoke-ai/InvokeAI/releases/) - Das Basisprogramm. Setzt Python 3.10.x voraus. Ohne 16 GB Arbeitsspeicher plus mindestens 8 GB Grafikkartenspeicher braucht ihr vermutlich gar nicht erst versuchen zu testen.
- juggernautXL_v7Rundiffusion: https://civitai.com/models/133005/juggernaut-xl - Ein sogenanntes Model für die AI, die simpel ausgedrückt beschreibt, wie ein Bild auszusehen hat.
- controlnet-canny-sdxl-1.0: https://models.invoke.ai/diffusers/controlnet-canny-sdxl-1.0 (https://models.invoke.ai/diffusers/controlnet-canny-sdxl-1.0) - Eine Art Erweiterung, die es ermöglicht bestimmte Teile eines vorhandenen Bilds als Eingabe für die AI zu nutzen. Das können Outlines, Farben, Tiefeninformationen usw. sein.

@Kaktus:
Vielen Dank für Deinen Anstoß - ich bin zwar fast verzweifelt und wollte schon schreiben, dass es hier einfach nicht funktionieren will aber dann habe ich als letztes mal die Ausgabeauflösung hochgeschraubt und jetzt bin ich ein wenig gehyped 8)
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 16. Dezember 2023, 23:13:32
Das Webinterface von InvokeAI sieht übrigens so aus und lädt zum Spielen ein, wenn man erst einmal ein wenig vom drumherum der AI und den ganzen Fachbegriffen verstanden hat. Das gezeigt Bild ist 1:1 identisch zu dem aus meinem vorherigen Beitrag, jedoch hatte ich die Ausgabeauflösung noch auf 640x480 Pixel und das reicht der KI wohl nicht und sie erzeugt ein recht detailarmes Bild. Links erkennt man Control Adapter mit seinem berechneten Outline-Bild, was er als Eingabe für die KI generiert.
(https://i.imgur.com/zP3e0ni.png)

Mir hat dieses Video noch geholfen:


Und mittlerweile wurde auch dasselbe Bild, ergänzt um ein sogenanntes "LoRA" fertig berechnet. Ein LoRA ist auf einen speziellen Artstil trainiert worden und soll diesen nachempfinden. In diesem Fall der Lucas Arts Stil.

(https://i.imgur.com/NpBFGP2.png)
LucasArts Style" (1990s PC Adventure Games) - SDXL LoRA - (Dreambooth Trained)

Metadaten hierzu:
{
  "generation_mode": "sdxl_txt2img",
  "positive_prompt": "16 bit pixelart, beach bedroom, nerd room, palm tapestry, floyd steinberg, pirates, monkey island style, guybrush, carribean",
  "negative_prompt": "",
  "width": 1280,
  "height": 512,
  "seed": 296104323,
  "rand_device": "cpu",
  "cfg_scale": 7,
  "cfg_rescale_multiplier": 0,
  "steps": 50,
  "scheduler": "euler",
  "model": {
    "model_name": "juggernautXL_v7Rundiffusion",
    "base_model": "sdxl",
    "model_type": "main"
  },
  "controlnets": [
    {
      "image": {
        "image_name": "31b3c195-76c5-4478-bb9c-eea53988911a.png"
      },
      "control_model": {
        "model_name": "controlnet-canny-sdxl-1.0",
        "base_model": "sdxl"
      },
      "control_weight": 0.75,
      "begin_step_percent": 0,
      "end_step_percent": 1,
      "control_mode": "more_prompt",
      "resize_mode": "just_resize"
    }
  ],
  "loras": [
    {
      "lora": {
        "model_name": "Lucasarts Artstyle - Trigger is lcas artstyle",
        "base_model": "sdxl"
      },
      "weight": 0.75
    }
  ],
  "positive_style_prompt": "",
  "negative_style_prompt": ""
}

Download LucasArts Style" (1990s PC Adventure Games) - SDXL LoRA - (Dreambooth Trained): https://civitai.com/models/151539/lucasarts-style-1990s-pc-adventure-games-sdxl-lora-dreambooth-trained (https://civitai.com/models/151539/lucasarts-style-1990s-pc-adventure-games-sdxl-lora-dreambooth-trained)
Titel: Re: Was KI alles kann
Beitrag von: Walmaker am 24. Dezember 2023, 16:54:55
Honestly, I would never use AI art for my work. I understand if you guys want to use AI for a few posts and such but honestly with it's unpredictability (and lack of common human sense), not only the backgrounds will look really freakish and kind of disturbing, it can't even tell what art style to use so each background will look different (and not in a good way either).

I understand if you guys want to use it because the maniac mansion fandom is very little and there aren't as many good artists (despite me, Jan-Hendrik Gebbe, and probably a few others... I'm new here). The rest of the guys sadly don't have the artistic talent... but do you have to? If there's something I learned from the animation industry (mostly the Simpsons), it's that you don't need always need a Disney-level art style to tell a good story, in fact, Story is actually a lot more important than art and animation which is only used to express the story. This goes all the way back to the 50s when TV was taking over the media and cartoons were getting tighter budgets but that never stopped them from creating such classics like The Flintstones, Scooby-Doo (don't question the similarities), and later on SpongeBob SquarePants, The Simpsons, Dexter's Lab, and many others. They don't have the animation budgets the golden age of animation (1930s-1950s) had but they were still very entertaining to watch.

At the end of the day, it's your decision if you want to use AI or not, it's just my opinion.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 22. Juni 2024, 19:48:57
Unabhängig von Maniac Mansion Mania habe ich mittlerweile über dreamshaperXL_v21TurboDPMSDE und den beiden Loras  lucasarts style sowie EldritchComicsXL1.2 ziemlich gute Ergebnisse, was Pixelart angeht.

ABER: Man erhält niemals einen einheitlichen Stil über verschiedene Bilder hinweg. Es wird also z. B. schon daran in jedem Fall scheitert, wenn man einmal ein Haus von vorne und dann von der Seite oder den Garten dahinter haben möchte, das ist im Grunde so gut wie nicht möglich. Vieles bleibt dem Zufall überlassen. Man kann maximal der KI einige Vorgaben machen aber sie macht daraus, was sie möchte und nicht unbedingt genau das, was man braucht.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 22. Juni 2024, 19:49:47
Noch ein paar Beispiele
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 22. Juni 2024, 19:51:05
Hier sind zwei dabei, bei denen der Lucas Arts Lora verstärkt wurde. Man erkennt genau, welche beiden Bilder das sind.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 22. Juni 2024, 20:56:55
Es ist aber schon extrem cool. Man kann dann ja auch die Bilder so zusammenbauen, wie man sie braucht. Welche KI ist das?
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 22. Juni 2024, 21:41:50
Das ist weiterhin genau die, die hier im Thread erwähnt wurde:

Basis: Stable Diffusion SDXL
Als Checkpoint: dreamshaperXL_v21TurboDPMSDE
LORA 1: lucasarts style
LORA 2: EldritchComicsXL1.2

Gesteuert wird alles über die GUI "InvokeAI" https://github.com/invoke-ai/InvokeAI (https://github.com/invoke-ai/InvokeAI)

Der Trick hierbei ist:
Die KI ein Bild generieren lassen. Das hat mehr oder weniger Fehler und dann wird das einfach zwei mal Resized
1. 25% Bi-Linear Filter
2. 400% Nächster Nachbar

Dadurch fallen die Fehler im eigentlichen Bild gar nicht mehr auf und der Pixel-Look kommt zustande.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 19. Dezember 2024, 11:55:17
Eigentlich wollte ich ans Ende der MMM-Episode 40 einen Song einfügen, das hatte aber nicht geklappt.

Jetzt habe ich https://suno.com entdeckt und den Songtext der KI zum futtern gegeben, ein paar Infos zum Genre und das (https://www.dropbox.com/scl/fi/337m3xnbb66yroqb0optg/Maniac-Mansion-Song.mp3?rlkey=wl47xnomn2umsc91859q6usr6&st=4q82ozix&dl=0) ist dabei herausgekommen.
Ich finds irgendwie cool und bin auf eure Meinung gespannt. :)
Titel: Re: Was KI alles kann
Beitrag von: Bòógieman am 19. Dezember 2024, 12:55:43
richtig nice  :D
der Text ist von dir oder auch KI generiert?
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 19. Dezember 2024, 13:27:55
Der Refrain ist von der KI, der Rest ist von mir.
Titel: Re: Was KI alles kann
Beitrag von: Cmdr am 19. Dezember 2024, 15:04:39
Diese KI ist echt krass - das macht mir irgendwie Angst.  :o
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 19. Dezember 2024, 16:12:32
Diese KI ist echt krass - das macht mir irgendwie Angst.  :o
Oh, so schlimm? Ich find es beeindruckend, aber erschreckend? Wegen der Missbrauchsgefahr?
Ich denke da immer an jeden Schritt, in der die Welt digitaler wurde.

Man stelle sich nur vor, der Geldautomat gibt Geld aus, weil ich eine Plastikkarte und eine 4-Stellige Nummer habe. Da wird nicht geschaut, welcher Mensch davor steht. Der Aufschrei muss ja gigantisch gewesen sein.
Titel: Re: Was KI alles kann
Beitrag von: Cmdr am 19. Dezember 2024, 17:34:21
Naja gefühlt kann eine KI bald schon alles: Von Bildern zeichnen über Musik erstellen.
Da denkt man schon, dass bald kein Mensch für irgendwas benötigt wird, wenn doch alles direkt generiert werden kann.
Titel: Re: Was KI alles kann
Beitrag von: MalleTheRedPhoenix am 19. Dezember 2024, 18:23:30
Ich habe keine große Einsicht, was die KI betrifft.

Entsprechend stelle ich erstmal eine Frage in den Raum, bevor ich eine Aussage mache:

Ist die KI mittlerweile fähig SELBSTSTÄNDIG etwas zu erschaffen oder zu agieren?
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 19. Dezember 2024, 19:12:19
Was meinst du mit selbstständig? Man kann ihr Anweisungen geben, die sie umsetzt. Natürlich könnte man sowas auch in gewisser Weise automatisieren. Meiner Meinung nach ist es aber so wie immer: Die Arbeit für den Menschen ist nicht weg, sie ist nur anders. Bei der Industrialisierung war es ja nichts anderes: Die Menschen hatten Angst, sie werden obsolet. In Wirklichkeit war es so, dass die Arbeit zwar schneller erledigt war, aber dabei die Anforderungen stiegen.

Aber zum Beispiel geht sowas mit ChatGPT:

Anweisung:
Schreibe eine Episode für ein Maniac Mansion Mania Adventure
- entwerfe eine kleine Story mit einem Charakter
- erstelle 10 verschachtelte Rätsel und beschreibe detailliert ihren Lösungsweg
- nutze mindestens 5 Inventargegenstände


ChatGPT:
Episode: „Bernards verrückte Experimentnacht“

Story
Bernard Bernoulli, das geniale, aber oft zerstreute Wissenschaftsgenie, bereitet ein bahnbrechendes Experiment vor. Er hat versehentlich eine Mini-Zeitmaschine aktiviert, die ihm nun einen Streich spielt, indem sie Dinge aus der Vergangenheit und Zukunft in sein Labor teleportiert. Um das Experiment zu stoppen, muss Bernard eine spezielle Energiezelle bauen. Doch diese besteht aus verschiedenen Komponenten, die in der Villa verstreut sind und nur durch cleveres Kombinieren und Problemlösen gefunden werden können.

Hauptziel: Bernard muss die Energiezelle zusammenbauen und in die Zeitmaschine einsetzen, bevor das Chaos die Realität zerreißt.

Charakter
Bernard Bernoulli: Der Protagonist, ein exzentrischer und leicht nerdiger Wissenschaftler.
Rätselübersicht und Lösungswege
1. Zugang zum Labor
Problem: Das Labor ist hinter einer elektronischen Tür verriegelt, und der Zugangscode ist verloren.

Lösung:

Bernard findet im Flur ein Notizbuch.
Im Notizbuch steht: „Der Code ist mein Geburtsjahr.“
Er muss ins Wohnzimmer gehen und einen Blick auf ein Familienfoto werfen, auf dem das Jahr des Fotos vermerkt ist (1984).
Kombiniert mit einem Hinweis „Ich war 10, als das Foto gemacht wurde“ ergibt sich der Code 1974.
Bernard gibt den Code an der Tür ein und öffnet sie.
2. Reparatur der kaputten Lampe im Labor
Problem: Die Lampe im Labor ist defekt, und Bernard braucht Licht, um den Arbeitsbereich zu sehen.

Lösung:

Bernard nimmt eine Glühbirne aus der Nachttischlampe in seinem Zimmer.
Die Sicherung ist durchgebrannt, also holt er aus der Garage eine neue Sicherung.
Er setzt die Sicherung und die Glühbirne ein, und das Licht funktioniert wieder.
3. Das Schloss der Vorratskammer öffnen
Problem: Die Vorratskammer, die wichtige Materialien enthält, ist mit einem Zahlen-Drehrad verschlossen.

Lösung:

Bernard findet in der Küche ein Rezeptbuch, in dem zufällig steht: „Die geheimen Zutaten: 3 Tassen Zucker, 7 Löffel Salz, 5 Tropfen Essig.“
Er kombiniert die Zahlen (3-7-5) und öffnet das Schloss.
4. Ein Loch in der Wand entdecken
Problem: Ein kleiner Schlüssel ist in einem Loch in der Wand des Labors gefallen. Bernard braucht ihn, um die Werkzeugkiste zu öffnen.

Lösung:

Er findet einen Drahtbügel im Schrank.
Den Draht formt er mit einer Zange (aus der Garage) zu einem Haken.
Mit dem Haken angelt er den Schlüssel aus dem Loch.
5. Das kaputte Gerät reparieren
Problem: Das Gerät, das für die Energiezelle benötigt wird, funktioniert nicht.

Lösung:

Bernard findet eine kaputte Sicherung im Gerät.
Er nimmt die Ersatzsicherung, die er bereits in Rätsel 2 verwendet hat.
Er setzt die neue Sicherung ein, und das Gerät funktioniert wieder.
6. Den „sprechenden Schädel“ beruhigen
Problem: Ein antiker Schädel aus der Zeitmaschine nervt Bernard mit ununterbrochenem Quatschen und blockiert den Zugang zu einem wichtigen Bauteil.

Lösung:

Bernard findet in der Bibliothek ein Buch über alte Sprachen.
Er entdeckt, dass der Schädel mit einem bestimmten Zauberspruch ruhiggestellt werden kann: „Silencio Mentem!“
Bernard spricht den Zauberspruch aus, und der Schädel verstummt.
7. Stromumleitung zur Energiezelle
Problem: Die Stromversorgung zur Energiezelle ist blockiert.

Lösung:

Bernard entdeckt ein Panel mit farbigen Kabeln.
Er findet in einer alten Zeitung einen Hinweis: „Die Reihenfolge ist die des Regenbogens.“
Er verbindet die Kabel in der Reihenfolge: Rot, Orange, Gelb, Grün, Blau, Lila.
8. Den Kristall des Wahnsinns holen
Problem: Der Kristall des Wahnsinns, ein Bauteil für die Energiezelle, liegt in einer verschlossenen Box.

Lösung:

Bernard findet einen Zahlencode auf einem alten Zettel (1234).
Er gibt den Code in das Schloss ein, und die Box öffnet sich.
9. Kühlmittel für die Energiezelle besorgen
Problem: Die Energiezelle überhitzt ohne Kühlmittel.

Lösung:

Bernard holt ein Gefäß aus der Küche.
Er geht zum Kühlschrank und füllt es mit Eiswürfeln.
Das Gefäß wird in die Energiezelle eingesetzt.
10. Die Zeitmaschine aktivieren
Problem: Die Energiezelle ist fertig, aber die Zeitmaschine startet nicht.

Lösung:

Bernard findet im Arbeitszimmer ein Handbuch zur Maschine.
Im Handbuch steht: „Drehe den Hauptschalter, ziehe den Hebel, drücke die Knöpfe in der Reihenfolge Blau-Grün-Rot.“
Bernard führt die Schritte durch, und die Maschine startet.
Inventargegenstände
Glühbirne
Sicherung
Drahtbügel
Gefäß
Handbuch

Finale:
Bernard setzt die Energiezelle ein und deaktiviert die Zeitmaschine gerade rechtzeitig. Die Chaos-Objekte verschwinden, und Bernard seufzt erleichtert. Als er sich umdreht, sieht er einen Dinosaurier aus der Zeitmaschine spazieren. Ein perfekter Cliffhanger für die nächste Episode!
Titel: Re: Was KI alles kann
Beitrag von: 1mal_volltanken am 19. Dezember 2024, 20:18:51
Wenn eine KI eigene MMM-Episoden erstellen kann, ist ja noch soweit schön und gut.

Aber wenn die KI in der Lage sein sollte, in unseren Alltag einzugreifen, ist das sicher nicht ungefährlich.



P.S.:  Wenn der Song von der KI erstellt wurde, ist das schon echt beeindruckend.
Titel: Re: Was KI alles kann
Beitrag von: MalleTheRedPhoenix am 19. Dezember 2024, 23:20:26
Was meinst du mit selbstständig? Man kann ihr Anweisungen geben, die sie umsetzt.

Genau das meine ich. Ich meinte mit selbstständig, dass die KI quasi eine eigene Motivation schafft selbst was zu tun und zu erschaffen, anstatt von den Menschen was vorgegeben zu bekommen.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 19. Dezember 2024, 23:45:26
Eigentlich wollte ich ans Ende der MMM-Episode 40 einen Song einfügen, das hatte aber nicht geklappt.

Jetzt habe ich https://suno.com entdeckt und den Songtext der KI zum futtern gegeben, ein paar Infos zum Genre und das (https://www.dropbox.com/scl/fi/337m3xnbb66yroqb0optg/Maniac-Mansion-Song.mp3?rlkey=wl47xnomn2umsc91859q6usr6&st=4q82ozix&dl=0) ist dabei herausgekommen.
Ich finds irgendwie cool und bin auf eure Meinung gespannt. :)

Suno kann schon einiges, ja. Alles was ich bisher gehört habe ist aber maximal so "Einheitsbrei", der ganz normal im Radio laufen könnte und den man nebenher mithört. Spoiler wegen des Director Cuts von Episode 044:
Spoiler (hover to show)

Einiges davon ist aber schon wirklich enorm, hört euch z. B. mal das hier an https://suno.com/song/bab51af4-d855-4850-8832-a8c4af09fd49 (https://suno.com/song/bab51af4-d855-4850-8832-a8c4af09fd49)
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 20. Dezember 2024, 06:55:29
Einiges davon ist aber schon wirklich enorm, hört euch z. B. mal das hier an https://suno.com/song/bab51af4-d855-4850-8832-a8c4af09fd49 (https://suno.com/song/bab51af4-d855-4850-8832-a8c4af09fd49)
Hm ... das flutscht für mich aber genauso durch wie alles, was im Radio läuft. Und ich denk mal, dass das auch so programmiert ist. Es soll den Mainstream bedienen, und das ist auch vollkommen okay.

Ich finds krass, wie suno zufällig die Stelle mit dem Hamster so geil abgesetzt hat. Ich hab ein paar Versionen generieren lassen und an der Stelle musste ich echt lachen, weil absolut passte. Man kann das durch spezielle Anweisungen solche abgesetzten Sachen auch absichtlich hinkriegen. Damit werd ich noch ein bisschen rumspielen, vielleich bekomme ich noch ne bessere Version hin.

Spoiler (hover to show)
Titel: Re: Was KI alles kann
Beitrag von: Cmdr am 20. Dezember 2024, 09:26:05
ChatGPT:
Episode: „Bernards verrückte Experimentnacht“
[...]

Spannend - jetzt muss nur noch jemand diese Episode umsetzen.  ;D
Oder kann man noch den Prompt hinzufügen: Gebe diese Episode fertig geschrieben in AGS Script aus"?
Titel: Re: Was KI alles kann
Beitrag von: Larry Wolf am 20. Dezember 2024, 10:19:17
Eigentlich wollte ich ans Ende der MMM-Episode 40 einen Song einfügen, das hatte aber nicht geklappt.

Jetzt habe ich https://suno.com entdeckt und den Songtext der KI zum futtern gegeben, ein paar Infos zum Genre und das (https://www.dropbox.com/scl/fi/337m3xnbb66yroqb0optg/Maniac-Mansion-Song.mp3?rlkey=wl47xnomn2umsc91859q6usr6&st=4q82ozix&dl=0) ist dabei herausgekommen.
Ich finds irgendwie cool und bin auf eure Meinung gespannt. :)

Suno.com ist ziemlich klasse! Damit habe ich auch schon einige Lieder gemacht. Und da werden auch noch mehr kommen. Es macht (zumindest mir) sehr viel Spaß da auszuprobieren und rauszufinden was geht und was sich gut anhört.

Die zwei Lieder, die AmigaMaster in Episode 44 erwähnt (denke nicht, dass ich das in Spoiler setzen muss), habe ich auch mit Suno erschaffen.

Suno kann schon einiges, ja. Alles was ich bisher gehört habe ist aber maximal so "Einheitsbrei", der ganz normal im Radio laufen könnte und den man nebenher mithört.

Bei Suno gibt es wirklich viel Einheitsbrei. Der aber immer noch sehr gut zum anhören ist. Aber mit ein wenig geduld und rumprobieren bekommt man da durchaus auch sehr kreative und richtig gute Lieder heraus.
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 20. Dezember 2024, 10:29:27
ChatGPT:
Episode: „Bernards verrückte Experimentnacht“
[...]

Spannend - jetzt muss nur noch jemand diese Episode umsetzen.  ;D
Oder kann man noch den Prompt hinzufügen: Gebe diese Episode fertig geschrieben in AGS Script aus"?

Na ja, da kommt die KI ein bisschen an ihre Grenzen. Die KI kennt AGS und kann auch ein bisschen damit umgehen. Man müsste ihr aber die gängigen Befehle beibringen, sodass sie diese auch zuverlässig nutzt. Außerdem müsste man alle Objekte und Hotspots erstellen und ihr sagen, wie diese zu handhaben sind. Dann kommt vielleicht was raus, das sogar zu 90% korrekt ist. Das Problem dabei ist aber, dass man der KI (zumindest in der kostenlosen Variante) nicht so viel Text geben kann und sie nicht so viel ausspuckt. Das, was sie an Dialogen schreibt ist auch ... naja, nicht das gelbe vom Ei. Aber in kleinem Rahmen kann man da bestimmt was machen.
Titel: Re: Was KI alles kann
Beitrag von: Cmdr am 20. Dezember 2024, 11:33:48
Nunja, aber für so einzelne Elemente einer Episode könnte man sie ja tatsächlich verwenden.
- Dialog schreiben (Das ist einer meiner persönlichen Schwächen. Du sagst KI kann das noch nicht gut, aber man könnte sich vom Generierten ja inspirieren lassen.)
- Rätsel ausdenken
- Ideen finden, was man mit einem bestimmten Gegenstand an lustigen Dingen anstellen könnte
Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 20. Dezember 2024, 14:57:34
Nunja, aber für so einzelne Elemente einer Episode könnte man sie ja tatsächlich verwenden.
- Dialog schreiben (Das ist einer meiner persönlichen Schwächen. Du sagst KI kann das noch nicht gut, aber man könnte sich vom Generierten ja inspirieren lassen.)
- Rätsel ausdenken
- Ideen finden, was man mit einem bestimmten Gegenstand an lustigen Dingen anstellen könnte
Jep, das geht und das mache ich auch schon, also mir Ideen geben lassen. Dialoge fand ich immer unbrauchbar und habe sie selbst geschrieben. Wortwitze oder Anspielungen kann die KI nicht wirklich erzeugen, sie versteht aber lustigerweise Wortwitze. Alles, was ich ihr zum Test mal gegeben habe, konnte sie sinnvoll nachvollziehen, auch wenn die Wortwitze von mir selbst waren.

openai ist nach wie vor kostenlos, die Version 4 zwar nur begrenzt, aber 3.5 ist auch schon gut. c# und SQL spricht die KI übrigens fließend. Beschreibe ihr dein Vorhaben und du kannst damit ein komplettes Programm schreiben lassen. Vielleicht noch nicht perfekt, aber durchaus brauchbar.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 24. Dezember 2024, 01:16:29
Ich habe auch mal was durch Suno V4 gejagt... Razor trällert uns da was.

P.S: Der anfänglich englische Akzent der Sängerin in der Metalversion ist schon irgendwie komisch.

https://www.dropbox.com/scl/fi/xw2k3qns4tujgbyo6kqtt/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Metal.mp3?rlkey=9i756bqq9y2u8crn2ln5g4m55&dl=0 (https://www.dropbox.com/scl/fi/xw2k3qns4tujgbyo6kqtt/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Metal.mp3?rlkey=9i756bqq9y2u8crn2ln5g4m55&dl=0)
https://www.dropbox.com/scl/fi/r6rq8jxcwkns1290xxvyh/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Pop.mp3?rlkey=3b3mzykxav1zeyiagsaxcq47v&dl=0 (https://www.dropbox.com/scl/fi/r6rq8jxcwkns1290xxvyh/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Pop.mp3?rlkey=3b3mzykxav1zeyiagsaxcq47v&dl=0)

Lyrics:
In der Nacht, so dunkel und klar,
Ein Meteor fiel, oh wie wunderbar.
Die Edisons wohnen hier, ganz allein,
In ihrem Haus, da muss was sein.

Oh, Maniac Mansion, was verbirgst du hier?
Geheimnisse und Schatten, die ich  nicht kapier.
Mit meinen Freunden, wir sind bereit,
Für ein Abenteuer und die Wahrheit.

Der verrückte Doc, er lacht und plant,
Mit seinen Experimenten, die niemand verstand.
Der Ed ist seltsam, die Edna ist obszön,
An dieses Haus, da muss man sich gewöhn.

Oh, Maniac Mansion, was verbirgst du hier?
Geheimnisse und Schatten, die ich  nicht kapier.
Mit meinen Freunden, wir sind bereit,
Für ein Abenteuer und die Wahrheit.

Die Türen knarren, die Lichter flackern,
Wir müssen aufpassen, nicht in die Falle zu tappen.
Doch mit Mut und Verstand, gehen wir voran,
Gemeinsam sind wir stark, das ist unser Plan.

Oh, Maniac Mansion, was verbirgst du hier?
Geheimnisse und Schatten, die ich  nicht kapier.
Mit meinen Freunden, wir sind bereit,
Für ein Abenteuer und die Wahrheit.

Mit Mut und mit Kraft, wir stehen bereit,
in der Maniac Mansion, zur Geisterzeit.
Mit jedem Schritt, den wir weiter gehen,
Wird die Wahrheit klar, wir werden's verstehen.

So sing ich hier, mit Herz und Verstand,
In der Maniac Mansion, Hand in Hand.
Die Nacht ist jung, die Sterne so nah,
Wir sind die Helden, hurra, hurra!
Titel: Re: Was KI alles kann
Beitrag von: 1mal_volltanken am 27. Dezember 2024, 21:22:27
Der Metal-Track gefiel mir echt gut. Starke Leistung.

Die Frage die bleibt, ist:  Dürfte man dieses Material verwenden?  Wie steht es in Bezug auf KI da mit den Urheberrechten?
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 28. Dezember 2024, 03:49:47
Aus der Suno FAQ von https://help.suno.com/en/articles/2746945 (https://help.suno.com/en/articles/2746945)

If you make music with the Basic (free) plan, Suno is the owner of the songs. You are allowed to use the songs for non-commerical purposes.

If you make songs while subscribed to the Pro or Premier plan, you own the songs. Further, you are granted a commercial use license to monetize those songs.

In both cases, however, the material may not be eligible for copyright protection.

Für nicht kommerzielle Projekte dürfen die Werke also benutzt werden, jedoch gehören Sie weiterhin Suno.

Ich habe die Metalversion als Test auf YouTube hochgeladen und es gibt dort "keine Einschränkungen" für das Video.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 28. Dezember 2024, 04:47:48
Hier noch eine verworfene Version - "More Metal"


Titel: Re: Was KI alles kann
Beitrag von: alphawolf300 am 28. Dezember 2024, 07:43:20
Die Songs find ich gut, aber ich dachte, Razors Musikstil wäre nicht Metal sondern (Punk-)rock.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 28. Dezember 2024, 11:45:38
Stimmt. Zwei Musikstücke hatte ich heute noch frei bei Suno. Hier einer Punk Rock Version:

Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 06. Januar 2025, 00:45:04
Ich kann nicht aufhören zu experimentieren. Razor wird soft:
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 06. Januar 2025, 19:34:29
Sorry Leute aber der hier musste sein:
Titel: Re: Was KI alles kann
Beitrag von: Bòógieman am 07. Januar 2025, 06:35:10
WOW, nice  ;D
Die Credits sind also doch singbar  ;)
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 09. Januar 2025, 00:38:44
Die Songs find ich gut, aber ich dachte, Razors Musikstil wäre nicht Metal sondern (Punk-)rock.
Außerdem passt das Genre Punk Rock doch nicht so Maniac Mansion Mania - das muss schon so was sein wie:

Mambo
Mariachi
Medieval
Melodic Hip Hop (Wie der Credits Song und ok, ok, das Genre ist getrickst)
Metal

 :P
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 09. Februar 2025, 00:25:35
Eine freie Alternative zu Suno: https://www.riffusion.com (https://www.riffusion.com) - Bisher gibt es noch keine Begrenzungen bei der Erstellung.
Titel: Re: Was KI alles kann
Beitrag von: AmigaMaster am 09. Februar 2025, 22:48:36
Riffusion kämpft noch mit Aussetzern in der Musik und Halluzination der KI. Aber der Gesang gefällt mir echt gut.

Beispiel für einen Aussetzer bei 02:03 und ab ab 02:50 Ende meint die KI, sie muss sich nicht mehr an den Text halten und erfindet einen wirren Abschnitt mit Phantasieworten, bevor sie sich am Ende wieder einfängt und es korrekt umsetzt:
https://www.dropbox.com/scl/fi/6hko3hh3lafulg2sygyhc/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Epic-Halluzination-Aussetzer.m4a?rlkey=gcr2xm283bk3kv6de9l9ejo3p&st=grzyw0ht&dl=0 (https://www.dropbox.com/scl/fi/6hko3hh3lafulg2sygyhc/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Epic-Halluzination-Aussetzer.m4a?rlkey=gcr2xm283bk3kv6de9l9ejo3p&st=grzyw0ht&dl=0)

Und hier rockt Razor echt mal:
https://www.dropbox.com/scl/fi/dako69sfsm7uxnqvgm10o/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Rock.m4a?rlkey=e9r6tggcahqiuht7p6iu1rimt&st=iupz9r1b&dl=0 (https://www.dropbox.com/scl/fi/dako69sfsm7uxnqvgm10o/Maniac-Mansion-In-der-Nacht-so-dunkel-und-klar-Rock.m4a?rlkey=e9r6tggcahqiuht7p6iu1rimt&st=iupz9r1b&dl=0)


Und noch etwas:
Im Adventure-Treff Forum hat Laserschwert einen Auszug aus einer deutschen Synchro für Indiana Jones and the Fate of Atlantis gepostet. Auch mittels KI generiert. Klingt ganz OK aber die rechtliche Situation ist natürlich eine Herausforderung.
https://www.adventure-treff.de/forum/topic/26248 (https://www.adventure-treff.de/forum/topic/26248)