Smalltalk - Chatten, Diskutieren....

  • Blacksonny

    Ich bin gerade am Testen und mich haut es da gerade irgendwo aus den Socken.

    Zu Testzwecken wollte ich mehrere Modelle ausprobieren. Im Moment hänge ich noch an dem Modell Deepseek-R1-Distill-Llama-8B-GGUF (also einem ziemlich kleinen Modell).

    Das wäre mein erster Prompt:
    Schreibe mir bitte einen längeren deutschen Text.

    Ich bekam folgende Antwort:
    Die Berge sind immer ein besonderes Erlebnis. Sie ergeben eine Vielzahl von Landschaften, von steilen Gipfeln bis zu sanften Hügeln. In den Bergen gibt es viele Tierarten, die sich an der rauhen Natur angepasst haben, wie z.B. Schneehasen oder Murmeltiere. Außerdem sind die Berge ein idealer Ort, um ruhig zu werden und die Natur in all ihren Formen zu genießen.

    Auch die Stadtlandschaften sind einzigartig. Große Städte wie Berlin, München oder Köln bieten eine Mischung aus modernen Gebäuden und historischen Straßenzügen. In diesen Städten leben Millionen von Menschen, die jeden Tag neue Erfahrungen machen und die Kultur des Stadtlebens erleben können.

    Die Natur hat so viel zu bieten, unabhängig davon, ob man in den Bergen oder in der Stadt lebt. Sie erfüllt den Menschen mit Eindrücken und erinnert ihn daran, wie vielfältig das Leben ist.

    Was ich ebenfalls interessant finde, ist dass man sich auch die Denkprozesse der KI ansehen kann. Für diesen Prompt sah das wie folgt aus:
    Okay, the user just asked me to write a longer German text. In the previous message, they confirmed that I speak German.

    They might be looking for an example of how I can provide a detailed response in German. Maybe they're testing my language abilities or need assistance with a specific topic.

    I should respond by offering a variety of subjects so they can choose one they're interested in. That way, I cover different areas like nature, technology, food, and history to show versatility.

    I'll make sure the text is engaging and informative, keeping it natural since they mentioned using markdown but then told me to avoid it. So, I'll keep it simple without any formatting.

    Der Text weist ein paar Fehler auf. Nachfolgend hatte ich die KI auch gefragt, ob sie mir Snake in Python (mit tkinter) programmieren könnte. Leider hatte auch noch der dritte Versuch zum Start Fehler geworfen.
    Es ist allerdings wirklich interessant, die Denkprozesse der KI zu beobachten, während sie die Antwort vorbereitet.

    Jetzt teste ich DeepSeek-R1-Distill-Qwen-32B-Q4_K_M.gguf. Hier läuft es schon deutlich langsamer, da das Modell eben nicht mehr komplett in meinen VRAM passt. Bei dem 8B-Parameter-Modell hatte ich ~35 tok/sec. Hier sind es ~5 tok/sec.

    Im Vergleich mit anderen Open-Source-Modellen, die ich bisher lokal getestet hatte, finde ich das aber in jedem Fall beindruckend.

    Als Umgebung nutze ich übrigens LM Studio.


    Kleines Update:

    Ich habe jetzt ein paar Modelle getestet und bin insgesamt ziemlich beeindruckt. Allerdings wirft die KI häufig auch das ein oder andere chinesische Zeichen mit in den Text, unabhängig, ob man auf Deutsch oder Englisch mit ihr kommuniziert.

    2 Mal editiert, zuletzt von Koffein (1. Februar 2025 um 04:47)

  • Ja, spannend finde ich das auch. Was die Sprache beim Denken angeht, ist es bei mir auch schon auf Chinesisch geswitched. Das gleiche hat ChatGPT 3o high aber auch gerade gemacht (zumindest denke ich, dass es Chinesisch war).
    Ich habe mehreren Modellen gerade eine Matheaufgabe gestellt, die ich auf Reddit gefunden habe. Jedenfalls konnten die alle lösen.

    Bei DeepSeek R1 14B fand ich aber einen Absatz im Denken recht komisch:

    Wow, that's a sixth-degree polynomial. That sounds complicated because I remember from school that higher degree polynomials can be tricky to solve, especially if they don't factor nicely or have rational roots. But maybe there's a pattern here.


    Ich finde jedenfalls cool, dass wirklich jedes der Modelle frei verfügbar ist. Das volle Modell bleibt aber trotzdem in weiter Ferne. Selbst in quantisierter Form ist das eher nicht für Consumer-Hardware gedacht.

    Vom BF16-Modell möchte ich gar nicht erst anfangen:

    Einmal editiert, zuletzt von Koffein (1. Februar 2025 um 11:50)

  • Syntafin
    Grundsätzlich sind die Modelle ja in der Lage, beispielsweise Deutsch zu schreiben. Daher waren garantiert auch deutsche Texte unter den Trainingsdaten.
    Wenn du damit allerdings meinst, dass eventuell einzelne Worte oder Wissen zu einzelnen Themen nur in bestimmten Sprachen vorhanden sind und das Modell deshalb auf diese Sprache umswitched, dann verstehe, macht Sinn.


    Kleines Update zu meinen Versuchen:
    Ich habe mir vorhin nochmal ein Video auf YouTube zu dieser ganzen DeepSeek-Situation angesehen. Dort wurde dann auch von einem anderen Modell gesprochen, dass kürzlich als OpenSource veröffentlicht wurde: Qwen2.5
    Kommt ebenfalls aus China und stammt scheinbar von einer Tech-Sparte des Konzerns Alibaba.
    Ich habe Qwen2.5-Coder-14B getestet. Snake hat es schon mal hinbekommen, im Gegensatz zu Deepseek-8B.


    Auszug aus dem Gespräch:
    Prompt:
    No, i didn't mean a clone or something.
    You have to come up with an own simple game idea. You provide the code and explain the rules to me.

    Teil der Antwort:
    Game Rules:
    Matching: Click on any square to select it.
    Adjacent Squares: If you click on an adjacent square (up, down, left, right, or diagonal) of the same color, they will disappear from the board.
    Falling Squares: After a match, all remaining squares above the empty spaces fall down to fill them up.
    Score: You earn points for each match you make based on the number of squares involved in the match.

    Der Code:


    Es startet jedenfalls problemlos. Allerdings habe ich nicht die geringste Ahnung, was da passiert. Zudem kann man unendlich Punkte erzeugen, indem man einfach in leere Felder klickt.

    2 Mal editiert, zuletzt von Koffein (1. Februar 2025 um 14:41)

  • Wenn du damit allerdings meinst, dass eventuell einzelne Worte oder Wissen zu einzelnen Themen nur in bestimmten Sprachen vorhanden sind und das Modell deshalb auf diese Sprache umswitched, dann verstehe, macht Sinn.

    Korrekt, da ein LLM weder deine Eingabe versteht, noch weiß was es ausgibt passieren diese Fehler.

    A red dragon falls from the heavens... Ah, that memory has been lost. A shame. It was a favorite of mine...

  • :D welche KI bitte? Ernsthaft.... ein LLM ist keine KI. Schaut euch an wie LLMs funktionieren, bevor ihr mit Catch-Wörtern um euch werft. "Sehen wie die KI denkt" tut man übrigens auch nicht.... :rolleyes: weil ja äh... wie gesagt LLM != KI.

    Eine KI würde denken, ein LLM versteht ja nicht mal was man eingibt (und mehr als ein LLM sind GPT und Gemini nicht, andere LLMs absichtlich nicht genannt).

    A red dragon falls from the heavens... Ah, that memory has been lost. A shame. It was a favorite of mine...

  • Krass das man sehen kann wie die KI denkt. Macht es eigentlich einen Unterschied ob die KI weiblich oder männlich bzw. Unisex entwickelt wurde? Man sagt ja immer Männer Logik oder sowas aber gibt es das?

    Ich bezweilfle, dass irgendein Modell nur mit Daten gefüttert wurde, die man beispielsweise ausschließlich in die Kategorie 'männlich' packen könnte. Ich bin kein Experte auf dem Gebiet, aber soweit ich weiß, werden hier massenhaft Texte benutzt. Da dürfte dann von Artikeln, über Geschichten (Romane, Kurzgeschichten, etc) bis zu Chat-Konversationen so ziemlich alles dabei sein.

  • Für diese ganzen LLMs egal ob am Ende für Text, Bild oder Video werden entsprechend Daten aus dem Internet abgegriffen (teils auch illegal, zu 99%), in einer Datenbank gespeichert (grobe Erklärung) und mit Infos versehen zum wiederfinden (grob könnte man sagen Tags)

    Bei einer Anfrage dann wird anhand der Anfrage bestimmt welche Daten es braucht, diese zusammengesetzt und ausgegeben. Nix denken....

    A red dragon falls from the heavens... Ah, that memory has been lost. A shame. It was a favorite of mine...

  • Für diese ganzen LLMs egal ob am Ende für Text, Bild oder Video werden entsprechend Daten aus dem Internet abgegriffen (teils auch illegal, zu 99%), in einer Datenbank gespeichert (grobe Erklärung) und mit Infos versehen zum wiederfinden (grob könnte man sagen Tags)

    Bei einer Anfrage dann wird anhand der Anfrage bestimmt welche Daten es braucht, diese zusammengesetzt und ausgegeben. Nix denken....

    Ja, dazu habe ich vorhin online eine Erklärung gefunden. Danke für Klarstellung übrigens.

    Das mit dem illegal hört man ja immer wieder. Vor allem, dass auch OpenAI und Co. eher weniger von Urheberrechten halten, diese Modelle aber dann hinter Teils dicken Paywalls ($200 für's ChatGPT Pro Abo zum Beispiel) verstecken.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!