Das neue GPT-4o von OpenAI ist jetzt für die Verwendung in der KI-Automatisierungssoftware Fozzels verfügbar!
GPT-4o (o steht für „Omni“) ist das neue Flaggschiffmodell von OpenAI, das Audio, Bilder und Text in Echtzeit verarbeiten kann.
Wir empfehlen allen Fozzels-Benutzern, in ihren „Flows“ auf dieses neue LLM (Large Language Model) umzusteigen.
GPT-4o vs. GPT-4: Welches Modell ist besser?
Sehen Sie, wie GPT-4o von OpenAI GPT-4 im Vergleich zu verschiedenen Benchmarks übertrifft und erfahren Sie alles über die neuen Funktionen von GPT-4o.
OpenAI, das maßgeblich zur Entwicklung von KI-Chatbots und großen Sprachmodellen beigetragen hat, hat am 13. Mai 2024 sein fortschrittlichstes und neuestes Modell, das GPT-4o, angekündigt. Das GPT-4o-Modell bietet eine höhere Leistung und Geschwindigkeit als seine Vorgänger und eine größere Vielfalt an Anwendungsfällen. Das GPT-4o-Modell bietet eine viel schnellere Reaktion, indem es das Geschwindigkeitsproblem löst, das der Hauptnachteil seiner Vorgänger war.
Kurz zusammengefasst
- Der GPT-4o-Modell wurde angekündigt von OpenAI am 13. Mai 2024 und ist eine „multimodale“ KI.
- Mit GPT-4o können Sie Text-, Bild- und Audioeingaben schnell verarbeiten und Inhalte generieren.
- Das Modell GPT-4o ist schneller und günstiger als sein Vorgänger, das Modell GPT-4.
- Das GPT-4o-Modell übertraf das GPT-4-Modell in Benchmarks wie MMLU und HumanEval.
- Im Gegensatz zum Standardmodell GPT-4 verfügt das Modell GPT-4o nun über Sehfähigkeiten, d. h. Bilder können gelesen werden.
- Das GPT-4o-Modell wird bis Oktober 2023 mit Online-Daten trainiert und hat im Gegensatz zu GPT-4 keinen Webzugriff.
Was ist GPT-4o?
Das GPT-4o-Modell ist das neueste und fortschrittlichste KI-Modell von OpenAI, das auf dem GPT-4 Turbo-Modell aufbaut und am 13. Mai 2024 angekündigt wurde. Das GPT-4o-Modell bietet auch eine bessere Leistung in Bereichen wie Ausgabegeschwindigkeit, Reaktionsqualität und unterstützte Sprachen, die seinem Vorgänger fehlten. Das GPT-4o-Modell kann qualitativ bessere, grammatikalisch korrekte und prägnante Ausgaben nicht nur auf Englisch, sondern auch in anderen Sprachen generieren.
Was ist neu in GPT-4o?
Der Hauptunterschied zwischen dem GPT-4o-Modell und seinen Vorgängern besteht darin, dass es zur Verarbeitung unterschiedlicher Arten von Eingabedaten ein einziges neuronales Netzwerk anstelle separater neuronaler Netzwerke verwendet. Auf diese Weise kann das GPT-4o-Modell im Gegensatz zu seinen Vorgängern Hintergrundgeräusche, mehrere Sprecher und emotionale Töne in den Eingaben erkennen und sie dem Ausgabegenerierungsprozess hinzufügen.
GPT-4o-Preise (API)
Sie müssen keine Gebühren zahlen, um auf das GPT-4o-Modell zuzugreifen und es zu erleben. ChatGPT bietet das GPT-4o-Modell standardmäßig mit eingeschränkter Erstellung an. Wenn Sie das GPT-4o-Modell jedoch fünfmal häufiger verwenden möchten, müssen Sie das Plus-Abonnement erwerben, für das Sie $20 pro Monat zahlen müssen. Fozzels-Benutzer verwenden die OpenAI-API, was bedeutet, dass kein zusätzliches Abonnement erforderlich ist. Die Verwendung von GPT-4o über die API kostet weniger als GPT-4.
Vergleich von OpenAI GPT-4 und GPT-4o
Das GPT-4o-Modell von OpenAI wurde mit spannenden Funktionen angekündigt und konnte seinen Vorgänger GPT-4 in den meisten Benchmarks übertreffen. Lassen Sie uns die Modelle GPT-4 und GPT-4o vergleichen und ihre Ähnlichkeiten und Unterschiede entdecken.
Leistung
Laut dem GPT-4o-Artikel von OpenAI unterstützt das GPT-4o-Modell sowohl GPT-4- als auch GPT-4T-Modelle mit MMLU (88,7%), GPQA (53,6%), MATH (76,6%), HumanEval (90,2%), MGSM (90,5%) und konnte seine Benchmarks übertreffen. Beispielsweise hat das GPT-4o-Modell im GPQA-Benchmark einen Wert von 53,6%, während sein Vorgänger, das GPT-4-Modell, einen Wert von 35,7% hat.
GPT-4 im Vergleich zu GPT-4o
Darüber hinaus übertraf das GPT-4o-Modell seinen Vorgänger, das GPT-4-Modell, mit einem Ergebnis von 83,41 TP3T im DROP-Benchmark, blieb jedoch mit einem Ergebnis von 86,01 TP3T hinter dem GPT-4 Turbo-Modell zurück. Mit anderen Worten: Das GPT-4T-Modell übertrifft GPT-4o bei fortgeschrittenen Codierungs- und Argumentationsaufgaben.
Mehrsprachige Aufgaben
Ein weiterer Bereich, in dem das GPT-4o-Modell seinen Vorgänger, das GPT-4, übertrifft und dessen Mängel ausgleicht, ist Mehrsprachige Aufgaben. Das GPT-4o-Modell wurde von OpenAI trainiert, um bei nicht-englischen Aufgaben eine bessere Leistung und präzisere Ergebnisse zu erzielen. Das GPT-4o-Modell bietet sowohl bei mehrsprachigen als auch visuellen Aufgaben bessere Ergebnisse, insbesondere bei Afrikaans, Chinesisch, Italienisch, Javanisch und Portugiesisch. Mit anderen Worten: Das GPT-4o-Modell kann nicht-englische Sprachen sowohl in Textform als auch in visueller Form mit besserer Leistung verarbeiten als GPT-4.
Bildverarbeitungsfunktionen
Da das GPT-4-Modell keine visuellen Fähigkeiten besitzt, ist das GPT-4o-Modell für visuelle Aufgaben die bessere Wahl als GPT-4. Allerdings schneidet GPT-4o bei der visuellen Wahrnehmung, Verarbeitung und Analyse besser ab als GPT-4T, OpenAIs großes Sprachmodell mit visuellen Fähigkeiten. Darüber hinaus kann das GPT-4o-Modell visuelle Eingaben verarbeiten und zugehörige Ausgaben viel schneller generieren als das GPT-4 Turbo-Modell.
Ausgangsdrehzahl und Drehzahlbegrenzungen
Das Hauptproblem des GPT-4-Modells ist seine geringere Ausgabegeschwindigkeit im Vergleich zu den Modellen Claude 3 Opus und Gemini Ultra. Das GPT-4o-Modell konnte sowohl die Konkurrenzmodelle als auch das GPT-4-Modell übertreffen, indem es in 12 Sekunden eine 488-Wörter-Antwort generierte. Das GPT-4-Modell benötigt etwa 1 Minute und 10 Sekunden, um eine 488-Wörter-Antwort zu generieren. Darüber hinaus benötigt das GPT-4 Turbo-Modell, das sich durch seine hohe Geschwindigkeit auszeichnet, 24 Sekunden, um eine Ausgabe von 488 Wörtern zu generieren.
Nicht nur bei der Textausgabe, sondern auch bei der Sprachausgabe setzt das GPT-4o-Modell neue Maßstäbe. Das GPT-4o-Modell liefert eine Audioausgabe in 320 Sekunden. Ein normaler Mensch macht 250 Millisekunden Pause, um auf Englisch zu antworten. Das macht das GPT-4o-Modell zu einer künstlichen Intelligenz, die schneller und flüssiger spricht als der Mensch.
Trainingsdaten und Webzugriff
Einer der wenigen Punkte, in denen das GPT-4-Modell besser ist als GPT-4o, ist der Webzugriff. Das GPT-4o-Modell verfügt derzeit über ein 128K-Kontextfenster und öffentlich zugängliche Online-Daten bis Oktober 2023. Mit anderen Worten: Das GPT-4o-Modell kann keine Ausgabe zu aktuellen Themen generieren. Das macht GPT-4o für Marketing-, SEO- und forschungsbezogene Aufgaben unbrauchbar.
Kurz gesagt ist dieses neue LLM von OpenAI eine Verbesserung gegenüber den aktuellen Modellen GPT-4 und GPT-3.5 – und wir ermutigen alle Fozzels-Benutzer, ihre Content-Generierungs-Flows auf dieses neue und verbesserte Modell umzustellen.
Wie verwende ich das neue GPT-4o in Fozzels?
Wenn Sie das neue GPT-4o-Modell in Fozzels verwenden möchten, sind dazu nur wenige Schritte erforderlich.
- Melden Sie sich bei Ihrem Fozzels-Dashboard an und öffnen Sie einen Flow.
- Klicken Sie auf die Registerkarte „AI-Konfiguration“
- Wählen Sie „GPT-4o“ aus dem Dropdown-Auswahlfeld
- Klicken Sie auf „Speichern“.
Sollten Sie Fragen haben, können Sie uns gerne per E-Mail unter support@fozzels.com kontaktieren.