Erfolgreich aufgeholtGoogle will mit neuem KI-Modell endlich ChatGPT die Stirn bieten
dpa/dj
7.12.2023 - 21:17
In der dynamischen KI-Branche dominiert das Start-up OpenAI mit Textroboter ChatGPT. Google setzt nun aber mit einem mit Spannung erwarteten neuen KI-Sprachmodell zum Konter an. Eine Light-Variante davon wird sogar auf einem Smartphone laufen.
dpa/dj
07.12.2023, 21:17
dpa/dj
Keine Zeit? blue News fasst für dich zusammen
Google hat seine neuste künstliche Intelligenz Gemini vorgestellt.
Damit will der Tech-Gigant endlich die Konkurrenz aufholen, die ihm bislang deutlich überlegen war.
Gemini soll vor allem glänzen, wenn es Bilder und Videos verarbeitet.
Im Wettlauf bei künstlicher Intelligenz will sich Google mit dem neuen Sprachmodell Gemini an die Spitze setzen. Das KI-System soll nicht nur mit dem Sprachmodell GPT4 des Konkurrenten OpenAI mithalten, sondern es auch übertreffen.
Google-Chef Sundar Pichai sagte am Mittwoch zur Ankündigung von Gemini, dass der Wandel, den man gerade mit der KI erlebe, der «tiefgreifendste in unserem Leben sein wird, weitaus grösser als die Umstellung auf das Mobiltelefon oder auf das Internet davor».
Gemini kann auch Bilder und Videos erfassen
Gemini kann nicht nur in einem Chatbot Texte generieren, sondern auch bestimmte Probleme lösen und situationsabhängige Entscheidungen treffen. Es kann auch Informationen aus Fotos und Videos aufnehmen. Google demonstrierte das System mit einem Videochat, bei dem Gemini Zeichnungen und Handgesten des menschlichen Gegenübers sofort erkannte und richtig einordnete.
«Wir bringen Gemini über die Google-Produkte zu Milliarden von Menschen», kündigte der Chef von Google DeepMind, Demis Hassabis, an. Die Google-Tochter war im April 2023 aus dem 2014 zugekauften britischen Start-up DeepMind und der Google-internen KI-Abteilung hervorgegangen. Mit der Integration des bis zu diesem Zeitpunkt weitgehend unabhängig agierenden Start-ups wollte Pichai die KI-Anstrengungen im Google-Konzern bündeln, um entschiedener gegen OpenAI antreten zu können.
Google wird das neue System in drei unterschiedlichen Dimensionen einführen: Gemini Ultra, Gemini Pro und Gemini Nano. Gemini Ultra ist das grösste und leistungsfähigste Modell für hochkomplexe Aufgaben. Diese Variante richtet sich vor allem an Unternehmenskunden.
Gemini Pro wird sich an ein breites Publikum wenden und beispielsweise dem Chatbot Google Bard «fortgeschrittenes Denken, Planen, Verstehen und mehr» beibringen. «Dies ist das grösste Upgrade für Bard seit seiner Einführung», sagte Hassabis. Bard werde von sofort an in mehr als 170 Ländern und Gebieten auf Englisch verfügbar sein. Google plane aber, in naher Zukunft neue Sprachen und Standorte zu unterstützen.
Wie sexy meine KI-Freundin ist und wie schnell ich trotzdem Schluss machte
Eine Freundin kann man sich neuerdings auch ganz einfach digital zulegen. Doch für wen eignet sich die KI-Freundin und was sind die Tücken?
30.11.2023
Auch KI-Modell für Smartphones
Die dritte Gemini-Variante Nano bringt das System auf das Topmodell der Google-Smartphones Pixel. «Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft», kündigte Hassabis an. Damit lässt sich beispielsweise mit der Recorder App nicht nur gesprochene Sprache aus einem längeren Meeting, einer Vorlesung oder einem Interview aufzeichnen und in Echtzeit in schriftliche Sprache umwandeln.
Mithilfe von Gemini Nano kann das Pixel dann ausserdem ohne Zeitverzögerung eine kompakte Zusammenfassung erstellen. In den kommenden Monaten wird Gemini in weiteren Google-Produkten und Diensten wie Suche, Werbeanzeigen oder dem Chrome-Browser verfügbar sein.
Konkurrent OpenAI war bisher vorne
Google arbeitet schon seit Jahren an Anwendungen auf Basis künstlicher Intelligenz, steht aktuell aber unter Zugzwang, mehr davon preiszugeben. Vor einem Jahr löste das Start-up OpenAI einen neuen Wettstreit bei künstlicher Intelligenz aus, als es seinen Chatbot ChatGPT öffentlich machte.
Die Software sorgte für viel Aufsehen, weil sie Sätze wie ein Mensch bilden kann. Sie wird mit gewaltigen Datenmengen trainiert und schätzt Wort für Wort ab, wie ein Satz weitergehen könnte. Das bringt das Risiko mit sich, dass sie völlig falsche Informationen ausgeben kann.