Tech-Branche in AufruhrDas musst du über die neue KI Deepseek wissen
toko
28.1.2025
Die KI-Software Deepseek hat die Tech-Branche in helle Aufregung versetzt – und Börsenkurse auf Talfahrt geschickt. Wie ist das möglich? Und wie geht es nun weiter? Antworten auf die wichtigsten Fragen.
Oliver Kohlmaier
28.01.2025, 21:51
Oliver Kohlmaier
Keine Zeit? blue News fasst für dich zusammen
Die chinesche KI-Software Deepseek sendet Schockwellen durch die Branche und hat die Börsenkurse der amerikanischen Tech-Riesen auf Talfahrt geschickt.
Das Programm kann mit den Branchenführern mithalten – und dies offenbar deutlich effizienter und damit kostengünstiger.
Die Entwickler geben die Kosten für das Training der KI mit lediglich 5,6 Millionen Dollar an.
Durch ein Embargo der US-Regierung ist es für chinesische Firmen schwierig, an leistungsfähige Grafikchips zu gelangen.
Deepseek hat möglicherweise aus der Not eine Tugend gemacht und mit schwächerer Hardware ähnliche Ergebnisse erzielt wie etwa OpenAI und Google.
Im Gegensatz zu seinen US-Konkurrenten setzt Deepseek auf das Open-Source-Modell.
Der mächtige Tech-Investor Marc Andreessen nennt es bereits eines Sputnik-Moment: Ein überraschend effizientes und leistungsstarkes chinesisches KI-Modell hat die Tech-Branche im Sturm erobert. Es heisst Deepseek und schickte am Montag die Börsenkurse der etablierten Tech-Riesen auf Talfahrt.
Zuvor wurde die App in kurzer Zeit zur am meisten heruntergeladenen Anwendung im US-App-Store von Apple. Ist Deepseek wirklich soviel günstiger als die Programme von OpenAI und Google? Und wie geht es jetzt weiter? Die Antworten auf die wichtigsten Fragen:
Wer steckt hinter Deepseek?
Die Firma Deepseek sitzt in Hangzhou im Osten Chinas, wegen der Ansiedlung vieler Tech-Firmen auch «Chinesisches Silicon Valley» genannt. In China macht Deepseek schon länger Furore, das Unternehmen wurde dort im vergangenen Jahr «Pinduoduo der KI» genannt. Pinduoduo hat mit seiner gleichnamigen App – ausserhalb Chinas: Temu – den Onlinehandel umgekrempelt.
Schöpfer von Deepseek ist Liang Wenfeng, ausgebildet an der Universität von Hangzhou. Schon 2015 gründete er die Investmentfirma High-Flyer – sie analysiert mithilfe von KI Aktienmarktentwicklungen und ist mittlerweile eine der grössten in China. Liang begann Medienberichten zufolge 2021 damit, mit leistungsstarken Mikrochips der US-Firma Nvidia den Chatbot Deepseek zu entwickeln. Deepseek gründete er 2023. Am 20. Januar brachte die Firma ihren neuesten Chatbot R1 heraus, der nun die Tech-Branche weltweit in helle Aufregung versetzt.
Warum ist Deepseek jetzt in aller Munde?
Zunächst einmal macht die KI von Deepseek das, was ChatGPT und Co. auch tun: Sie wertet massenweise Daten aus und kann Fragen beantworten, Songtexte schreiben oder Rezepte erfinden.
Deepseek kommuniziert in mehreren Sprachen, ist nach eigener Auskunft aber am besten in Chinesisch und Englisch. Experten bescheinigen der App, genauso gut, wenn nicht sogar besser zu sein als die Modelle der US-Firmen. Anders als die US-Konkurrenz ist Deepseek dabei quelloffen: Jede und jeder kann auf den Code der Anwendung zugreifen, um zu sehen, wie sie funktioniert, und kann sie selbst verändern.
Deepseeks Modell hat in Tests, darunter Mathematik- und Programmieraufgaben, sowie bei der Fehlererkennung in Codes, Spitzenwerte erzielt und damit selbst führende Modelle wie GPT-4, Metas Llama und Anthropic’s Claude übertroffen.
Auch die Konkurrenz ist voll des Lobes. So nannte der Chef des KI-Pioniers OpenAI, Sam Altman, die Deepseek-App im Onlinedienst X ein «beeindruckendes Modell».
Warum stürzten die Börsenkurse der Tech-Riesen ab?
In der Tat schickte die Veröffentlichung von Deepseek R1 die Börsenkurse der US-amerikanischen Tech-Riesen auf Talfahrt. Die Anleger sind besorgt, das Deepseek mit den führenden KI-Modellen mithalten und sie sogar übertreffen kann, und das viel günstiger.
Panische Anleger hatten den Börsenwert des Chip-Konzerns Nvidia am Montag um fast 600 Milliarden Dollar einbrechen lassen, das entspricht einem Minus von rund 17 Prozent. Am Dienstag konnte der KI-Chipspezialist mit einem vorbörslichen Plus von rund drei Prozent zumindest den Negativ-Trend wieder umkehren.
Auslöser des Börsenschocks am Montag war die Erkenntnis, dass Software mit Künstlicher Intelligenz möglicherweise mit viel weniger Rechenleistung trainiert werden kann als man bisher dachte. Denn das chinesische Start-up DeepSeek will sein neues KI-Modell mit Kosten von weniger als sechs Millionen Dollar und auf wenigen abgespeckten Nvidia-Chipsystemen angelernt haben.
Ob das alles exakt so stimmt, weiss man nicht. So wurde in der Branche schon vor Wochen spekuliert, DeepSeek habe möglicherweise Zugriff auf mehr Nvidia-Chips als es angesichts der US-Ausfuhrbeschränkungen zugibt. Doch Investoren, die Nvidias Aktie in Erwartung eines zukünftigen Mega-Geschäfts in den vergangenen Monaten immer höher trieben, bekamen am Montag kalte Füsse. US-Präsident Donald Trump sprach von einem Weckruf für amerikanische Unternehmen – und fand es zugleich «positiv», dass KI günstiger zu haben sein könne.
Die Entwickler von Deepseek R1 sprechen in einem Papier von nur 5,6 Million US-Dollar Kosten für das Training des Sprachmodells. Diese Summe geistert nun durch die Branche, schliesslich haben die Konkurrenten aus den USA teils hohe dreistellige Beträge für das Training ihrer KI-Modelle aufgeboten.
Doch die Autoren selbst betonen in ihrem Papier, dass es sich bei der Summe nur um die letzte Phase des Trainings gehandelt habe. Die Kosten etwa für Forschung und Entwicklung sind also nicht enthalten.
Doch nicht nur das Training von Deepseek, sondern vor allem dessen Betrieb soll erheblich günstiger sein als bei der Konkurrenz. So verwendet die Software etwa das Konzept der mixture-of-Experts. Das bedeutet, die KI wird in verschiedene «Experten» aufgeteilt, die für unterschiedliche Themen zuständig sind. Dies mache den Betrieb erheblich günstiger.
Ausserdem verwendet Deepseek das Prinzip der Destillation, bei dem bestehende Modelle genutzt werden, um gezielt zu trainieren. Dies ermöglichte es Deepseek, mit begrenzten Ressourcen eine ähnliche Leistungsfähigkeit wie jene der grossen westlichen KI-Modelle zu erreichen.
Nun heisst es, die USA selbst hätten mit ihrem Embargo leistungsfähiger Grafikchips dafür gesorgt, dass sich die chinesische Firma anpassen musste, frei nach dem Motto: «Not macht erfinderisch».
So sagte Deepseek-Gründer Liang im vergangenen Jahr der chinesischen Investment-Nachrichtenseite Waves, Geld sei bei der Entwicklung des Chatbots nicht das Problem gewesen, sondern die 2022 verhängten US-Sanktionen, die den Export von Hochleistungschips nach China stark einschränkten.
Überprüfen lassen sich die Angaben von Deepseek nicht. Fakt ist aber: Durch kleinere Anpassungen ist es Deepseek gelungen, erhebliche Effizienzgewinne zu erzielen. Branchenanalyst Stacy Rasgon ist sich aber sicher: «Sie haben das Modell nicht für fünf Millionen Dollar trainiert, das ist nicht passiert.»
Und bereits vergangene Woche sagte der Chef der KI-Firma Scale AI, Alexander Wang, nach seinen Informationen habe DeepSeek Zugriff auf 50'000 H100-Chipsysteme von Nvidia, könne aber wegen US-Ausfuhrbeschränkungen nicht darüber sprechen.
Unterliegt die App der chinesischen Zensur?
Eindeutig ja: Die KI ist bei heiklen politischen Fragen ganz auf Linie der chinesischen Regierung. Auf die Frage nach dem 4. Juni 1989, der Niederschlagung der Demokratie-Proteste auf dem Tiananmen-Platz, antwortet Deepseek, es könne diese Frage nicht beantworten: «Ich bin programmiert, um hilfreiche und harmlose Antworten zu geben». «Sensible, kontroverse und möglicherweise schädliche Themen» müsse das System vermeiden.
Wie zahlreiche User auf Social Media jedoch umgehend belegten, hat Deepseek indessen kein Problem damit, umfassend über sensible Themen aus dem Ausland Auskunft zu geben.
Auf die Frage nach Menschenrechtsverletzungen in der Uigurenprovinz Xinjiang gibt Deepseek an, die Antwort sei «jenseits meines Aufgabenbereichs». Die chinesische Führung sei «massgeblich am schnellen Aufstieg Chinas» und an der Verbesserung des Lebensstandards seiner Bürger beteiligt. Der Chatbot sagt, er sei «programmiert, um Informationen und Antworten zu geben, die mit der offiziellen Haltung der chinesischen Regierung übereinstimmen».
blue News fragt bei Experten nach // Trauen Sie künstlicher Intelligenz?
Alle reden von KI und alle nutzen sie auch. Doch wie denkt die Wirtschafts-Elite darüber, wenn es darum geht, dass Künstliche Intelligenz auch negative Folgen haben kann? blue News geht dieser Frage auf dem Grund.
28.10.2024
Wie geht es jetzt weiter?
Amerikanische Firmen übertrafen sich zuletzt mit Ankündigungen, wie viel Geld sie in KI-Infrastruktur stecken wollen. Allein der ChatGPT-Erfinder OpenAI und mehrere Partner versprachen, in den kommenden Jahren 500 Milliarden Dollar in Rechenzentren zu investieren. Beim Facebook-Konzern Meta stellte Gründer Mark Zuckerberg 60 Milliarden Dollar nur in diesem Jahr in Aussicht. Aber nun scheint DeepSeek zu zeigen, dass man mit deutlich weniger Rechenpower auskommen kann.
US-Experten wollen es jedoch lieber andersherum sehen. Die Frage sei nicht, ob DeepSeek heutige Marktführer in den USA überholen könne, betonte etwa X. Eyeé von der KI-Beratungsfirma Malo Santo.
Es gehe viel mehr darum, wie schnell man die Forschungsansätze der Chinesen umsetzen könne. «Wenn DeepSeek das mit alter Hardware entwickeln kann, was können wir dann mit neuerer Hardware schaffen?», fragte sie im US-Sender CNBC.