Das Hauptmerkmal, das „DeepSeek“ von anderen Chatbots wie „ChatGPT“ unterscheidet, ist die Art und Weise, wie es die Antwort verarbeitet und die Gründe für seine Berechnungen erklärt, wenn es auf Benutzeranfragen reagiert.
Das chinesische KI-Startup DeepSeek hat Silicon Valley schockiert und die Technologieaktien in die roten Zahlen getrieben, indem es ein KI-Modell vorstellte, das mit den besten Chatbots von heute konkurrieren kann, aber zu „minimalen“ Kosten gebaut wird.
Was ist passiert?
DeepSeek, das es seit etwas mehr als einem Jahr gibt, stellte letzte Woche sein neues Modell „R1“ vor, weckte damit bei Anlegern in der US-amerikanischen künstlichen Intelligenzbranche Besorgnis und löste einen starken Ausverkauf bei Technologieaktien aus.
Der Aktienkurs des Branchenführers Nvidia fiel am Montag um 17 Prozent, der größte Rückgang seit März 2020, wodurch seine Bewertung um 589 Milliarden Dollar sank. Ein derart dramatischer Rückgang des Börsenwertes an einem einzigen Tag ist nicht nur in der Geschichte des Unternehmens, sondern auch am gesamten US-Aktienmarkt beispiellos.
Nvidia ist in den wichtigen Indizes stark gewichtet, sodass der Rückgang den gesamten Markt erschütterte. Der Nasdaq 100 Index fiel um drei Prozent, der stärkste Rückgang seit sechs Wochen, und vernichtete fast eine Billion Dollar an Marktwert.
Darüber hinaus erlitten Milliardäre, die ihr Vermögen mit Unternehmen im KI-Bereich gemacht hatten, erhebliche Verluste. Dem Bloomberg Billionaires Index zufolge verlor das Gesamtvermögen der reichsten Menschen im Technologiesektor 108 Milliarden Dollar. Beispielsweise sank das Nettovermögen des Nvidia-Gründers Jensen Huang um 20,1 Milliarden Dollar oder 20 Prozent, während Oracle-Gründer Larry Ellison 22,6 Milliarden Dollar verlor.
Was ist „DeepSeek“?
Lian Wenfeng, der CEO des auf KI spezialisierten Hedgefonds High-Flyer, gründete DeepSeek im Jahr 2023. Das Unternehmen entwickelt seine KI-Modelle „Open Source“, das heißt, Entwickler können den Programmcode überprüfen und verbessern. Seit ihrer Einführung Anfang Januar gehört die mobile Anwendung auch zu den Top-Downloads im AppStore.
Die Art und Weise, wie DeepSeek seine Antworten auf Benutzeranfragen verarbeitet und die Gründe dafür erklärt, ist ein Hauptmerkmal, das es von anderen Chatbots wie ChatGPT unterscheidet, und das Unternehmen sagt, dass das neue R1-Modell den neuesten Modellen von OpenAI ebenbürtig sei.
Wie kann man mit Modellen von OpenAI und Meta konkurrieren?
Obwohl das Unternehmen keine konkreten Zahlen nannte, ist klar, dass die Kosten für das Training und die Entwicklung von DeepSeek-Modellen erheblich niedriger sind als die Kosten für die branchenführenden Produkte von OpenAI und Meta. Wenn die Effizienz der Modellentwicklung auf dieses Niveau gesteigert werden kann, stellt sich die Frage, ob es sich lohnt, Milliarden von Dollar für die neuesten leistungsstarken KI-Chips von Unternehmen wie Nvidia auszugeben.
DeepSeek betont, dass das R1-Modell bei Benchmarks wie dem AIME 2024-Mathematik-Rechentest, dem MMLU-Allgemeinwissenstest und dem AlpacaEval 2.0-Frage-und-Antwort-Test gleich gut oder besser abschneidet als Konkurrenzmodelle.
Wie kann dies eine Warnung für die Vereinigten Staaten sein?
Washington hat Sanktionen gegen den Export von Hochtechnologie, darunter GPU-Halbleitern, nach China verhängt, um Chinas Fortschritte im Bereich der künstlichen Intelligenz, einer Schlüsselfront im Technologiewettbewerb zwischen den USA und China, einzuschränken. Der Erfolg von DeepSeek zeigt jedoch, dass es chinesischen KI-Ingenieuren gelungen ist, mit begrenzten Ressourcen eine hohe Produktivität zu erreichen und die US-Sanktionen zu umgehen. Da der Einsatz eines neuartigen Chips nicht möglich sei, habe die Suche nach einer günstigeren und alternativen Methode zum Trainieren des DeepSeek-Modells die Voraussetzung für noch größere Innovationen geschaffen.