{"id":7430,"date":"2025-01-28T13:40:25","date_gmt":"2025-01-28T12:40:25","guid":{"rendered":"https:\/\/www.heibel-unplugged.de\/?p=7430"},"modified":"2025-06-26T13:48:24","modified_gmt":"2025-06-26T11:48:24","slug":"deepseek-r1-gruender-liang-wenfeng-im-interview-im-sommer-2024","status":"publish","type":"post","link":"https:\/\/www.heibel-ticker.de\/blog\/deepseek-r1-gruender-liang-wenfeng-im-interview-im-sommer-2024\/","title":{"rendered":"DeepSeek-R1 Gr\u00fcnder Liang\u00a0Wenfeng im Interview im Sommer 2024"},"content":{"rendered":"\n<p><strong>Interview mit dem Gr\u00fcnder von Deepseek: Wir folgen nicht mehr \u2013 jetzt f\u00fchren wir<\/strong><\/p>\n\n\n\n<p>DeepSeek-R1 ersch\u00fcttert Silicon Valley. Gr\u00fcnder Liang Wenfeng: \u201eWir folgen nicht mehr. Jetzt f\u00fchren wir.\u201c<\/p>\n\n\n\n<p>27. Januar 2025<\/p>\n\n\n\n<p>Aus dem Englischen \u00fcbersetzt von\u00a0<a href=\"https:\/\/thechinaacademy.org\/interview-with-deepseek-founder-were-done-following-its-time-to-lead\/#\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">https:\/\/thechinaacademy.org\/interview-with-deepseek-founder-were-done-following-its-time-to-lead\/#<\/a>\u00a0durch ChatGPT\u00a0&#8211; daher beachten Sie bitte, dass die \u00dcbersetzung teilweise nicht w\u00f6rtlich ist.<\/p>\n\n\n\n<p><strong>Anmerkung der Redaktion von The China Academy:<\/strong><\/p>\n\n\n\n<p>Silicon Valley ger\u00e4t ins Wanken. Eine tektonische Verschiebung in der Dominanz der K\u00fcnstlichen Intelligenz (KI) ist im Gange, und alle Augen richten sich auf China. Im Januar 2025 sorgte DeepSeek-R1 \u2013 ein Open-Source-Inferenzmodell des chinesischen KI-Unternehmens DeepSeek \u2013 weltweit f\u00fcr Aufsehen. Es erreichte die Leistungsf\u00e4higkeit von OpenAI auf Top-Niveau, bei einem API-Preis von nur 1\/30 und mit voller Offenheit.<\/p>\n\n\n\n<p>Mit nur 6 Millionen Dollar entwickelte China eines der weltweit besten KI-Modelle und lie\u00df damit die Milliarden-Investitionen von Meta, Google und Microsoft verblassen. Bereits jetzt str\u00f6men Nutzer weltweit \u2013 vor allem Einzelpersonen und kleine bis mittelst\u00e4ndische Unternehmen (KMU) \u2013 zu DeepSeek-R1 und nutzen es als Basis f\u00fcr ihre Anwendungen.<\/p>\n\n\n\n<p>Diese ostgef\u00fchrte Revolution zwingt zu einem globalen Umdenken: Was, wenn die Zukunft der KI nicht in Silicon Valley geschmiedet wird?<\/p>\n\n\n\n<p>Im Folgenden ein \u00fcbersetztes Interview aus dem Juli 2024 mit dem DeepSeek-Gr\u00fcnder Liang Wenfeng, das kurz nach dem Erfolg des Open-Source-Modells V2 gef\u00fchrt wurde. Dieses seltene Gespr\u00e4ch zeigt, wie ein chinesisches Startup die Giganten \u00fcberholte und die Regeln der Innovation neu definierte.<\/p>\n\n\n\n<p>Dieser Unternehmer der Nach-85er-Generation trat als Gr\u00fcnder des KI-Startups DeepSeek in Xinwen Lianbo (CCTV News) auf, nahm an einem hochrangigen nationalen Symposium teil und hielt eine Rede.<\/p>\n\n\n\n<p><strong>Wie wurde der erste Schuss im Preiskrieg abgefeuert?<\/strong><\/p>\n\n\n\n<p><strong>An Yong (Interviewer):<\/strong>&nbsp;Nach der Ver\u00f6ffentlichung des DeepSeek-V2-Modells l\u00f6sten Sie schnell einen heftigen Preiskrieg in der Branche f\u00fcr gro\u00dfe Modelle aus. Manche bezeichnen Sie als Marktst\u00f6rer.<\/p>\n\n\n\n<p><strong>Liang Wenfeng (Gr\u00fcnder von DeepSeek):<\/strong>&nbsp;Es war nie unsere Absicht, ein St\u00f6rer zu sein; das geschah eher zuf\u00e4llig.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Waren Sie von diesem Ergebnis \u00fcberrascht?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Sehr \u00fcberrascht. Wir h\u00e4tten nicht gedacht, dass Preise ein so sensibles Thema sind. Wir sind einfach unserem eigenen Tempo gefolgt, haben die Kosten berechnet und die Preise entsprechend festgelegt. Unser Prinzip ist, weder Verluste zu machen noch \u00fcberm\u00e4\u00dfige Gewinne anzustreben. Der aktuelle Preis erlaubt uns eine bescheidene Gewinnmarge \u00fcber unseren Kosten.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;F\u00fcnf Tage sp\u00e4ter folgte Zhipu AI, und kurz darauf schlossen sich ByteDance, Alibaba, Baidu und Tencent an.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Zhipu AI senkte die Preise f\u00fcr ein Einstiegsprodukt, w\u00e4hrend ihre Flaggschiff-Modelle teuer blieben. ByteDance war das erste Unternehmen, das tats\u00e4chlich unseren Preis f\u00fcr ein Flaggschiff-Modell erreichte, was dann Druck auf andere aus\u00fcbte. Da gro\u00dfe Unternehmen viel h\u00f6here Modellkosten haben als wir, h\u00e4tten wir nie gedacht, dass jemand Verluste in Kauf nimmt. Es endete damit, dass die Logik der Internet-\u00c4ra mit Subventionen \u00fcbernommen wurde.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Von au\u00dfen betrachtet scheinen Preissenkungen eine Taktik zu sein, um Nutzer zu gewinnen \u2013 typisch f\u00fcr den Wettbewerb in der Internet-\u00c4ra.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Nutzer zu gewinnen war nicht unser Hauptziel. Wir haben die Preise gesenkt, weil unsere Kosten bei der Erforschung neuer Modellstrukturen gesunken sind und wir daran glauben, dass sowohl KI- als auch API-Dienste erschwinglich und zug\u00e4nglich sein sollten.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Vor dieser Entwicklung haben die meisten chinesischen Unternehmen einfach die Llama-Modellstruktur kopiert, um Anwendungen zu entwickeln. Warum haben Sie sich entschieden, sich auf die Modellstruktur zu konzentrieren?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wenn das Ziel darin besteht, Anwendungen zu entwickeln, ist es sinnvoll, die Llama-Struktur zu \u00fcbernehmen, um schnell ein Produkt auf den Markt zu bringen. Unser Ziel ist jedoch AGI (Artificial General Intelligence), und daf\u00fcr m\u00fcssen wir neue Modellstrukturen erforschen, um innerhalb begrenzter Ressourcen \u00fcberlegene F\u00e4higkeiten zu erreichen. Das ist Grundlagenforschung f\u00fcr zuk\u00fcnftiges Wachstum. Neben der Architektur haben wir auch Datenaufbereitung und menschliches Denken untersucht \u2013 all das spiegelt sich in unseren Modellen wider. Zudem hinkt die Trainingseffizienz und die Kostenstruktur von Llama etwa zwei Generationen hinter den modernsten globalen Standards hinterher.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Woher kommt diese L\u00fccke von zwei Generationen?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Erstens gibt es eine L\u00fccke in der Trainingseffizienz. Wir sch\u00e4tzen, dass die besten Modelle Chinas wahrscheinlich die doppelte Rechenleistung ben\u00f6tigen, um mit den global f\u00fchrenden Modellen mitzuhalten, aufgrund von strukturellen und trainingsdynamischen Unterschieden. Die Dateneffizienz ist ebenfalls nur halb so effektiv, das hei\u00dft, wir ben\u00f6tigen doppelt so viele Daten und Rechenressourcen, um die gleichen Ergebnisse zu erzielen. Zusammengenommen entspricht das dem Vierfachen der Ressourcen. Unser Ziel ist es, diese L\u00fccken kontinuierlich zu verkleinern.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Die meisten chinesischen Unternehmen verfolgen sowohl Modelle als auch Anwendungen. Warum konzentriert sich DeepSeek ausschlie\u00dflich auf Forschung?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Weil wir glauben, dass es derzeit das Wichtigste ist, an globaler Innovation teilzunehmen. Seit Jahren sind chinesische Unternehmen daran gew\u00f6hnt, technologische Innovationen, die anderswo entwickelt wurden, zu nutzen und durch Anwendungen zu monetarisieren. Aber das ist nicht nachhaltig. Dieses Mal geht es uns nicht um schnelle Gewinne, sondern darum, die technologische Grenze zu verschieben und das Wachstum des \u00d6kosystems voranzutreiben.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Die vorherrschende Meinung aus der Internet- und Mobile-Internet-\u00c4ra lautet, dass die USA bei Innovationen f\u00fchren, w\u00e4hrend China bei Anwendungen gl\u00e4nzt.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wir glauben, dass China mit der wirtschaftlichen Entwicklung allm\u00e4hlich von einem Nutznie\u00dfer zu einem Beitragsleister werden muss, anstatt weiterhin von den Errungenschaften anderer zu profitieren. In den letzten 30 Jahren der IT-Revolution haben wir kaum an der Kerntechnologie-Innovation teilgenommen.<\/p>\n\n\n\n<p>Wir haben uns daran gew\u00f6hnt, dass das Mooresche Gesetz \u201evom Himmel f\u00e4llt\u201c \u2013 wir warten 18 Monate auf bessere Hardware und Software. Dasselbe gilt f\u00fcr das Skalierungsgesetz. Diese Fortschritte sind jedoch das Ergebnis generations\u00fcbergreifender Bem\u00fchungen westlich gef\u00fchrter Technologie-Communities. Da wir nicht aktiv an diesem Prozess teilgenommen haben, haben wir dessen Bedeutung \u00fcbersehen.<\/p>\n\n\n\n<p><strong>Die eigentliche L\u00fccke liegt in der Originalit\u00e4t, nicht nur in der Zeit<\/strong><\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Warum hat DeepSeek V2 in Silicon Valley so viele \u00fcberrascht?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;In den t\u00e4glichen Innovationen der USA ist das recht gew\u00f6hnlich. Ihre \u00dcberraschung r\u00fchrt daher, dass ein chinesisches Unternehmen pl\u00f6tzlich nicht mehr nur ein Nachahmer ist, sondern als Innovator in ihrem Spiel mitspielt \u2013 anders als die meisten chinesischen Firmen, die es gewohnt sind zu folgen.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Aber im chinesischen Kontext scheint es fast ein Luxus zu sein, reine Innovation zu priorisieren. Die Entwicklung gro\u00dfer Modelle ist kapitalintensiv. Nicht jedes Unternehmen kann es sich leisten, sich ausschlie\u00dflich auf Forschung zu konzentrieren, ohne sofort kommerzialisieren zu m\u00fcssen.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Innovation ist zweifellos teuer, und unsere fr\u00fchere Tendenz, bestehende Technologien zu \u00fcbernehmen, hing mit Chinas fr\u00fcherem Entwicklungsstand zusammen. Heute jedoch hat China eine wirtschaftliche Gr\u00f6\u00dfe erreicht, und die Gewinne von Giganten wie ByteDance und Tencent sind weltweit bedeutend. Uns fehlt es nicht an Kapital, sondern an Selbstvertrauen und der F\u00e4higkeit, hochkar\u00e4tige Talente f\u00fcr effektive Innovationen zu organisieren.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Warum priorisieren chinesische Unternehmen, selbst gut finanzierte Giganten, oft eine schnelle Kommerzialisierung?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Drei Jahrzehnte lang haben wir Gewinne \u00fcber Innovation gestellt. Innovation ist nicht rein gesch\u00e4ftsgetrieben; sie erfordert Neugier und kreative Ambition. Wir sind durch alte Gewohnheiten eingeschr\u00e4nkt, aber das ist nur eine Phase.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Aber DeepSeek ist ein Unternehmen, kein gemeinn\u00fctziges Forschungslabor. Wenn Sie Innovationen entwickeln und diese open-source zug\u00e4nglich machen \u2013 wie zum Beispiel die MLA-Architektur, die im Mai ver\u00f6ffentlicht wurde \u2013 werden Konkurrenten sie schnell kopieren. Wo liegt Ihr Wettbewerbsvorteil?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Bei disruptiver Technologie sind geschlossene Wettbewerbsvorteile nur von kurzer Dauer. Selbst das geschlossene Modell von OpenAI kann nicht verhindern, dass andere aufholen.<\/p>\n\n\n\n<p>Unser echter Wettbewerbsvorteil liegt daher im Wachstum unseres Teams \u2013 dem Aufbau von Know-how und der F\u00f6rderung einer Innovationskultur. Open-Source und wissenschaftliche Ver\u00f6ffentlichungen f\u00fchren nicht zu gro\u00dfen Verlusten. F\u00fcr Technologen ist es eine Belohnung, wenn ihnen andere folgen. Open-Source ist kulturell, nicht nur kommerziell. Es ist eine Ehre, etwas zur\u00fcckzugeben, und es zieht Talente an.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Wie reagieren Sie auf marktorientierte Ansichten wie die von Zhu Xiaohu (der fordert, sofortige Kommerzialisierung zu priorisieren, und AGI als unrealistisch abtut)?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Zhus Logik passt zu kurzfristigen Gewinnprojekten, aber die dauerhaft profitabelsten Unternehmen in den USA sind Technologie-Giganten, die auf langfristiger Forschung und Entwicklung aufgebaut sind.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Aber im Bereich der KI reicht eine reine technische F\u00fchrungsrolle nicht aus. Worauf setzt DeepSeek in gr\u00f6\u00dferem Ma\u00dfstab?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wir glauben, dass Chinas KI nicht ewig ein Nachfolger bleiben kann. Oft hei\u00dft es, es gebe eine ein- bis zweij\u00e4hrige L\u00fccke zwischen chinesischer und amerikanischer KI. Aber die eigentliche L\u00fccke liegt zwischen Originalit\u00e4t und Nachahmung. Wenn sich das nicht \u00e4ndert, wird China immer ein Nachfolger bleiben. Einige Erkundungen sind unvermeidlich.<\/p>\n\n\n\n<p>NVIDIAs Dominanz beruht nicht nur auf ihrem eigenen Einsatz \u2013 sie ist das Ergebnis westlicher Technologie-\u00d6kosysteme, die gemeinsam Fahrpl\u00e4ne f\u00fcr die n\u00e4chste Generation von Technologien entwickelt haben. China braucht \u00e4hnliche \u00d6kosysteme. Viele inl\u00e4ndische Chips scheitern, weil es an unterst\u00fctzenden Technologie-Communities fehlt und sie auf zweitklassige Erkenntnisse angewiesen sind. Jemand muss sich an die Spitze wagen.<\/p>\n\n\n\n<p><strong>Mehr Investitionen f\u00fchren nicht immer zu mehr Innovation<\/strong><\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;DeepSeek vermittelt derzeit ein idealistisches Gef\u00fchl, das an die fr\u00fchen Tage von OpenAI erinnert, und Sie setzen auf Open-Source. Planen Sie, wie OpenAI und Mistral, in Zukunft auf ein geschlossenes Modell umzustellen?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wir werden nicht auf ein geschlossenes Modell umstellen. Wir glauben, dass der Aufbau eines robusten Technologie-\u00d6kosystems wichtiger ist.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Gibt es Pl\u00e4ne zur Kapitalbeschaffung? Medienberichte deuten darauf hin, dass Huanfang\u30101\u3011&nbsp;plant, DeepSeek f\u00fcr einen B\u00f6rsengang auszugliedern. Silicon-Valley-KI-Startups arbeiten zwangsl\u00e4ufig mit gro\u00dfen Akteuren zusammen \u2013 werden Sie das auch tun?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Es gibt keine kurzfristigen Pl\u00e4ne. Unsere Herausforderung war nie Geld, sondern das Embargo f\u00fcr High-End-Chips.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Viele argumentieren, dass AGI mutige Allianzen und Sichtbarkeit erfordert, im Gegensatz zum quantitativen Investieren, das in der Geheimhaltung gedeiht. Stimmen Sie dem zu?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Mehr Investitionen f\u00fchren nicht unbedingt zu mehr Innovation. Wenn das der Fall w\u00e4re, h\u00e4tten gro\u00dfe Technologieunternehmen l\u00e4ngst die gesamte Innovation monopolisiert.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Vermeiden Sie Anwendungen, weil DeepSeek nicht \u00fcber die entsprechende operative Expertise verf\u00fcgt?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wir glauben, dass die aktuelle Phase eine Zeit technologischer Innovation ist und keine Phase der Anwendungsexplosion. Langfristig wollen wir ein \u00d6kosystem schaffen, in dem die Branche unsere Technologien und Ergebnisse direkt nutzt. Andere entwickeln B2B- oder B2C-Dienste auf Basis unserer Modelle, w\u00e4hrend wir uns auf Grundlagenforschung konzentrieren. Wenn eine vollst\u00e4ndige Branchenkette entsteht, m\u00fcssen wir selbst keine Anwendungen entwickeln. Das hei\u00dft jedoch nicht, dass wir dazu nicht in der Lage w\u00e4ren. Forschung und Innovation bleiben aber immer unsere oberste Priorit\u00e4t.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Warum sollten Kunden DeepSeeks API gegen\u00fcber denen gro\u00dfer Anbieter bevorzugen?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Die k\u00fcnftige Welt wird wahrscheinlich eine mit spezialisierter Arbeitsteilung sein. Grundlagen-KI-Modelle erfordern kontinuierliche Innovation, und gro\u00dfe Unternehmen haben ihre Grenzen \u2013 sie sind m\u00f6glicherweise nicht immer die beste Wahl f\u00fcr diese Aufgabe.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Aber kann Technologie allein einen signifikanten Wettbewerbsvorsprung schaffen? Sie sagten, es g\u00e4be keine absoluten \u201eGeheimnisse\u201c.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Geheimnisse gibt es nicht, aber Nachahmung erfordert Zeit und Kosten. NVIDIA-GPUs haben keine versteckte Magie \u2013 doch das Aufholen erfordert den Neuaufbau von Teams und das Streben nach deren n\u00e4chster Generation von Technologien. Das ist der wahre Wettbewerbsvorteil.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Nach Ihren Preissenkungen war ByteDance der Erste, der nachzog, was darauf hindeutet, dass sie sich bedroht f\u00fchlten. Wie sehen Sie die neue Wettbewerbslandschaft zwischen Startups und Giganten?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Um ehrlich zu sein, k\u00fcmmern wir uns nicht wirklich darum. Preissenkungen waren nur etwas, das wir nebenbei gemacht haben. Cloud-Dienste bereitzustellen ist nicht unser Hauptziel \u2013 AGI zu erreichen ist es. Bisher haben wir keine bahnbrechenden L\u00f6sungen gesehen. Giganten haben Nutzer, aber ihre Cash-Cows fesseln sie auch, was sie anf\u00e4llig f\u00fcr St\u00f6rungen macht.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Wie sieht Ihrer Meinung nach das Endspiel f\u00fcr die sechs anderen gro\u00dfen KI-Startups in China aus?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Vielleicht \u00fcberleben 2-3 von ihnen. Alle verbrennen derzeit Geld. Diejenigen mit klarer Fokussierung und operativer Disziplin werden bestehen. Andere werden sich umorientieren. Der Wert verschwindet nie; sie werden neue Formen annehmen.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Was ist Ihre Kernphilosophie, wenn es um Wettbewerb geht?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Ich konzentriere mich darauf, ob etwas die Effizienz der Gesellschaft steigert und ob wir unsere St\u00e4rke in der Wertsch\u00f6pfungskette der Branche finden k\u00f6nnen. Solange das Endziel die Effizienz steigert, ist es g\u00fcltig. Viele Aspekte sind nur vor\u00fcbergehende Phasen \u2013 sich zu sehr darauf zu konzentrieren, f\u00fchrt nur zu Verwirrung.<\/p>\n\n\n\n<p><strong>V2-Modell: Vollst\u00e4ndig von heimischen Talenten entwickelt<\/strong><\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Jack Clark, ehemaliger Policy Lead bei OpenAI und Mitgr\u00fcnder von Anthropic, bemerkte, dass DeepSeek einige dieser \u201er\u00e4tselhaften Zauberer\u201c eingestellt hat, die DeepSeek V2 entwickelt haben. Was zeichnet diese Leute aus?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Es gibt hier keine \u201er\u00e4tselhaften Zauberer\u201c \u2013 nur frische Absolventen von Spitzenuniversit\u00e4ten, Doktoranden (sogar Viert- oder F\u00fcnftsemester-Praktikanten) und junge Talente mit wenigen Jahren Erfahrung.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Viele gro\u00dfe KI-Unternehmen sind sehr daran interessiert, Talente aus dem Ausland zu rekrutieren. Einige glauben, dass die Top-50-KI-Talente weltweit wahrscheinlich nicht f\u00fcr chinesische Unternehmen arbeiten. Woher kommt Ihr Team?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;V2 wurde vollst\u00e4ndig von heimischen Talenten entwickelt. Die globalen Top 50 sind vielleicht heute nicht in China, aber wir streben an, unsere eigenen zu entwickeln.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Wie entstand die MLA-Innovation? Es hei\u00dft, dass die Idee urspr\u00fcnglich aus dem pers\u00f6nlichen Interesse eines jungen Forschers hervorging.<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Nach der Zusammenfassung der wichtigsten Entwicklungsmuster der Mainstream-Attention-Architektur hatte er eine pl\u00f6tzliche Inspiration, eine Alternative zu entwerfen. Aber eine Idee in die Realit\u00e4t umzusetzen, ist ein langer Weg. Wir haben ein Team zusammengestellt und Monate damit verbracht, es zu validieren.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;Diese Art von organischer Kreativit\u00e4t scheint mit Ihrer flachen Organisationsstruktur verbunden zu sein. In Huanfang haben Sie eine Top-Down-Steuerung vermieden. Aber bei AGI \u2013 einer hochgradig unsicheren Grenze \u2013 setzen Sie hier mehr auf Management?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;DeepSeek bleibt vollst\u00e4ndig bottom-up. Wir weisen auch keine Rollen im Voraus zu; die nat\u00fcrliche Arbeitsteilung entsteht. Jeder bringt einzigartige Erfahrungen und Ideen ein, und sie m\u00fcssen nicht angetrieben werden. Wenn sie auf Herausforderungen sto\u00dfen, ziehen sie andere automatisch zu Diskussionen hinzu. Sobald eine Idee jedoch Potenzial zeigt, stellen wir von oben Ressourcen bereit.<\/p>\n\n\n\n<p><strong>An Yong:<\/strong>&nbsp;M\u00f6chten Sie noch etwas zu Ihrer Vision hinzuf\u00fcgen?<\/p>\n\n\n\n<p><strong>Liang Wenfeng:<\/strong>&nbsp;Wir brauchen Geduld und Mut, um wirklich zu innovieren. Es ist ein Marathon, kein Sprint.<\/p>\n\n\n\n<p><strong>Referenzen<\/strong><\/p>\n\n\n\n<p>\u30101\u3011&nbsp;Huanfang: Ein quantitatives Investmentunternehmen und fr\u00fcher Unterst\u00fctzer von DeepSeek.<\/p>\n\n\n\n<p>\u30102\u3011&nbsp;MoE: Mixture of Experts, eine Architektur, die die Effizienz von Modellen verbessert, indem spezialisierte Subnetzwerke aktiviert werden.<\/p>\n\n\n\n<p>\u30103\u3011&nbsp;Wang Huiwen: Mitgr\u00fcnder von Meituan, der 2023 kurzzeitig in das KI-Gesch\u00e4ft einstieg, bevor er sich wieder zur\u00fcckzog.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In einem seltenen Interview macht DeepSeek-CEO Liang Wenfeng deutlich, dass China nicht l\u00e4nger US-Innovationen kopieren, sondern eigene technologische L\u00f6sungen entwickeln will. Sein neuestes KI-Modell unterstreicht diesen Anspruch \u2013 ein bemerkenswerter Schritt, auch wenn der Abstand zum Silicon Valley noch besteht. Ich habe das Gespr\u00e4ch ins Deutsche \u00fcbersetzt und stelle es hier zur Verf\u00fcgung.<\/p>\n","protected":false},"author":1,"featured_media":7432,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,1125],"tags":[],"class_list":["post-7430","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-allgemein","category-ki-aktien-blog"],"_links":{"self":[{"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/posts\/7430","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/comments?post=7430"}],"version-history":[{"count":3,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/posts\/7430\/revisions"}],"predecessor-version":[{"id":7876,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/posts\/7430\/revisions\/7876"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/media\/7432"}],"wp:attachment":[{"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/media?parent=7430"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/categories?post=7430"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.heibel-ticker.de\/blog\/wp-json\/wp\/v2\/tags?post=7430"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}