Článek
Destilace je technika učení modelů, kdy menší model kopíruje znalosti z většího a výkonnějšího modelu. Cílem je, aby byl výsledný model menší, rychlejší a efektivnější, ale přitom měl podobnou úroveň schopností jako původní model. Obvykle je destilace legální, problém nastane ve chvíli, když někdo trénuje svůj model na odpovědích jiného modelu bez povolení, z čehož OpenAI už dříve obviňoval DeepSeek.
Podle OpenAI používá DeepSeek replikované modely pro trénování svých vlastních modelů s prvky AI. Americká společnost to podle Reuters v neveřejném memorandu označuje za „pokračující snahy o bezplatné využívání schopností vyvinutých společností OpenAI a dalšími americkými laboratořemi“.
„Zaznamenali jsme účty spojené se zaměstnanci DeepSeeku, kteří vyvíjejí metody k obcházení přístupových omezení OpenAI a získávají přístup k modelům prostřednictvím zamlžených routerů třetích stran a jiných způsobů, které maskují jejich zdroj,“ stojí dále v memorandu.
DeepSeek v loňském roce upoutal pozornost díky svému pokročilému a údajně energeticky i cenově dostupnému chatbotu R1. Na konci ledna 2025 se stal nejvíce stahovanou bezplatnou aplikací v obchodě AppStore ve Spojených státech a předstihl konkurenční ChatGPT společnosti OpenAI.
Tvůrci modelu tvrdí, že DeepSeek-V3 je nejvýše hodnoceným modelem s otevřeným kódem a že se dokáže vyrovnat nejpokročilejším uzavřeným modelům na světě, tedy těm, jejichž kód a trénovací data nejsou veřejně dostupné. Jeho provoz má být podle médií o 90 až 95 % levnější než u ChatGPT.
Česká vláda na doporučení kybernetického úřadu loni v červenci zakázala veškeré produkty společnosti DeepSeek používat ve státní správě. Američtí zákonodárci už dříve uvedli, že společnost DeepSeek na základě svých prohlášení o ochraně osobních údajů předává data amerických uživatelů Číně prostřednictvím tzv. backendové infrastruktury napojené na čínskou státní telekomunikační společnost China Mobile.
Startup DeepSeek se sídlem v Chang-čou byl založen v roce 2023, kdy vyhledávací gigant Baidu vydal v Číně první velký jazykový model s prvky AI. Od té doby představily desítky čínských technologických firem své vlastní velké a malé modely AI, DeepSeek je však první firmou, jejíž model se špičkovým americkým modelům vyrovná, nebo je v některých ohledech i předčí.


