Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что резко контрастирует с расходами конкурентов. Однако эта цифра вводит в заблуждение.
Изображение: Ensigame.com
Инновационная архитектура DeepSeek V3 способствует его эффективности. Ключевые технологии включают многократный прогноз (MTP), который предсказывает несколько слов одновременно; Смесь экспертов (MOE), используя 256 нейронных сетей для расширенной обработки; и мультиголовое скрытое внимание (MLA), сосредоточенное на важных элементах предложения для повышения точности.
Изображение: Ensigame.com
В отличие от публикации, полуанализ показывает, что DeepSeek управляет массовой инфраструктурой примерно 50 000 графических процессоров NVIDIA, стоимостью примерно 1,6 млрд. Долл. США, при этом эксплуатационные расходы примерно 944 млн. Долл. США. Эти существенные инвестиции в сочетании с высокой заработной платой для исследователей (превышают 1,3 млн. Долл. США в год), значительно превосходят первоначальные претензии в размере 6 миллионов долларов США.
Изображение: Ensigame.com
Успех Deepseek проистекает из его уникальной структуры: дочерней компании High-Flyer, китайского хедж-фонда, он владеет своими центрами обработки данных, способствуя быстрому инновациям и оптимизации. Его самофинансируемая природа повышает ловкость. В то время как «Бюджетный» повествование преувеличено, общие инвестиции Deepseek, превышающие 500 миллионов долларов, все еще представляют собой сравнительно худой подход.
Изображение: Ensigame.com
Контраст с конкурентами поразителен. Модель DeepSeek R1 стоила 5 миллионов долларов по сравнению с CHATGPT4O в 100 миллионов долларов. Пример DeepSeek демонстрирует путь к конкурентоспособности, но его успех, несомненно, укоренился в значительных инвестициях и технологических достижениях, а не только его якобы низкими затратами на обучение. Несмотря на завышенную претензию, это все еще значительно подрывает конкурентов.