DeepSeek запускает революционную модель искусственного интеллекта
22:08
Китайская компания DeepSeek представила свою новейшую модель искусственного интеллекта DeepSeek-V3, а также долгожданную DeepSeek-R1 - революционный шаг, который потряс мировую технологическую индустрию. Эти модели, конкурирующие с возможностями таких гигантов индустрии, как OpenAI, Google и Meta, были разработаны за меньшую цену, что бросает вызов статус-кво в развитии ИИ и вызывает переоценку глобальной гонки ИИ.
Новая эра эффективности ИИ
DeepSeek-V3, модель с 671 миллиардом параметров, и DeepSeek-R1, модель, ориентированная на рассуждения, продемонстрировали исключительную производительность в различных тестах, включая математические рассуждения, генерацию кода и обработку естественного языка. Отличительной особенностью DeepSeek является способность достигать таких результатов при значительно меньших вычислительных затратах. Компания сообщила, что на обучение DeepSeek-V3 было потрачено всего 5,6 миллиона долларов, что резко контрастирует с миллиардными инвестициями американских технологических гигантов. Такая экономичность объясняется применением в DeepSeek инновационных технологий, таких как обучение с подкреплением, архитектура «смесь экспертов» и многоголовое скрытое внимание. Эти методы позволяют моделям активировать только необходимые параметры для каждой задачи, снижая потребление ресурсов при сохранении высокой производительности.
Доступность открытого исходного кода
DeepSeek использует подход с открытым исходным кодом, делая свои модели свободно доступными по лицензии MIT. Этот шаг демократизировал доступ к передовым технологиям искусственного интеллекта, позволив разработчикам по всему миру интегрировать и использовать инновации DeepSeek. Кроме того, цены на API компании отличаются доступностью: стоимость DeepSeek-R1 составляет всего 0,55 доллара за миллион входных токенов и 2,19 доллара за миллион выходных токенов, по сравнению со значительно более высокими расценками OpenAI. Запуск DeepSeek-R1 уже произвел фурор на потребительском рынке. Уже через неделю после выхода приложение DeepSeek обогнало ChatGPT и стало самым рейтинговым бесплатным приложением в Apple App Store в США с почти 2 миллионами загрузок.
Стратегические партнерства и технологическое превосходство
Успеху DeepSeek способствуют стратегические партнерства, в том числе сотрудничество с AMD. Используя графические процессоры AMD Instinct и программное обеспечение ROCM, DeepSeek оптимизировала процесс разработки моделей, особенно для DeepSeek-V3. Это партнерство обеспечивает доступ к передовому оборудованию и программному обеспечению, повышая масштабируемость и производительность решений в области ИИ.
Трудности и реакция рынка
Несмотря на свои достижения, DeepSeek сталкивается с проблемами, в том числе с американским экспортным контролем на передовые чипы, который ограничивает доступ к новейшему оборудованию. Однако компания продемонстрировала удивительную изобретательность, добившись высокой производительности с помощью маломощных чипов. Запуск вызвал значительную реакцию рынка. Акции крупнейших технологических компаний, включая Nvidia, Meta и Alphabet, резко упали, поскольку инвесторы усомнились в устойчивости их масштабных инвестиций в ИИ. Акции Nvidia, ведущего поставщика чипов для ИИ, упали на 16 %, что отражает опасения по поводу снижения спроса на ее продукцию.
Веха для китайского ИИ
Возвышение DeepSeek знаменует собой поворотный момент для китайской индустрии ИИ. Основатель компании Лян Вэньфэн, известная фигура как в хедж-фондах, так и в сфере ИИ, позиционирует DeepSeek как лидера в области исследований искусственного общего интеллекта (ИО). Успех стартапа был признан на самом высоком уровне китайской политики: Лян присутствовал на закрытом симпозиуме, организованном премьер-министром Китая Ли Цянем.
Заглядывая в будущее
Запуск DeepSeek - это не просто технологический прорыв, это изменение глобального ландшафта ИИ. Ставя во главу угла эффективность, доступность и сотрудничество с открытым исходным кодом, DeepSeek бросает вызов доминированию американских технологических гигантов и прокладывает путь к более инклюзивному и устойчивому будущему ИИ. По мере усиления гонки ИИ за развитием компании DeepSeek следует внимательно следить. Ее инновационный подход и разрушительное воздействие уже изменили индустрию, доказав, что высокая производительность в ИИ не всегда требует астрономических инвестиций. Для получения более подробной информации посетите официальный сайт DeepSeek или изучите ее модели на портале разработчиков DeepSeek.