标签 DeepSeek 下的文章

DeepSeek


深度求索(DeepSeek)是由中国对冲基金幻量化(High-Flyer)创立和支持的人工智能公司。2024年12月,该公司将其人工智能模型 DeepSeek-V3 版作为开源发布,声称该模型可与 OpenAI 和谷歌的模型相媲美,但训练成本仅为 560 万美元(尚不清楚具体包括哪些支出,但推测是该模型使用 2,048 个 NVIDIA H800 GPU 进行了约两个月预训练的 GPU 成本)。

ff6d4aae-33d6-4cdd-b861-d98e312a5452.jpg

DeepSeek在网页端、APP 和 API 全面上线,可以写代码、读文件、写作各种创意内容,该模型正受到越来越多的关注。在Vibe-Eval基准测试中是迄今为止排名最高的公开授权模型,也是目前最大的公开授权模型,比 Meta 公司最大的 Llama 系列模型 Llama 3.1 405B 还要大得多。