图片源于:https://www.forbes.com/sites/maryroeloffs/2025/01/27/what-is-deepseek-new-chinese-ai-startup-rivals-openai-and-claims-its-far-cheaper/
中国人工智能公司DeepSeek在周一登顶应用商店榜单,引发全球科技股市场震荡,因为其表现评价与同行如OpenAI相当。
DeepSeek成立于2023年,由40岁的中国企业家梁文峰创办,它的开源模型于1月初在美国上线,不久便超越了OpenAI的ChatGPT,成为iPhone下载榜首。
DeepSeek最新发布的产品R1是一款先进的推理模型,与OpenAI和Meta的顶级产品相比,效率似乎更高,训练和开发模型的成本更低,并且有可能在没有依赖美国出口管制下难以获得的强大AI加速器的情况下完成模型研发。
DeepSeek的R1和V3模型都在加州大学伯克利分校主办的性能平台Chatbot Arena中排名前十,公司表示,在数学任务、常识和问答性能基准测试中,其表现几乎与竞争对手相当或超过对手。
DeepSeek表示,训练其最新模型的成本为560万美元,远低于去年某位AI首席执行官估计的100万美元至10亿美元的建模成本,尽管Bernstein分析师Stacy Rasgon随后称DeepSeek的数字高度误导。
尽管关于DeepSeek产品真实成本和构建过程仍存在疑问,但它们仍然使股市陷入恐慌:微软股价下跌3.7%(截至东部时间上午11:30),特斯拉下跌1.3%,英伟达下跌15%,博通下跌16%,科技股重度集中的纳斯达克指数下跌3.5%,成为过去两年中表现第三差的交易日。
亿万富翁投资者马克·安德森在周日表示:“DeepSeek R1是人工智能的斯普特尼克时刻。”
据彭博社报道,截至上周六,DeepSeek移动应用的下载量已经达到160万次,成为澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone商店中的第一款应用。
DeepSeek如何使用?
DeepSeek在网页、应用程序和API上免费使用,但需要用户创建一个账户。
DeepSeek与OpenAI和ChatGPT的比较
DeepSeek-R1与OpenAI的o1模型非常相似,后者的用户每月需支付200美元。两者都是具备先进推理能力的大型语言模型,与OpenAI的ChatGTP等短期问答聊天机器人不同。R1和o1专注于将请求拆分为一系列逻辑“思想”,并对每个思想逐一进行审查。R1在多个基准测试中与o1表现相当,且在MATH-500测试中表现超出其表现。目前,Chatbot Arena将R1排名为现存第三大AI模型,而o1排名第四。
DeepSeek-R1是开源的吗?
是的,DeepSeek-R1对任何人开放,允许访问、使用、研究、修改和分享,并不受专有许可证的限制。
DeepSeek的所有权
DeepSeek独立运营,但完全由梁文峰创办的80亿美元对冲基金High-Flyer资助。该公司在2023年11月发布了其首个产品,旨在编码任务的模型,其后发布的所有产品以低成本著称,迫使其他中国科技巨头降低AI模型价格以保持竞争力。梁文峰在去年的一次采访中表示,公司并不追求过高的利润,仅以略高于成本的价格为产品定价。
DeepSeek真的那么便宜吗?
并不是所有人都相信DeepSeek声称以低廉的预算以及不依赖美国产AI芯片制作R1的说法。Scale AI首席执行官亚历山大·王在周四向CNBC表示(未提供证据)DeepSeek可能使用了约五万块英伟达H100芯片,而这一点无法提及因为违反了美国对中国公司的销售禁令。亿万富翁埃隆·马斯克在X平台上支持这一理论,称这一点“显然”属实。Rasgon在周一的报告中表示,对DeepSeek的报告未量化构建R1模型所用的资源,她表示虽然“模型看起来很出色……但我们并不认为它们是奇迹。”她还表示560万美元的成本估算也许真实反映了DeepSeek为培训其模型所租用的基础设施,但不包括研究、实验、算法、数据及构建产品的其他成本。
需要关注的事项
周一,英伟达作为备受追捧的人工智能芯片制造商,受到了多大的打击。该公司的市值正逐步下降11%,损失约4000亿美元,这将是任何公司历史上最大单日市值损失。此前的纪录由英伟达保持,去年9月其市值下跌近10%,损失2800亿美元。
背景
中国与美国是人工智能军备竞赛的主要参与者,尽管该领域的主导地位主要由美国公司OpenAI(由微软支持)、Meta和Alphabet主导。上周,特朗普总统支持OpenAI的5000亿美元“星际门户”基础设施计划,要超越竞争对手,宣布支持时特别谈到了美国在人工智能领域超过中国的重要性。
人工智能主要依靠高科技、高价值的半导体芯片提供计算能力,以有效地执行复杂计算和处理大量数据。虽然并不是所有最大型的半导体制造商都是美国公司,但许多公司——包括英伟达、英特尔和博通——都是在美国设计的。2022年,美国开始限制对中国的半导体出口,以试图阻止中国在军用或其他国家安全威胁方面发展人工智能的能力。