最好看的新闻,最实用的信息
01月30日 41.0°C-43.3°C
澳元 : 人民币=4.46
珀斯
今日澳洲app下载
登录 注册

美国AI公司试图破解DeepSeek破坏性创新技术(图)

1天前 来源: 美国之音中文网 原文链接 评论0条

本文转载自美国之音中文网,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。

美国领先的人工智能(AI)公司开发人员在赞扬迅速崛起而声名大噪的DeepSeek AI模型的同时,也试图找出其漏洞,以反驳“中国后来者以低成本替代方案击败他们耗资数十亿美元的技术”这种观点。

中国初创公司深度求索(DeepSeek)星期一(1月27日)引发了美股市场抛售,其免费AI助手在美国苹果应用商店的下载量超越了OpenAI的ChatGPT。该公司声称,其模型利用性能较低的英伟达(Nvidia)H800处理器芯片做训练,花费不到600万美元。

了解四大领先AI实验室想法的知情人士表示,随着对竞争的担忧在美国股市蔓延,一些AI专家对深度求索的坚强团队和最新研究表示赞赏,但对该发展依旧泰然自若而未感到震惊。

美国AI公司试图破解DeepSeek破坏性创新技术(图) - 1

Open AI首席执行官萨姆·奥尔特曼(Sam Altman)在X平台上写道,R1是深度求索最近几周发布的几种模型之一,“是一款令人印象深刻的模型,尤其是考虑到它们能够以这个价格提供。”

英伟达在一份声明中表示,深度求索的成就证明了市场有更多对英伟达芯片的需求。

美国软件制造商雪花(Snowflake)在收到客户咨询激增后,星期一决定将DeepSeek模型添加到其AI模型市场。

雪花产品执行副总裁克里斯蒂安·克莱纳曼(Christian Kleinerman)表示,连其员工也称DeepSeek的模型“令人惊叹”,并且该公司在权衡了托管该中国开发的AI技术可能面临的潜在风险后,最终决定向客户提供这项服务。

与此同时,美国AI开发人员正加紧分析DeepSeek的V3模型。深度求索去年12月伴随该模型发表了一篇研究论文,该论文是其流行应用程序的基础,但那篇论文中并未回答诸如总开发成本等许多问题。

一位知情人士表示,中国目前已将落后美国最先进的AI模型的时间从18个月大幅缩短至6个月;然而,由于DeepSeek的免费发布策略引发了如此多的兴趣和关注,该公司可能很快就会发现自己没有足够的芯片来满足需求。

DeepSeek的进步并非仅依靠600万美元的微薄预算。该研究论文指出,这笔成本特指最终训练运行中的芯片使用,而不是整个开发成本。

两家顶级实验室的高管告诉路透社,训练运行只是总成本的冰山一角,确定如何设计训练运行的成本支出可能会高出很多。

该论文说,V3的训练运行使用了2,048块英伟达的H800芯片,这些芯片的设计旨在符合2022年发布的美国出口管制规定。专家告诉路透社,这些2022年美国出口管制规定几乎没有减缓中国AI的进展。

两家AI实验室的消息人士表示,他们预计早期开发阶段依赖了大量的芯片。其中一位消息人士说,这样的投资可能高达10亿美元。

一些美国AI领袖对深度求索将其模型以开源形式发布的决定表示赞赏,这意味着其他公司或个人可以自由使用或更改这些模型。

“DeepSeek R1是我见过的最令人惊叹和令人印象深刻的突破之一,而且作为开源技术,它是给世界的一份大礼,”风险投资家马克·安德森(Marc Andreessen)星期天在X平台上一篇贴子中表示。

业内观察人士表示,DeepSeek模型获得的赞赏凸显了开源AI技术作为诸如OpenAI的ChatGPT等昂贵且严格控制技术的替代方案的可行性。

分析师估计,美国大型云计算公司今年在AI基础设施上将投入高达2500亿美元。

近年来,华尔街最有价值的公司股价飙升,因为人们预期只有这些公司才能获得开发和扩展新兴AI技术所需的大量资本和计算能力。

本周和下周,许多美国科技巨头将公布季度收益,届时这些假设将受到进一步的审视。

本文转载自美国之音中文网,仅代表原出处和原作者观点,仅供参考阅读,不代表本网态度和立场。

关键词: DeepSeek破坏技术
今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]

友情链接: 华人找房 到家 今日支付Umall今日优选