“违规蒸馏”指控!DeepSeek遭OpenAI和Anthropic围剿,AI进入“规则制高点”竞争?【附全球大模型发展现状及趋势分析】

ze1年前资讯783

图源:摄图网

近日,OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。目前,OpenAI拒绝进一步置评,也不愿提供证据细节。

具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

微软也开始调查DeepSeek是否使用OpenAI的API。

各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。

按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

而对于模型蒸馏,在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。

IBM对知识蒸馏的文章中也提到,大多数情况下最领先的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。

而DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:DeepSeek独立发现了OpenAI在实现o1过程中所采用的一些核心理念。同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。

就在OpenAI挑起矛盾的同时,Anthropic也下场了。

创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。

他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。

2024年全球大模型行业市场规模将达到280亿美元

大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。神经网络模型则是指基于神经网络结构构成的数学模型,它受到人脑神经系统结构的启发,由人工神经元(节点)和它们之间的连接组成。这些连接具有权重,可以通过学习过程进行调整,从而使得神经网络能够学习和适应输入数据的模式。2023年全球大模型行业市场规模达到210亿美元。初步估算,2024年全球大模型行业市场规模将达到280亿美元,未来五年复合增速将达到36.23%。

区域市场

从区域市场来看,根据斯坦福大学人工智能研究所(Stanford HAI)于2024年4月发布的《2024年人工智能指数报告》,2019-2023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。

产业竞争

当前全球AI大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美企处于领先地位,主导生成式AI、自然语言处理等领域,模型如GPT系列和PaLM广泛应用。Meta等公司探索开源模式,增强生态影响力。行业趋势包括模型规模扩张、多模态能力提升和垂直领域优化,但高计算成本与安全性挑战仍是主要问题。

那么DeepSeek R1的价值究竟几何?

分析师郭明錤最新博客给出参考:

一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。

过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。

第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。

郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。

而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。

不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。

同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》

同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

相关文章

智慧物流产业招商清单:诺力智能、今天国际、东杰智能等最新投资动向【附关键企业名录】

智慧物流产业招商清单:诺力智能、今天国际、东杰智能等最新投资动向【附关键企业名录】

物流业是支撑国民经济发展的基础性、战略性、先导性产业。近年来,智慧物流在中国快速发展,成为推动物流业高质量发展的重要驱动力和路径。作为智能物流发展的基础,大数据、物联网、云计算、智能机器人等新技术、新...

利润暴增近15倍!三星电子单季营业利润超过去年全年:AI需求推高芯片价格【附全球存储芯片行业市场竞争分析】

利润暴增近15倍!三星电子单季营业利润超过去年全年:AI需求推高芯片价格【附全球存储芯片行业市场竞争分析】

来源:摄影网三星电子股价创2021年2月以来新高。7月5日,三星电子公布了初步业绩报告。2024年第二季度,其销售额达74万亿韩元(约合人民币3900亿元),同比增长23.31%;营业利润高达10.4...

重磅!2024年中国及31省市智慧政府行业政策汇总及解读(全)政策鼓励智慧政府建设融慧治理新体系

重磅!2024年中国及31省市智慧政府行业政策汇总及解读(全)政策鼓励智慧政府建设融慧治理新体系

【/h/]行业主要上市公司:东软集团(600718)、数字郑桐(300075)、中国软件(600536)、启明星辰(002439)、沈心(沈心)、天融信(002212)和浙大网新(600797)。【/...

【投资视角】启示2024:中国风电场行业投融资及兼并重组分析(附投融资事件、产业基金和兼并重组等)

【投资视角】启示2024:中国风电场行业投融资及兼并重组分析(附投融资事件、产业基金和兼并重组等)

【/h/]行业主要上市公司:华润电力(00836。HK)、三峡能源(600906。SH)、中国电建(601669。SH)、建投能源(000600。SZ)、深圳能源(000027。SZ),以及节能风电(...

2024年中国智能变电站行业政策现状分析 政策不断推进,需求有望持续增长【组图】

2024年中国智能变电站行业政策现状分析 政策不断推进,需求有望持续增长【组图】

行业主要上市公司:安靠智电(300617.SZ)、许继电气(000400.SZ)、特变电工(600089.SZ)、金智科技(002090.SZ)、思源电气(002028.SZ)、长高电新(00245...