“违规蒸馏”指控!DeepSeek遭OpenAI和Anthropic围剿,AI进入“规则制高点”竞争?【附全球大模型发展现状及趋势分析】

ze5个月前资讯771

图源:摄图网

近日,OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。目前,OpenAI拒绝进一步置评,也不愿提供证据细节。

具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

微软也开始调查DeepSeek是否使用OpenAI的API。

各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。

按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

而对于模型蒸馏,在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。

IBM对知识蒸馏的文章中也提到,大多数情况下最领先的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。

而DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:DeepSeek独立发现了OpenAI在实现o1过程中所采用的一些核心理念。同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。

就在OpenAI挑起矛盾的同时,Anthropic也下场了。

创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。

他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。

2024年全球大模型行业市场规模将达到280亿美元

大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。神经网络模型则是指基于神经网络结构构成的数学模型,它受到人脑神经系统结构的启发,由人工神经元(节点)和它们之间的连接组成。这些连接具有权重,可以通过学习过程进行调整,从而使得神经网络能够学习和适应输入数据的模式。2023年全球大模型行业市场规模达到210亿美元。初步估算,2024年全球大模型行业市场规模将达到280亿美元,未来五年复合增速将达到36.23%。

区域市场

从区域市场来看,根据斯坦福大学人工智能研究所(Stanford HAI)于2024年4月发布的《2024年人工智能指数报告》,2019-2023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。

产业竞争

当前全球AI大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美企处于领先地位,主导生成式AI、自然语言处理等领域,模型如GPT系列和PaLM广泛应用。Meta等公司探索开源模式,增强生态影响力。行业趋势包括模型规模扩张、多模态能力提升和垂直领域优化,但高计算成本与安全性挑战仍是主要问题。

那么DeepSeek R1的价值究竟几何?

分析师郭明錤最新博客给出参考:

一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。

过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。

第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。

郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。

而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。

不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。

同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》

同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

相关文章

【行业深度】洞察2024:中国干衣机行业竞争格局及市场份额(附市场集中度、企业竞争力评价等)

【行业深度】洞察2024:中国干衣机行业竞争格局及市场份额(附市场集中度、企业竞争力评价等)

行业主要上市公司:海尔智家(600690);海信家电(000921);美的集团(000333);TCL智家(002668)等 本文核心数据:企业排名;企业收入;干衣机业务占比 1、中国干衣机竞争主体...

2023年中国普拉克索行业研发现状分析 多数企业临床试验进入时间为2019年左右

2023年中国普拉克索行业研发现状分析 多数企业临床试验进入时间为2019年左右

本文核心数据:发展现状和竞争格局。 1。普拉克索的临床试验注册信息有37条。 普拉克索片用于单独(不含左旋多巴)或与左旋多巴联合治疗特发性帕金森病的体征和症状。例如,当左旋多巴的疗效在疾病后期逐渐减...

贵州检察机关依法对马林波决定逮捕

正义网记者11月9日从最高人民检察院获悉,贵州省农村信用合作联社原书记、理事长马林波(正厅级)涉嫌受贿一案,由贵州省监察委员会立案侦查,移送检察机关审查起诉。由贵州省人民检察院指定管辖,贵阳市人民检察...

重磅!2024年中国及31省市人参行业政策汇总及解读(全)

重磅!2024年中国及31省市人参行业政策汇总及解读(全)

行业主要上市公司:益盛药业(002566)、同仁堂(600085)、华润三九(000999)、吉林敖东(000623)、东阿阿胶(000423)、葵花药业(002737)、康恩贝(600572)、*...

2025年中国干细胞药物研发情况分析:研发与临床应用加速发展【组图】

2025年中国干细胞药物研发情况分析:研发与临床应用加速发展【组图】

行业主要上市公司:中源协和(600645);赛莱拉(831049);冠昊生物(300238)等 本文核心数据:申请受理数量;类型结构;企业布局等 ——中国干细胞药物年受理情况:数量实现快速增长 20...

超100亿立方米!我国首个超深水大气田深海一号又有新突破【附中国海洋油气业发展现状分析】

超100亿立方米!我国首个超深水大气田深海一号又有新突破【附中国海洋油气业发展现状分析】

图源:摄图网 1月29日,央视新闻报道称,我国首个超深水大气田“深海一号”累计生产天然气突破100亿立方米,凝析油产量超过100万立方米,并已连续三年保持天然气年产量30亿立方米以上。 “深海一号...