李彦宏最新内部讲话:开源大模型不如闭源,后者会持续领先

ze1年前社会529

【/h/]界面新闻记者|李

【/h/]界面新闻编辑|宋嘉楠

【/h/]4月11日,界面新闻获悉,百度创始人、董事长兼CEO李彦宏首次谈及文心大模型为何不开源,以及他对大模型开源与闭源的路径选择的看法。

【/h/]此外,他还提到了AI创业者应该专注于模型还是应用,以及创业公司同时做模型和应用的“双轮驱动”是否是一个好的模型等行业焦点话题。

【/h/]【/h/]【/h/]【/h/]大模型开源意义不大。

【/h/]在大型模型领域,目前有两种技术路线:开源和闭源。

【/h/]例如,马斯克的人工智能初创公司“xAI”就选择了开源路线,此前它正式开放了全球最大参数大型语言模型Grok-1。Meta的大语言模型Llama系列和Mistral AI在开源社区备受关注,也是中国的大开源模型,如致远的“启迪”模型、百川智能模型和阿里的依桐钱文模型。

【/h/]曾掀起大模型热潮的OpenAI开发的GPT-3.5和GPT-4选择了闭源,百度文心大模型也是如此。

【/h/]李彦宏在内部讲话中提到,百度内部就文心是否需要开源进行了非常激烈的讨论,最终决定不开源。当时的判断是,市场上肯定有开源的模型,而且不止一个会开源。在这种情况下,百度的开源并不多,而百度的开源有很多。

【/h/]“这个市场并不缺乏我们的开源模式。如果我们想要开源,我们必须自己维护一个开源版本,这并不划算。”他认为模型开源的意义不是很大。这些开源模型在分散和小规模的范围内做各种验证应用,但它们没有得到强大计算能力的验证。

【/h/]在他看来,不同于传统的软件开源,大模型开源并不是众人拾柴火焰高。相反,闭源模式将继续在能力上领先,而不是一时。

【/h/]也有业内人士告诉界面新闻,开源软件的优势在于大家共享代码,这样很多人可以一起修复bug,保持软件更新。然而,大模型本身是一个黑盒,在有人提交修改后可能会重新训练。每次训练都会消耗大量的计算能力和金钱,这还不如以前的开源软件在多人联合开发中的作用大。

【/h/]上述人士判断,从长远来看,闭源可以集中智能、算力等资源对大型模型进行迭代,比开源更高效。

【/h/]李彦宏还强调,闭源的优势在于真正的商业模式,即可以赚钱来聚集计算能力和人才。成本方面,同等能力下闭源模型的推理成本更低,响应速度更快。在相同参数下,闭源模型的能力也更强。

【/h/]“今天,无论在中国还是在美国,最强的基本模型都是闭源的,各种小模型和最好的小模型都是从大模型中提炼出来的。大模型降维做出来的模型更好,这也会导致闭源在成本和效率上的优势。”他说。

【/h/]在接受界面新闻采访时,百川智能CEO王小川也提到了关于大模型开源与闭源的争论。他的观点是,大机型本身并不代表消费者一方,不像安卓和IOS需要二选一。今天,从企业的角度来看,开源和闭源都是非常需要的。

【/h/]王小川非常重视开源带来的价值。他认为,未来80%的企业都会采用开源模式,因为开源模式规模小,闭源无法对很多场景做出很好的适配。

【/h/]【/h/]【/h/]AI创业者的核心竞争力不是模型本身。

【/h/]除了表达对开源和闭源路线的立场外,李彦宏还提出了自己对人工智能企业家和初创公司的看法。

【/h/]他认为一些建模创业公司所谓的“双轮驱动”并不是一个好的模式。既做建模又做应用将不可避免地分散精力。创业公司的精力和资源是有限的。当资源有限时,更重要的是专注于它,而不是搞所谓的“双轮驱动”。

【/h/]对于AI创业者来说,核心竞争力不应该是模型本身,它非常耗费资源,需要很长时间才能走出来。创业者真正的优势应该是某个领域的知识和数据。

【/h/]“如果你想在今天找到一条‘没有口袋的黄色男士泳裤’,你在任何电商平台上都找不到,而这种需求是目前的技术无法解决的。大型模型如果拥有领域知识就可以得到解决,这是领域知识可以提供独特价值的一个例子。”他说。

【/h/]在他看来,市场上有大量的模型,有大型的、小型的、开源的和闭源的。如何在具体应用中使用这些模型的组合是有技巧的,这是企业家可以做的事情,并且可以提供价值增益。

【/h/]对于使用文新或闭源模式会被抄袭和抢饭碗的担忧,李彦宏也回应称,在移动时代,微信没有吃掉拼多多,滴滴也没有成为腾讯的一部分。它们都提供了自己独特的价值,并具有自己非常不同的竞争力。他们的崛起依赖于移动生态系统中的一个封闭平台——微信,但他们并不害怕微信抢其饭碗,因此无需担心AI在基础模型中的应用。

【/h/]根据中国证券投资公司的研究报告,国内大规模模型的能力已逐步提高,中文领域处理和长文本处理等一些特征具有对齐和领先优势。随着Kimi热度的不断提升,国内众多大型车型厂商纷纷加入长文能力的竞争,产业消费落地加速。中国大规模模型应用元年已经到来。

【/h/]模型成熟后,未来的大模型将在产品和应用层展开新一轮的竞争和角逐。李彦宏的演讲也吸引了更多的应用层开发者选择文心大模型。

【/h/]在此前的百度2023年第四季度及年度财务报告电话会议上,李彦宏透露,百度AI Cloud第四季度总收入为84亿元,其中大模式为云业务带来约6.6亿元的增量收入。

【/h/]目前文心模式日调用量已超5000万次,季度环比增长190%。去年12月,约有2.6万家企业致电文新大模,环比增长150%。三星、荣耀、汽车之家等公司均与百度达成合作。

【/h/]自发布以来,百度不断降低文心大模型的推理成本,已降至去年3月版本的1%。

【/h/]李彦宏还表示,在未来,多模态或多模态融合,如文本到视频,是基础模型开发的一个非常重要的方向,也是AGI(通用人工智能)的一个必要方向。百度已经在这些领域进行了投资,并将在未来继续投资。

相关文章

大力开拓海外市场,中国银河实现对东南亚子公司100%控股

大力开拓海外市场,中国银河实现对东南亚子公司100%控股

界面新闻记者|陈静 1月12日,中国银河证券官方微信官方账号发布公告称,公司已通过其海外子公司银河国际完成对银河集团私人有限公司(简称:银河集团)持有的银河-联昌证券国际私人有限公司(简称:银河-联...

兴业证券获批发行不超过200亿元公司债,年内券商发债累计募资逾1.3万亿元

兴业证券获批发行不超过200亿元公司债,年内券商发债累计募资逾1.3万亿元

界面新闻记者|孙艺珍 11月24日,兴业证券发布公告称,近日收到中国证监会对公司向专业投资者公开发行公司债券的注册核准,核准公司向专业投资者公开发行面值总额不超过200亿元的公司债券的注册申请。 1...

一周新车盘点|保时捷推出首款混合动力911 北汽制造新一代212正式亮相

一周新车盘点|保时捷推出首款混合动力911 北汽制造新一代212正式亮相

【/h/]【/h/]【/h/]BAIC制造的新款212正式亮相。【/h/]6月6日,BAIC制造正式发布了全新的212车型,即新BAIC制造212。作为经典212车型的新一代车型,这款车在保留之前传统...

泰安银行被泰安华通非吸案“流言”误伤,泰安政府紧急公告辟谣

泰安银行被泰安华通非吸案“流言”误伤,泰安政府紧急公告辟谣

【/h/]界面新闻记者|张晓云【/h/]3月13日,泰安银行微信公号转发泰安市人民政府发布的公告。【/h/]公告称,自2024年3月12日起,泰安银行部分营业网点储户集中办理业务,由于人员多、业务量大...

下一步国企改革任务明确:涉及考评体系、自然垄断行业改革 | 解码三中全会

下一步国企改革任务明确:涉及考评体系、自然垄断行业改革 | 解码三中全会

记者袁昕新华社7月21日受权全文播发《中国共产党关于进一步全面深化改革推进中国现代化的决定》(以下简称《决定》)。作为进一步全面深化改革的重点内容之一,国企改革明确了一系列具体任务。【/h/]《决定》...

网红烘焙工作室ABC Cooking Studio大陆门店一夜之间全关

网红烘焙工作室ABC Cooking Studio大陆门店一夜之间全关

界面新闻记者 | 李烨 界面新闻编辑 | 许悦 网红烘焙料理教学品牌ABC Cooking Studio一夜之间关闭了中国大陆所有门店。 据社交平台一份流传出的品牌公告,ABC Cooking St...