返回
首页 > 数码科技

2024WAIC闭幕,我们整理了场内场外的AI辩论“修罗场

时间: 2024-07-12 本站作者

在最近闭幕的2024WAIC上,除了“十八金刚”人形机器人集体出道,“百模大战”热度不减,更有各位业界大佬们的重磅发言。那么,围绕大模型和AI应用,有哪些精彩的观点碰撞?真理越辩越明,适道总结了大佬们的会上发言,以及近期采访,看看能够为你带来哪些启发。

2024WAIC闭幕,我们整理了场内场外的AI辩论“修罗场

大模型——开源智商税VS闭源终被追上

你是开源派还是闭源派?

开源派代表马斯克认为,AI大模型共享代码是一切的前提,不但可以促进技术的发展和透明度,还防止AI被少部分人群垄断;闭源派代表Sam Altman主打,坚持闭源,延迟开源,追求商业利益最大化。

具体而言,在创新速度、专业性上,开源优于闭源;在性能突破,数据的多维度,以及通用性上,闭源优于开源。即,开源的最大优势是技术共享、推动创新;闭源的最大优势是商业化,集中人才、资本力量,只为提高性能。

如果按照“打蛇打七寸”的思路,想证明开源“不可行”只要证明“开源其实不open”;想证明闭源“不可行”只要证明“闭源其实不会永远领先”。

有趣的是,正反两方均提出了对应观点。

在2024WAIC上,李彦宏断定:模型开源和代码开源是两个概念,模型开源只能拿到一堆参数,做不到真正的共享;

在此前采访中,朱啸虎表示:开源模型最终会赶上闭源模型,因为开源有更广泛的贡献者和验证。周鸿祎也站开源:如果企业能够专注于特定领域,并利用其独有的数据资源进行深入的专业训练,那么这些模型完全有可能在特定领域的能力上超越GPT-4。

具体来看,双方有哪些激烈碰撞?

闭源派:百度CEO李彦宏

观点:开源其实是一种智商税。

原因一:开源能力不够。开源模型在参数规模相同的情况下,能力通常不如闭源模型,如果开源模型想要在能力上追平闭源模型,就需要更大的参数规模,这将导致更高的推理成本和更慢的反应速度。

“我觉得,开源其实是一种智商税。当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”

原因二:开源不是真开源。使用开源模型进行个性化改款,可能会创造出孤本模型,这些模型既无法从基础模型的持续升级中获益,也无法共享算力。

“很多人混淆了模型开源和代码开源的概念,模型开源只能拿到一堆参数,还要再做SFT、安全对齐,即使是拿到对应源代码,也不知道是用了多少比例、什么比例的数据去训练这些参数,无法做到众人拾柴火焰高,拿到这些东西,并不能让你站在巨人的肩膀上迭代开发”。

捍卫者1:月之暗面创始人杨植麟

观点:开源模型不会缩小与闭源模型的差距,闭源模型会持续领先。

“AI和其它领域不同,开源没有算力验证,没有人力和资本聚集,开源追不上闭源”

“像OpenAI一样的闭源是通往Super App的唯一通路,而开源只是 ToB 的获客手段。”

捍卫者2:前OpenAI首席科学家Ilya Sutskever

观点:几年后,每个人都会清楚,开源是不明智的。

“短期内,开源的价值在于帮助公司生产有用的产品,允许用户成为他们希望使用模型的最终决策者,决定如何使用模型以及支持哪种用例。但在某个时候,人工智能AGI会非常强大,令人难以置信,那么开源是没有意义的。”

开源派:阿里云CTO周靖人

观点:通义千问拉平了开源、闭源模型之间的差距。

“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”

捍卫者1:360创始人周鸿祎

观点:如果企业能够专注于特定领域,并利用其独有的数据资源进行深入的专业训练,那么这些模型完全有可能在特定领域的能力上超越GPT-4。开源社区拥有的工程师和科学家的规模远远超过闭源机构,数量级达到数百倍。尽管开源大模型仅发展了一年,但其能力已超越了GPT-3.5。

“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”

捍卫者2: 金沙江创投主管合伙人朱啸虎

观点:开源模型最终会赶上闭源模型,因为开源有更广泛的贡献者和验证。

“在美国,闭源模型和开源模型的差别可能没有那么大,当然还是大厂的闭源模型比较领先,所以他们的目标也比较远大。很多美国大企业现在采用的方案也是在私有云上部署,用开源模型部署企业的大模型,然后用自己的数据进行垂直优化,这样能保证自己数据的隐私。

国内也是一样的,很多大企业尤其是一些央企,私有化部署不是在私有云上,而是彻底的私有化部署,然后同样用开源模型,用自己的数据进行调整。用开源模型最主要的好处能保护自己的数据。中国创业企业最好也是拿开源模型来训练,可以保护自己在垂直场景的数据。”

中间派:百川智能 CEO 王小川

观点:关于开闭源之争,核心是要看谁在开源。从To B角度,开源闭源其实都需要。二者不是竞争关系,而是在不同产品中互补的关系。

未来80%的企业会用到开源的大模型,因为闭源没有办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。两者不是竞争关系,而是在不同产品中互补的关系。

总结:对于大模型开发者而言,开源是远期理想,闭源是短期现实。全球科技“投资之王”Vinod Khosla表达过对开源的担忧:“训练成本确实高了一个数量级,这正是我认为开源不可行的原因。”

根据斯坦福 HAI 研究所最新发布的AI Index报告。

第一,在所有选定的基准上,目前闭源模型的表现均优于开源模型。

第二,随着时间的推移,模型训练成本急剧增加;对计算训练需求更大的模型需要的训练成本只会更多。

这些对于开源大模型厂商不是一个好消息:方向或许是正确的,未来或许是光明的,但道路一定是曲折的。

如何安全地快进到技术迭代曲线不再陡峭的那天,是开源派需要共同克服的难题。

话说回来,先抛开模型能力,从产品体验上来看,闭源大模型还没有一骑绝尘的优势。

Al数智源根据Similarweb数据统计出,无论是6月第四周访问量,还是近28天访问量,天工AI搜索 昆仑万维 开源 Kimi 月之暗面 闭源 文心一言 百度 闭源。

应用——衡量“超级”不看DAU

首先,大佬们的共识是,注意力要放在应用层。

李彦宏迸发了金句“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”他呼吁,业界应将关注点从模型本身转移到应用上,关注如何通过大模型开发出满足市场需求的AI应用。

商汤科技董事长兼CEO徐立:应用是决定人工智能超级时刻的一个关键。

“我的中学的退休的老师不停地在群里问我,怎么用人工智能去写文案、生成祝福的图片,发到他的退休群里等等。我突然想到,其实超级时刻和应用是互相成就的。只有超级时刻带来的认知变化,最后才能推动应用。倒推回来,如果我们有应用作支撑,那么我们现在这个时刻就是超级时刻。所以,应用是超级时刻的关键。”

华为常务董事、华为云CEO张平安:要敢于开放行业场景,让人工智能在行业应用上领先。

“我们不能把AI基础设施依赖于是不是有最先进支撑的AI芯片,如果没有,我们就没办法在AI上领先,这个观点必须要摒弃掉。”

其次,超级应用长什么样?大佬们的共识:至少不长ChatBot样。

李彦宏称,要避免掉入“超级应用陷阱”。

即,移动时代的逻辑是一个DAU 10亿的APP叫成功;但在AI 时代,“超级能干”的应用比只看DAU的“超级应用”更重要。只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大的多。

该说法也有道理。比如,在一众ChatBot应用中,似乎只跑出了ChatGPT,其成功是基于领先的GPT系列大模型。其他数据非常美好的Pi和Character AI,一个已经被微软生吞活剥,另一个被爆资金断裂,计划卖身谷歌和 Meta。显然,实现商业化是成为“超级应用”前必须解决的问题。

在BI近期采访中,Foundation Capital的Moore表示,不是每个产品都需要ChatBot,自己早已疲于应付拿着通用用例找投资的创企。创始人要先关注能解决的问题,然后再选择相应的技术。

那么,超级应用的轮廓该如何勾勒?

李彦宏非常看好智能体AI Agent。“在大模型的加持下,只要用人话把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,比互联网时代制作一个网页还简单。”——医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自己的场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。

商汤科技董事长兼CEO徐立:像 GPT 带来的聊天式的应用,Sora 带来的视频应用,但它还没有到超级时刻,是因为没有真正走进到一个行业垂直应用当中、引起广泛的变化。他补充道,超级时刻和应用是互相成就的,只有超级时刻带来认知的变化,最后才能推动超级应用。

MiniMax 创始人兼CEO 闫俊杰的观点是:杀手应用至少要在三年之后。

“在 AI时代最大的应用,我觉得还是挺有机会的,但是当前 APP 肯定还没那么大。我觉得可能要3年后可能才会有大众化的东西,但没关系,当你能做到第一个,然后你的能力变强、资源变多、技术能力变好,有可能大概就可以做。同时,这个东西就一步步来,然后我认为Killer App至少三年之后。”

智谱 AI CEO 张鹏对“三年期限”有不同的看法。

“也许明天就有,这个事情需要综合考量不同因素,一个是技术本身的成熟度,第二个是市场和用户本身是否准备好。第三个是需求的发掘,然后甚至还加上有一点点运气,变量太多,很难用我的大脑这么简单的一个神经网络去预测这种事情。”

他认为:Google从成为世界第一的搜索引擎,到探索出成功的商业落地的路径,花了6 年。Meta,原来的 Facebook,同样也花了6年。这件事就像我们小时候玩打砖块的游戏,你想要瞄准缝隙,很精准地打到一个缝隙里。这件事情首先得找到缝隙在哪儿?路径在哪儿?很多事情要前赴后继地去探索,这个过程就很重要,不要只看到最终的结果,更重要的是我们采取行动,这才是目前大家更应该关注的事情。

不过,张鹏也给出了自己对“缝隙”的认知:一个很重要的点是去突破大模型的多模态。

“为什么要多模态?是因为真正的人在现实世界中解决问题的时候,他需要的、输入的信息本身就是多模态的。比如说我们希望它帮助我们去扫地、做饭、洗衣服。其实这些任务,你不要小看这些任务,它所需要输入的信息是非常多模态的,所以这些方面能力的突破会带来 AI 的普惠,AI 更大的这种可能性。”

第三,机会在大厂,还是在于创业者?

大厂派:中国工程院院士、阿里云创始人王坚

观点:人工智能对大公司更友好,草根创业变得很难。

王坚认为,互联网具有草根性、对资源的依赖少,但是人工智能对资源具有很强的依赖性——大量的数据、计算能力和专业知识,这些往往需要昂贵的投入和长期的积累。这种资源密集型的特点使得AI对大公司更为友好,而草根创业者则面临更大的困难。面对AI,小企业跟大企业的差别是,大企业一定会觉得AI是工具的革命,小企业一定会觉得这是革命的工具。而如果大公司也有“革命的工具”意识,那么划时代的影响就来了。

“以苹果公司举例,苹果是拿AI去服务C端的客户,在我看来事实上是人工智能技术重新重构了苹果这家公司。只要是一个新的技术,一定会有新的大公司出现,没有新的大公司出现,它是不是一个颠覆性的技术要打一个问号的,这是第一个逻辑,同时也一定会有大公司是烈火重生的。”

“不好说”派:著名风投NFX

观点:谁的赢面更大取决于定位哪些市场采用何种策略。

大厂优势——资金、人才,可以复制创企产品,利用现有分销网络推广产品;

大厂劣势——大企业病,抵触变革,龟速创新。

创企优势——速度,但几乎只有速度,几个创始人组成一个小团队,迅速决策并推出产品;

创企劣势——缺钱,一般也没有稳定的客户群体。

NFX提出了AI同时具备“颠覆性创新”和“持续性创新”的特点,实际上分别对应王坚所说的“革命的工具”和“工具的革命”。

“颠覆性创新”有利于初创企业,灵活且愿意承担风险,能够创造出全新的市场和服务,例如Uber颠覆了原有的出租车企业;ChatGPT可能颠覆搜索市场;

“持续性创新”,有利于现有企业,更容易锁定市场,聚焦于改进、加速或完善已有的市场和服务,例如Facebook用AI广告定位,Google用AI优化搜索引擎等等。

对于创业者而言,需要思考在自己所瞄准的行业中,AI带来的主要影响是颠覆性or持续性?以及,你的产品和市场更适合颠覆性创新,还是持续性创新?

如果是前者,你就必须提供真正,具有颠覆性的价值主张,开辟新的市场,破坏现有的商业模式,或创造全新的、难以想象的体验,就像 Uber和Lyft。

需要做到:1、在“龟速”行业中开展业务,不要选“营销”这类易攻难守的;2、比旧方案好100倍;3、发挥速度优势,在率先获得重要专有数据的市场开展业务,包括寻找非结构化数据的脉络;4、用AI创造全新用户体验,不要让用户体验“味如嚼蜡”。

如果是后者,在有限的条件下,创企必须调整你的产品、信息和商业模式,与现有巨头并驾齐驱。例如,一些行业在引入AI后,规模也会无限扩大,催生出一些利基市场。而这些利基市场要么是现有企业无法提供的,要么是现有企业没意识到的。预测AI催生的利基市场并利用,就是初创企业的制胜之地。关键在于,认清自己所处的行业是否将经历变革,对变革内容有清晰认知。这些行业通常会围绕流程而建,核心产出保持不变,但流程可以有无限变种从而为你开辟新的利基市场。

对于国内AI创业者而言,磕应用几乎是唯一选项。所以,比起听一耳朵“唱衰论”,不如想想如何在通用大模型的底座之上,利用自身行业资源,找场景,接地气。可以预见,在众多细分赛道上,或许不是大厂和创企竞争,而是创企之间百舸争流,而这势必又会拉起争分夺秒的比赛。

本文来源:腾讯科技

猜你喜欢

版权所有 Copyright©2023 餐饮美食网 版权所有

粤ICP备15109582号

联系邮箱:hueiji88@gmail.com