才上线7个月,它凭什么成了国内AI搜索“鼻祖
可能你还没啥感觉,但最近有一个玩意,让头部企业和大佬们都抢疯了。从抢光了谷歌风头的NewBing炸裂登场,再到让英伟达黄仁勋都成忠实迷弟的Perplexity,随随便便就是5亿估值。甚至最近,连老大哥OpenAI也被传在偷偷下场。总而言之,就是很卷,很火,很抢手。有些敏锐的差友应该已经猜到了,它就是AI搜索。哎,这就让差评君好奇了,海外一片火热,那国内是谁最先想到要搞AI搜索的呢?于是,就随手在Perplexity和谷歌的Gemini上搜了下:中国第一个AI搜索产品是什么?
结果让人有些意外,出来的居然不是那些老牌的熟面孔,而是昆仑万维在2023年8月发布的天工AI搜索。
Perplexity
谷歌Gemini
有点不相信的差评君,又试了国内好几家AI搜索产品。结果,这些同行们异口同声报出的答案,还是它。。。
抖音豆包
文心一言
差评君去翻了翻资料,发现就在前两天QuestMobile发布的AI报告里,天工默默干到了国内AI独立应用月活前三,坐拥八百多万的月活。
其实天工AI能有这么多用户,差评君并不惊讶。就拿差评君来说吧,以前一个选题总要在搜索软件里泡上一两天,才能动笔,还得时刻提防那些隐藏的广告。被传统搜索折磨惨了的我们,早就是人手几个AI搜索了。
每篇稿件都有一份整理的资料文档
真正让差评君惊讶的就是,天工AI是怎么从众多同行里脱颖而出,成了圈子里的头牌的。其实天工AI是咱们的老朋友了,早在去年8月份首发的时候,差评君就上手过了。以差评君的使用次数,那绝对可以说是看着天工AI长大的。不过才短短半年时间,他们就又铆足了劲交了个天工大模型3.0的全新版本出来。在差评君抢先体验后觉得,这次更新可谓是脱胎换骨,甚至值得咱们再拿出来细细咂摸一番。因为在很多中文场景下,它表现得比Perplexity还要不俗,更适合中国宝宝体质。
就这个话题热搜,就太对胃口
我们简单试试,就能明白差评君在说什么了。差评君就问了一个看似简单的问题:OpenAI要做AI搜索的信息源头是什么?传统搜索这边,跳出来一堆文章不算,我翻遍了前两篇,也没找到OpenAI是哪家媒体先爆料的。但对天工AI来说,这题简单得够呛。不仅直接点出是TheInformation最先报道,还拓展补充了很多相关信息。
天工AI
让我有些意外的是,把同样的问题丢给Perplexity。它却明显理解错了我的语义,把报道信息源理解成了OpenAI搜索技术提供的源头是什么。
Perplexity
后面差评君又追问了一道比较难的题目,让它们试着给我推荐餐厅。以前试过NewBing的人,肯定知道这种实时的问题,向来是AI搜索的软肋。还有什么天气情况、路线规划等等。但对于现在的天工AI来说,真的就是切瓜砍菜。它抓取信息非常精准,甚至会帮你从视频里扒答案,就比如找到抖音上的美食推荐。
相对来说,Perplexity的表现肉眼可见的略逊一筹。给我“贴心”地推荐了in77地下车库,还祝我用餐愉快。到这里,你就能感觉到在中文和国内的实时信息上,天工AI要强出一截。如果你觉得这样还不满意,别急,天工还上新了增强模式。开启之后,会大大提高回复质量。即便一次性甩过去好几个问题,它也能逐一拆分出来。
甚至会对一些模糊的问题,做进一步的提问引导。尤其适合解决一些复杂问题,像之前差评君做过一期B站视频,讲古代人是怎么测绘地图的。这个题,我们前前后后大概花了一周的时间。但甩给天工AI,它可以瞬间帮你总结出起码4个大类的信息。
如果你还不满意,我们还可以进一步追问,直到把问题梳理清楚。
除了把基础实力打磨得更扎实,在国产厂商们擅长的用户体验上,天工AI也花了不少心思。差评君用下来觉得很舒服,像很多问题大模型给一堆文字,不如一张图片来得清晰明了。所以,除了文本回答之外,天工AI的回答还会附带图片、甚至是视频。
如果是一些涉及对比的问题,比如两款手机对比、旅游城市对比,天工AI可以自动做出一张对比表格,好坏优劣一目了然。
之后,还会新增搜图片、搜视频、搜音频的垂直能力,以及更多具有实用性的展现形式。差评君这里就不一一展示了,留给大家自己去上手。
研究模式和思维导图输出
看到这,很多差友可能会好奇。士别才三日,怎么就得刮目相看了?自己还停留在NewBing时代呢,这才半年时间,天工AI就把水准往上拔了大一截了?不仅检索精准度变高了,连视频都能扒了,也不像曾经大部分AI那样一本正经胡说八道了。其实秘密就藏在昆仑万维这次新上的两个狠货里,也是两个目前圈子里大热的前沿技术架构,一个是MoE,一个是RAG。你不要一听到专业术语就慌,差评君一分钟就能给你讲明白咯。
首先是这个MoE,也叫混合专家模型。顾名思义,就是内置了数个专家模型的大模型。
举个例子吧,比如我们输入:金毛火锅今年7岁了,未来五年内会不会得糖尿病?这一个小问题,其实涉及了性别、年龄、品种、糖尿病的成因等各种方面。
天工AI就会把它拆分成一个一个小任务,再由一个专门负责分配的模型,把任务下发给手下最擅长的专家模型。比如有的研究性别,有的研究品种。这跟咱们写文章很像,像小发擅长写游戏,世超挖掘好用的软件更有一套。把专业的事交给专业的人办,才能把效率和效果都拉满。而且,那些用不着的模型还能中途偷个懒,把算力节省下来。这边有专业团队负责输出内容,那边昆仑万维又准备了RAG技术,来负责把控大模型的知识库。这个RAG技术理解起来其实更简单,就是检索+文字生成。
以前我们提出一个问题,大模型会直接拿着这个问题去茫茫大海中打捞信息,然后直接输出结果。但RAG在交给大模型生成答案之前,还多了一步单独的检索步骤。先拆解我们的问题,然后找到大量相关的信息和内容,比如金毛的体质、糖尿病的生成原因等等。再从这些内容里,检索出和关键词最相关的信息。把这些信息和我们的问题,一起整理出一份新的、更专业的Prompt,最后才会喂给大模型去输出内容。这多出的整理步骤,不仅提高了信息查找的效率,也让每一个回答,也都有可以追溯的源头,减少大模型出现幻觉的概率。这个技术,早已经在慢慢取代那些简单的问答bot机器。
也正是装上了这两个最前沿的技术,使得天工AI和传统搜索,甚至是初代AI搜索的差距越拉越大。在MEET智能大会上,昆仑万维董事长兼CEO方汉曾经分享过一组对比数据。传统搜索的时代,我们输入一个问题,然后再去阅读大量网页,最后分析总结出结果,这个过程一般耗时3-10分钟。任何人都很难再缩短这个时间。但在大模型时代,每次获取结果的时间,可以被压缩到5-10秒。在这样的高效率面前,传统搜索们给AI搜索让路,是一个必然的结果了。虽然现在取代传统搜索还为时尚早。但由奢入俭难,用过了这种高效的AI搜索模式,就很难再换回去。搜索引擎的下半场,注定要进入高效的AI时代。以天工AI为代表的生成式搜索模式,将会后来居上。虽然说不好谁能笑到最后,但谁先入场,站稳脚跟,也就赢了一半了。平静了30年多年的搜索引擎市场,恐怕要迎来一场变革。
文章来源:差评