腾讯混元大模型负责人刘煜宏:腾讯做大模型不争一时之先

时间:2024-06-02 12:52:51 编辑:

导读 【腾讯混元大模型负责人刘煜宏:腾讯做大模型不争一时之先】具体的是什么情况呢,跟随小编一起来看看! 5月30日,腾讯推出基于混元大模型的...

【腾讯混元大模型负责人刘煜宏:腾讯做大模型不争一时之先】具体的是什么情况呢,跟随小编一起来看看!

5月30日,腾讯推出基于混元大模型的App“腾讯元宝”,主要面向工作场景,提供AI搜索、AI总结和AI写作等核心能力,同时面向日常生活场景新增创建个人智能体的能力。

从去年底至今,众多头部大模型厂商和创业公司都推出了面向C端的App应用,腾讯的入局时间并不算早,考虑到腾讯拥有国内数一数二的C端用户体量,这个决定让人有些意外。

腾讯云副总裁、腾讯混元大模型负责人刘煜宏在采访中给出了官方的态度:“腾讯做大模型不争一时之先。”

因为按照腾讯的估算,目前国内大模型应用日活跃用户渗透率还不到1%,比同行慢几个月推出App也没什么影响。

在混元大模型发布至今的九个月时间里,腾讯在技术架构上做了比较大的升级,从最初的通用专家稠密大模型,变成了如今的MoE混合专家架构,打开了混元大模型参数量的天花板。

“从测试数据看,能力提升超过50%”,刘煜宏介绍称,升级之后,腾讯混元大模型的参数规模已从千亿提升至万亿,预训练语料从万亿提升至7万亿tokens。

在腾讯元宝上线之后,绝大多数头部大模型产品都已经推出了独立的C端应用,业界推动AI落地的共识也进入了新的阶段。

虽然市面上与大模型相关的AI应用有很多,而且每家产品都说自己有几十万或者几百万DAU,但刘煜宏认为,在去重之后,这些应用合并到一起的DAU也就几百万,对比国内的12亿移动互联网用户规模来说,用户渗透率还不到1%。

看似火热的技术和产品,渗透率为何如此之低?

他给出了两个原因:一个是大模型从ChatGPT 3.5问世开始大火,至今也就不到两年时间,大模型技术的发展处于早期阶段,产品能力不足,距离企业和用户需求又很远,导致大模型的落地能力较弱。

另一个原因是公众对大模型的认知度不够。虽然很多企业、开发者和用户都知道大模型很厉害,但具体怎么用它,大部分人都不知道。

腾讯与很多企业的CTO或技术负责人都聊过大模型的应用场景,很多人的第一反应还是智能客服,应用落地的探索路径很窄,说明在用户教育层面还有很长的路要走。

所以刘煜宏认为就算腾讯元宝的发布时间晚了几个月,拉长时间看也不是什么重要的事情,“(大模型应用的)渗透率不到1%,先发优势也就百分之零点几,这个优势微不足道。”

腾讯不着急的心态从“打榜”这件事上也能体现出来。

“我们看到很多榜单,(有些模型)天天刷榜,但是对用户有用么?”腾讯并不太关注榜单,也不太参与评测,很多时候“看到媒体报道才知道我们被评测了”,刘煜宏表示。

今年以来,字节跳动旗下的豆包以及月之暗面的Kimi等应用,都投入不少资金用于买量,进行付费推广以及广告投放。

刘煜宏对此表态称,买量营销不是腾讯元宝现阶段的主要目标,“甚至对标竞品拉高整体规模也不是我们现阶段的目标。”

同样,因为当下大模型应用的渗透率非常低,现阶段去谈整个行业的商业化也为时尚早,“还是个摸索的阶段。”

未来一段时间,腾讯元宝的重心会放在串联腾讯内部的核心产品(比如微信公众号和小程序)通路,以及优化更多垂直行业(法律、金融和医疗等)的大模型应用体验。

因为腾讯元宝主要面向工作场景,所以在信息获取、处理和生产三个环节进行了针对性优化。

在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,同时内容覆盖微信公众号等信源。

在AI总结方面,腾讯元宝可上传最多10个PDF、word、txt等多格式文档,一次性解析多个微信公众号链接、网址,支持256K的原生窗口上下文,相当于一本《三国演义》或英文版《哈利波特》全集。

很多大模型都说自己有千万文字的长文能力,刘煜宏认为这个技术上不是问题,腾讯混元大模型也支持,但用户没什么需求,“谁会扔一千万的文字给它,256K长文足以支持99%的需求。”

在AI写作方面,元宝不仅支持多轮问答,还能够将对话的内容整理成报告,按照要求进行结构化输出。

此外,目前腾讯元宝还提供了AI头像、口语陪练和智能翻译等生活场景中的常见应用,它们大多由第三方开发者完成。

根据公开信息,腾讯内部有超600个业务及场景都已经接入混元大模型,其中包括腾讯广告、微信读书、腾讯会议、腾讯文档和腾讯客服等都已经基于混元进行过升级,内部业务每日调用次数已经超过2亿次。

这被刘煜宏称为混元大模型最大的优势之一。他认为腾讯的产品覆盖领域非常全面,大模型在内部落地时应用的场景也很广泛,其它产品无法遇到的问题,混元都已经遇到并且解决了。

混元底层的腾讯自研Angel分布式系统架构,也被视为腾讯的优势之一。

与行业内很多大模型产品相比,“腾讯的产品工程能力比较强,技术演进比较早”,刘煜宏表示,“同等情况下我们的成本更低、表现更好。”

此外,在5月中旬,腾讯刚推出一站式智能体创作与分发平台“腾讯元器”,主要面向企业用户和开发者群体。

该平台能提供丰富的官方插件和知识库,支持用户低门槛创建智能体。该平台支持用户以API形式将智能体分发至各类场景,免费token额度从此前的100万提升至1个亿。本次发布的腾讯元宝也支持用户和开发者自建智能体的操作。

“腾讯自己不会做太多智能体”,刘煜宏表示,“更多还是希望(第三方)开发者用它去创作。”

转载来源:界面新闻 作者:崔鹏CP

以上就是关于【腾讯混元大模型负责人刘煜宏:腾讯做大模型不争一时之先】相关内容!

标签:

免责声明:本文由用户上传,如有侵权请联系删除!

© 2008-2024 All Rights Reserved .乐拇指 版权所有

网站地图 | 百度地图 | 今日更新