周鸿祎谈“百模大战”：弯道超车的关键在发展多模态|世界热文

本文来源：时代周报作者：唐洛

(资料图)

“作为搜索引擎厂商，我们发展大模型不该是等到ChatGPT火了才跟进。”6月13日，在三六零（601360.SH，以下称“360”）智脑大模型发布会现场，创始人周鸿祎在谈到大模型行业时说道。

周鸿祎继续称，包括360在内的搜索引擎公司，都应该抽自己耳光，因为早在多年前就开始发展大模型，但只顾解决眼前问题，忙着做场景结合，“如果那个时候有员工提出要做通用型人工智能，我想无论是周总、李总还是马总，给出的答案都是：滚一边去。”在他看来，应该感谢OpenAI的执着，给整个AI行业指明了正确的方向。

对于国内大模型和国际上的差距，周鸿祎也表达了信心。“原先我曾说国内大模型和国际差距有一两年，现在我收回这句话，中国大模型的发展速度已经基本赶上国际先进水平，整体的基本水平已经赶上GPT-3.5，追赶GPT-4的速度也超过自己的想象。”

周鸿祎提到，今年年初，在ChatGPT发布后，中国已经进入百模大战，各家企业都发布了自己的大模型产品，这三个月相当于人工智能行业过去的三十年。

在这场发布会上，周鸿祎把下半场的重点放在了360智脑大模型的多模态能力和应用场景上。360AI数字人背后是“360智脑4.0”，提供多模态能力支撑。周鸿祎表示，GPT时代中国自研大模型弯道超车的关键在于发展多模态。

国内首发“文生视频”多模态能力

当天，360发布了旗下“360智脑大模型”的4.0版本。周鸿祎表示，4.0版本有三个关键词：多模态、全端应用、数字人。

周鸿祎介绍，认知型通用大模型“360智脑4.0”具备生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态（文本生成图像）十大核心能力。这十大核心能力已通过中国信通院“可信AIGC大语言模型基础能力”评估。360智脑是国内首个通过中国信通院该项权威评估的大模型产品。

“OpenAI的ChatGPT最先体现出强大的文字生成能力，中国企业追赶GPT大模型的速度很快，目前各家企业在文字生成方面的能力已经实现国际领先。预计GPT-5全面支持多模态能力，中国自研大模型弯道超车的关键在于发展多模态能力。”周鸿祎称，在多模态方面，360已具备跨模态生成能力，包括文生文、文生图、文生表、图生图、图生文、视频理解等功能。

他进一步解释，多模态能力是给大模型增加上眼睛、耳朵、鼻子、嘴巴，而不仅仅只有大脑。下一步，360计划将360智脑升级到5.0版本，并发布插件平台，安装上插件是要让它有手和脚的能力，这样大模型的能力才能发挥出来。“当大语言模型有了多模态能力之后，它获得的知识就不仅仅来自于文字的知识，可以来自于图片，来自于视频。”周鸿祎说。

值得注意的是，360此次还发布了“文生视频”的功能，可以使用任何文字脚本生成视频，这也是国内大模型厂商首次发布此类功能。周鸿祎在现场实时演示了360智脑是如何做出一段“无中生有”的视频，他用文字指令要求360智脑生成熊猫划船、企鹅在沙漠中洗澡的视频，就在几秒之后，就生成了一段颇为真实的视频。

AI数字人也是360本次重点发布的新产品。在发布会现场，周鸿祎与诸葛亮、孙悟空、马斯克等数字人开展实时对话问答。

其中，周鸿祎询问了“马斯克”关于“中国电动车产业是否对你构成威胁”、“如何评价推特公司”“火箭发射失败，对你是否是重大打击”等问题。

目前，360的AI数字人拥有200多个角色，分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等，让用户在与数字人的开放对话中实现与偶像的近距离接触，与先贤的思想交流。数字员工则可成为企业员⼯的知识助⼿和办公助手，提升企业运营效能。

此外，AI数字人还支持定制，生成自己的专属数字人。周鸿祎在现场创建了自己的数字人，作为360的发言人，“说对了算我的，说错了算他的。”

在周鸿祎看来，在未来的人工智能大模型的应用环节，数字人将成为人机对话的全新入口，“区别于传统数字人只能按既定脚本输出内容，360AI数字人的特点在于有记忆、有人设和性格，能够复刻思维方式和人生经历，是有灵魂的数字人。”

“我希望有一天当我要讨论一个新产品的时候，我能跟马斯克、乔布斯、诸葛亮的数字人坐在一起，让大家对我的产品提一些建议。设想一下，如果有多个数字人，有不同的人设，不同的经历，背后都是人工智能在驱动，让他们一起来帮你做脑力激荡，一起来跟你完成共同的目标。”周鸿祎觉得，这是智脑一个更大的提升，也是360提出的“one more thing”。

“百模大战”

当下，人工智能领域鲜花着锦，诸多大模型争相问世，如京东chatJD大模型、百度文心大模型、阿里通义大模型等。科技部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示，中国10亿参数规模以上的大模型已发布79个。

但各家都有自己擅长的领域，成熟的业务矩阵，且都是先拿自家的业务当做“试金石”，呈现的结果自然不同。比如阿里云将通义千问接入办公软件“钉钉”，可自动生成群聊摘要、辅助内容创作、总结会议纪要；百度的文心一言，将B端“生态圈”作为宣传和业务重点；华为云盘古大模型提出了“AI for Industries”理念。

360智脑则是融合多模态能力，试图做出一个真正的AI数字人。周鸿祎认为，多模态是360智脑在“百模大战”中突围的重要路径。

在他看来，百度、腾讯、头条、阿里、360都会在自己的固有场景里把自己的AI能力赋能。接下来真正比拼的是应用落地的能力，要思考如何让个人和企业更方便、简单地使用AI大模型应用。“大模型的价值不仅仅在于互联网场景，而是把大模型能力通用化、泛化、垂直化，和不同行业、不同企业具体的业务需求深度地融合。这样的产业机会实际上才刚刚开始，未来至少有10年的红利时期。”周鸿祎说。

目前，360智脑4.0版本已接入360全端产品，包括搜索、360浏览器、360安全卫士等。随着大模型开放内测、应用场景的逐步落地，AI赋能的或许远不只是产品本身。

“人工智能的理念还是应该以人为本。我们无论做出多么强大的人工智能，都是在为人类做有史以来最好的工具。通过工具的赋能，让个人、公司、机构都能真正地提高劳动生产率。”周鸿祎觉得，大模型应该成为人类的朋友和助手。

关键词：

周鸿祎谈“百模大战”：弯道超车的关键在发展多模态|世界热文

每日推荐

图片新闻

热度排行