有人说,互联网让信息获取的边际成本为零,而大模型的发展让AI能力获取的边际成本不断趋向于零。在这场让AI获取边际成本趋向于零的大模型新浪潮中,众IT公司都在寻找理想照进现实的更优路径。最近,人工智能创业公司天壤发布的“大模型产品组合拳”,让我们看到了其另类的大模型落地逻辑。
在刚刚结束的2023年世界人工智能大会上,天壤发布了三款大模型产品,同时,启动“蓝鲸计划”,免费提供联合办公场地和一部分资金支持,招募开发者联合研发AI创新应用,打造一站式大模型应用开发体系,目标是让AI成为像水电煤气一样的基础设施。
(相关资料图)
现在,席卷全球的大模型浪潮正从追逐模型参数进入到比拼落地阶段,而大模型落地行业目前面临几大挑战。一大模型可能会产生一种“幻觉”,导致其胡言乱语;其次,政企数据具有保密性要求;第三,缺乏可靠的企业级中文大模型;第四,大模型的封闭性,无法进行自我更新。
天壤创始人兼CEO薛贵荣在创立天壤之前是阿里云的MVP,负责研发阿里搜索引擎,在加盟阿里云之前是上海交通大学计算机系副教授,专注于机器学习、大规模数据分析等研究,这样的背景让薛贵荣在云与AI领域都有丰富实战经验,既了解行业用户,又懂得如何协同产品发展。
2016年,因为AlphaGo击败李世石,触动了薛贵荣组建天壤公司,在者一年薛贵荣离开阿里云创立了天壤。这几年,天壤有两大突破为外界关注:一是利用人工智能解决城市级交通问题,助力南昌成为全国首例从交通“限行”到“不限行”的城市。二是发布了蛋白质折叠大模型TRFold和全国首个蛋白质设计平台TRDesign。前者是复杂系统解决现实难题,而后者是破解蛋白质折叠难题,前者是“现实”后者是“理想”,都是AI领域大家想做的事情。当大模型浪潮来临,这样背景的天壤不可能不参与其中。
薛贵荣认为,要让大模型真正变成人人都能用的“水电煤气”,需要一系列的模型产品“组合拳”,为此天壤推出了包括大语言模型、语义搜索引擎和开发平台三款产品的“天壤小白”,三者共同构成为开发者打造的全栈式支持体系。从这三款产品来看,大语言模型是核心基石,语义搜索引擎是解决持续数据喂养与模型幻觉问题,而开发者平台解决的则是模型应用开发生态的问题。
首先看天壤的通用大语言模型。其拥有1860亿参数的大模型(目前GPT3.5拥有1750亿参数),具备面向多语言的对话互动、知识问答、逻辑推理等核心能力,能够理解复杂的上下文信息,并根据先前的对话内容做出精准回应。
除了大部分通用语言大模型所具备的基础功能,天壤小白大语言模型有更多实用能力。
比如与用户问答时加入了人类的语气,使问答流程更人性化,更适用于智能客服等对话应用场景。在逻辑推理方面,小白能够给出令人出乎意料的精彩 ,比如面对刁钻的难题:“如何用250美元购买标价300美元的高档自行车”,小白的回答是:“与店员谈判降价”或者“以200美元购买一辆普通自行车,再用50美元升级配件”。
在实际调用过程中,为了解决语言大模型使用成本的昂贵问题,天壤小白提供了不同版本的模型选择,分别有1860亿参数大模型(FP16)、(INT4),和7B参数的较小规模大模型。
其次是天壤的搜索引擎。如何解决大模型可能存在的\"幻觉\"现象,天壤给出的解决之道是将大量知识库和行业数据,整合到模型中,通过预置文档的嵌入(embedding)方案,从而规避大模型的\"幻觉\"问题。而这个嵌入(embedding)方案实质上是通过语义搜索引擎,将领域知识和数据与大模型进行对话,以提供更准确、可靠的结果。
再者是天壤是大模型应用开发平台。天壤认为,仅靠有限的底层大模型提供商,让AI能力变成水电煤的公共服务还比较难,还需要庞大的开发者群体,开发各种AI应用,降低大模型门槛,但今天的开发者们往往得到的信息是零散、破碎,需要穿梭于各种工具并得具备很强的技术积累。所以天壤推出小白应用开发平台希望能够解决这一问题。
据介绍,天壤小白应用开发平台采用可视化的界面,所见即所得,用户在平台左侧栏目输入预置的提示词(prompt)后,当即就能在右侧栏目测试应用效果,确保应用效果符合预期。整个创建过程耗时不超过十分钟。即使是一位完全不懂AI的用户,也能在平台上轻松创建AI应用。
另外,如果开发者需要对大模型输出结果精准调控,随时可以启动大模型选择、引擎配置、增加上下文、预置知识库等功能,使应用效果更符合业务场景需求。
与此同时,应用开发平台还集成了文档库上传功能,使得各类文档分析以及办公类AI应用得以成型,还使得开发者能够针对本地文档进行实时分析、摘录,有效地突破了语言大模型体语料封闭的问题。
目前,天壤小白应用开发平台已经对外开放预约试用。用户可以按需配置不同的应用场景,也可以在平台的应用市场直接调用系统内置的不同场景。
除了从平台与工具,天壤还推出“蓝鲸计划”,通过免费提供联合办公场地和一部分资金,与开发者生态携手进行联合创新,希望加速AI创新应用落地。
薛贵荣说,让每个人都有一个AI大脑是天壤一直坚持的方向和目标,要在这个目标下找到对的方法论才能够更好地破题。事实上。今天我们看大模型落地的核心挑战,就是如何让模型能够生成精准的高质量的数据,而生成高质量数据的能力一直是天壤的优势。(文/李佳师)
关键词: