深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大模型,悠然产业通用大模型多了两个要素,一是产业,二是多模态。
产业界一个奇怪的现象是,大模型越来越多,却鲜有客户试点应用。
距离ChatGPT发布已有快一年时间,而国内百模大战,仍在继续:截至2023年10月,中国已经发布了238个大模型,跻身全球大模型产业发展第一梯队。
但一系列案例显示,在C端爆火的通用大模型,仍未在B端找到落脚之处。
腾讯集团副总裁汤道生在今年6月的一场峰会上,道出了不少客户对通用大模型的担忧:“通用大模型可能还不能满足企业很多需求,比如,它不一定懂行业的专业术语,不了解企业内部的独特情况,回答会比较虚、比较笼统。”
同时,也有越来越多的客户表示,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开发能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大模型,悠然产业通用大模型多了两个要素,一是产业,二是多模态。
(考拉悠然战略定位图源:考拉悠然)
本文试图探究,通用大模型为何无法解决B端难题?产业大模型可以吗?考拉悠然大模型又是如何解决以上难题的?
产业化,大模型落地的最佳路径
在回答一切问题之前,我们先看看现阶段大模型的落地情况如何。
根据爱分析《中国市场大模型落地进展与趋势洞察》表示,目前大模型有生成场景和决策场景,相比之下,决策场景预期业务价值更高。
在生成场景中,现有大模型(多数为通用大模型)仅能覆盖到智能客服这一标准模块,其可以在能源、银行等行业快速落地。
(多行业大模型落地进展 图源:爱分析)
而对于涉及业务知识的模块,厂商表示还得自己慢慢打造:目前,施耐德电气正在工业能源降碳、财务、人力资源、维修等场景沉淀大量语料与经验。
也就是说,通用大模型普适性较高,部分标准模块能够很快在各行业落地,但一旦涉及行业知识、know-how的模块,客户便较为谨慎,打算自己来。
而在预期价值更高的决策场景中,客户对大模型的专业性要求更高。整体来说,由于各行各业对于数字化转型的重点都不一样,且多个行业壁垒极高,无法满足所有行业客户的需求:
例如机器视觉行业客户更关注提升自动化程度,希望AI能整合生产流程中的多个步骤,越过人类决策输出结果;而智能物流行业客户则更关注智能搬运环节,需要结合全自动流水线、仓储和配送机器人,让每一个物品在最短时间内送达。
而产业大模型能够满足以上企业在数字化转型中提出的极致需求:悠然大模型相关负责人表示,产业大模型是结合特定行业或领域的数据和场景进行训练的。同时,产业大模型还会针对行业特点,特定强化模型在某些领域的(如交通场景关注的视频、图像理解能力)能力,更聚焦于行业关注的场景项目。
因此产业大模型在特定行业场景下的表现会更为出色,具有更高的准确性和可靠性。
基于以上种种优势,在SCAI科技创新发展大会上,欧洲科学院院士、考拉悠然董事长申恒涛给出了自己判断:AI大模型正有着从“通用大模型”到“专用大模型”深化的趋势。
(AI大模型发展趋势图源:考拉悠然)
申恒涛院士进一步表示,通用、专用各自发挥了不同的价值。通用大模型解决基础性问题统一架构、统一模态、统一任务,而专用大模型解决专业领域知识问题,通过结合行业数据的预训练实现业务场景应用。
而迫切寻求数字化转型的客户们需要的是,更精准、更懂行、更易用的产业大模型。
悠然产业大模型的底气:更懂产业
在做好以上抉择之后,一个自然而然的问题是,客户需要怎样的产业大模型?
我们不妨从数字化转型的“重灾区”——高山路段交通感知预警场景切入,一窥市场真实需求的现状。
我们都知道的是,高山路段弯道多,同时易由于恶劣天气、道路维护与交通违规等情况导致道路拥堵甚至是事故。虽然不少道路已经部署了摄像头设备,仍需要专门的业务办事人员对视频、图片打标,进行统计分析、并逐级汇报交通异常事件,十分耗时耗力。
有着多模态技术的大模型,客户可直接省略掉交通监管业务中人工
监控视频、问题打标、统计分析、告警触发、事件归因等诸多繁琐环节:其能够把一切图片、视频都自动转化为可读的文字、可统计的数据、值得关注的预警与前瞻性的洞察。
例如,基于考拉悠然的交通感知预警应用,当该公路出现紧急情况时,行业智能体将结合处理过的24小时实时传输的视频流与《道路交通安全法》等行业法规条例的信息,依托大模型的能力,智能判断告警程度并输出事件分析报告。
客户进一步的需求是,让处理过的数据自行分析、自行上报。而以上效果的实现,都并非易事。
在谈及大模型面向企业服务的机会时,复旦大学教授、上海市数据科学重点实验室主任肖仰华认为,要重视以下三个方面:
一是大模型需要与现有企业流程无缝融合,需要与现有工具或接口的有效衔接;二是大模型需要与员工、专家有效协同;三是大模型需要领域知识注入,以解决“幻觉”问题。
现阶段谈到大模型落地,就不得不提及Agent框架——被业内称为大模型落地的最佳路径。如果说,大模型是一部百科全书,需要不断交互才能查询。相比之下,Agent就像具备强大分析能力的研究助理,不仅掌握了所有百科知识,也能执行复杂任务,理解人们的需求和习惯,并做出调整。
由于Agent框架本身就具备记忆、计划、工具组件,通过自主计划能力与工具、交互界面,已然具备了解决一、二的基础。
但在实际落地中,客户一般都有严格的业务流程要求,因此Agent计划能力与工具使用链路,不一定真实符合业务要求。
也就是说,尽管是Agent框架,也仍需要多走一步。对于这一行业难题,考拉悠然给出了自己的解决方案:利用业务流程画布,形成人-机互动业务骨架,彻底解决以上一、二问题。
具体到高山路段案例来说便是,当告警程度达到严重级别时,智能体首先将根据业务流程画布的配置,对视频事件进行详细版本的事件分析和归因报告;此后,智能体将根据画布设定的业务逻辑,除通知当地公路路段管理处的办事人员及时关注与现场处置外,还将事件报告信息同步上级公路局相关处室。
在该过程中,业务流程画布能够使得智能体的行动决策真正受到业务实操规范约束,既能实现真人一般的业务处理精度与可靠程度,最大限度符合业务流程需求,还能够超越人类,保持无间断、无死角的工作状态。
(高空视频大模型案例 图源:考拉悠然)
最后,为避免“幻觉”,还需要厂商具备获取场景数据的能力,即从业者在行业的know-how与真实交互数据。
总的来说,厂商们既要有持续的高质量数据输入,又要一系列技术高效处理多模态数据,还要有一整套保姆式的产品化方案,让其平稳落地。这对厂商提出了极为严苛的要求——既要懂AI,还要懂行业应用。而现阶段,大多产业大模型厂商仅能占到一头。
AI 1.0时代,大抵分为两大阵营。一类是资金雄厚、人才储备充足的大厂以技术先行,在自然语言处理、视觉、多模态等能力上皆有建树,相比之下,在B端应用上涉及较少,今年开始慢慢向深入产业;另一类厂商则以项目先行,派出一大批专家团队下工厂,深入场景打磨一个个行业个性化方案与产品,但疏于底层平台的构筑,近几年才开始提出底座概念。
而以考拉悠然为代表的少数AI厂商,则是双线并行:考拉悠然团队一边优化大模型算法,将一系列AI工具打磨到好用,一边深入业务场景,与客户、伙伴一起获取高质量数据,同时注入强劲算力,让大模型高效运转。
(悠然多模态通用大模型图源:考拉悠然)
扎实的技术,是落地的基本保障。基于20多年多模态AI技术的打磨,考拉悠然在国内最早提出多模态算法概念,是除大厂以外,少数具备多模态大模型开发能力的创业团队,在计算机视觉、多模态融合及大数据分析三大技术领域,已累计有20余项世界领先的技术。
欧洲科学院院士、ACM/IEEE/OSA Fellow、考拉悠然创始人申恒涛教授一直从事最前沿的计算机科学研究,研究成果引领了国际高维复杂大数据索引的研究,在国际上率先实现了海量视频数据实时内容搜索。
在数据层面,考拉悠然也有多个高质量数据来源:一是来源于客户。在为行业龙头客户定制企业专属大模型过程中,能够自然而然积累产业场景高质量数据以及行业know-how知识。二是来源于行业伙伴。行业的渠道、方案与产品伙伴作为行业专家,会给予考拉诸多输入,并在协同与互动中相互激发,形成与积累新的行业认知。
在此基础上,考拉悠然会在内部充分消化与再升华行业客户与伙伴带来的输入,从中建构自身对行业的认知模型。
当大模型能够高效运转时,精准赋能也同样重要。包含码极客(算法生产)+ Agent框架(大模型应用开发)+ 业务流程画布(业务分发、处理配置)在内的考拉悠然行业产品化方案,正在打通大模型到行业应用的“最后一公里”。
据考拉悠然透露,这一最新的应用范式,对比过往的产品解决方案,在业务效果和交付效率层面均有显著的提升,有望催生全新的行业AI原生应用,实现产业真正的智能化升级。在高空交通监管、电网巡检、半导体质量检测、烟草生产管控、智慧城市治理等交通、能源、工业、政务领域的场景中拥有广阔的应用空间与大量潜在商机。
纵观全球AI界,国际企业更注重通用大模型,国内大模型产业化应用已然呈现出通用类、专业类并行的发展态势。国产大模型,正走在“重塑产业格局,为千行百业创造经济价值”这一条艰难但正确的道路上。
然而,要推动大模型从尝鲜期走向落地期,从“好玩”走向“好用”,并不容易。
悠然产业通用大模型,为大模型的产业化,提供了一条可行的路径:基于通用大模型能力,在打磨好用、易用的行业产品化方案的同时,深入业务场景获取真实、有效的高质量产业数据与行业know-how知识,让大模型能力,切切实实地落在每一个车间、每一条生产线上。