百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是大模型产业落地的关键年,飞桨文心大模型通过搭建更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态,解决大模型技术与场景需求匹配的关键问题。
作为人工智能发展的重要方向,预训练大模型已成为AI领域的技术新高地,国内外科技巨头纷纷在AI大模型领域展开探索。
2020年5月,OpenAI 发布了拥有1750亿参数量的预训练模型GPT-3,标志着大模型进入千亿参数规模时代。2021年12月8日,百度联合鹏城实验室发布首个知识增强千亿大模型——鹏城-百度·文心,模型参数规模达到2600亿,在60多项任务上取得更好效果。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是大模型产业落地的关键年,飞桨文心大模型通过搭建更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态,解决大模型技术与场景需求匹配的关键问题。
作为本次峰会的一大看点,飞桨文心大模型在落地关键之年,实现了自发布以来最大规模的全面升级:三类模型+一套工具平台+一个生态系统。飞桨建设了适合产业应用落地的文心大模型体系,模型层由基础大模型、任务大模型、行业大模型(三驾马车)共同成为适合于应用场景的最佳组合,配套工具和平台(好马配好鞍)帮助基于大模型的开发持续降低门槛;共创共享飞桨生态,同时建设大模型创意与探索社区旸谷,让更多人零距离接触到先进的AI大模型技术,激发创新与创意。
这次全新升级意义重大,让文心构建起布局最全、最适宜产业应用的大模型体系。一方面布局更加丰富,新增大模型各具特色,另一方面发布的系列工具、平台、API服务,进一步降低产业应用门槛。
众所周知,大模型的出现,实际上大幅度降低了AI行业应用的门槛。本次峰会,也借此展现了百度在与产业实践合作中观察总结的大模型落地的“解法”。从峰会展示的落地案例中可以发现,文心大模型成功经历了内外部的双重实践检验。
据了解,自2019年3月文心ERNIE1.0发布以来,几乎百度全系列产品都在逐步使用文心大模型。目前,文心大模型已大规模应用于百度搜索、信息流、智能音箱等互联网产品,内部日均调用万亿次。从外部落地应用看,文心大模型已通过飞桨开源开放平台、百度智能云等赋能到工业、能源、金融、通信、媒体、教育等各行各业,个人、企业开发者数量超6万。
例如,在媒体行业,文心大模型的理解和生成创作能力激发创意,提升内容多样性,降低了制作成本;在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域应用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%;在医疗领域应用中,文心大模型将每份病历的检查时间,从30分钟缩短到了秒级别。
本次峰会上,在能源电力和金融领域,飞桨文心大模型分别联合国家电网和浦发银行研发行业大模型国网-百度·文心、浦发-百度·文心,通过引入行业特色数据和知识,在电力、金融相关领域取得显著的效果提升。此举进一步提升了大模型对行业应用的适配性。
文心大模型在应用上之所以一骑绝尘,和其自身的差异化核心特色密切相关,即产业级和知识增强,让大模型更强更易用。
产业级主要体现在两个方面:一方面,文心的整个技术是在实际的产业应用过程中打磨的。另一方面,文心大模型在应用时建设了一系列配套能力,让行业更好用。知识增强体现在不断的学习实践中,文心大模型与产业融合应用,并通过知识增强的能力,使大模型在通用性好、泛化性强的基础上实现了更小的开发难度,大幅降低了 AI 开发和应用的门槛,满足真实场景中的应用需求。