谷歌最新多模态大模型Gemini 1.0（双子星）版本正式上线-技术动态-中国安全防范产品行业协会

谷歌最新多模态大模型Gemini 1.0（双子星）版本正式上线

2023/12/7 09:55 谷歌 关键字：谷歌多模态大模型Gemini 1.0 浏览量：

根据文章，Gemini 1.0包括三种不同套件，分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强，复杂度最高，能够处理最为困难的多模态任务；Pro能力稍弱，是一个可扩展至多任务的模型；Nano则是一款可以在手机端侧运行的模型。

　　北京时间12月7日凌晨，谷歌CEO桑达尔?皮查伊和Deepmind CEO戴密斯·哈萨比斯在谷歌官网联名发文，正式宣布最新多模态大模型Gemini 1.0（双子星）版本正式上线。

　　根据文章，Gemini 1.0包括三种不同套件，分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强，复杂度最高，能够处理最为困难的多模态任务；Pro能力稍弱，是一个可扩展至多任务的模型；Nano则是一款可以在手机端侧运行的模型。根据相关视频展示，Gemini对视频、图像的非同凡响的识别能力，能够自如地在图像、音频、视频各模态之间的转换。

　　谷歌方面表示，Gemini是一个真正原生的多模态大模型，因为从最初的预训练数据开始，Gemini就在针对不同模态的模型进行训练，因此其功能在每个重大领域都达到了SOTA（State of the art，特指领先水平的大模型）。

　　除了多模态能力之外，Gemini在专业知识储备和高级编码等领域都处在最前列。比如，Gemini Ultra在MMLU（大规模多任务语言理解数据集）中的得分率高达90.0%，这款MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目，专门用于测试大模型的知识储备和解决问题能力。Gemini Ultra是第一个在MMLU上超越人类专家的大模型。

　　谷歌还宣布Gemini将通过谷歌产品推向数十亿用户。从12月13日开始，开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。

微信扫描二维码，关注公众号。

第十六届（2023）中国国际社会公共安全产品

智能安防产品技术在“平安春运”中的应用与