EmbeddingGemma

Google DeepMind开发的轻量级文本嵌入模型，专为设备端使用场景优化，提供高质量文本嵌入功能。

多语言语义搜索文本嵌入 RAG 设备端AI 轻量级模型

访问网站

EmbeddingGemma

一句话定位

Google DeepMind推出的轻量级文本嵌入模型，专为设备端AI应用优化。

核心价值

专为设备端使用设计，可在200MB内存下运行，实现高效的文本嵌入功能
支持100+种语言的多语言文本理解，提供同类尺寸模型中最佳性能
采用Matryoshka表示学习技术，支持可定制的嵌入维度

功能亮点

高效性能：仅308M参数，可在200MB内存下运行
多语言支持：训练覆盖100+种语言
灵活定制：支持可调节的嵌入维度
设备端优化：专为移动设备和边缘计算设计

适用人群

移动应用开发者
AI研究人员
嵌入式系统工程师
需要设备端文本嵌入的开发者

使用场景

设备端检索增强生成(RAG)管道
语义搜索应用
移动设备上的生成式AI应用
多语言文本理解任务

综合说明

EmbeddingGemma是Google DeepMind专门为设备端使用优化的文本嵌入模型，在Massive Text Embedding Benchmark(MTEB)中，它是500M参数以下排名最高的开源多语言文本嵌入模型。该模型通过量化技术可以在不到200MB内存的环境中运行，非常适合移动设备、嵌入式系统和边缘计算场景中的文本理解和语义搜索应用。