前端开发高级应用:怎么用 Gemini 批量标注图片?电商卖家提升上架效率的教程实战案例|Duuu笔记
电商卖家可通过Gemini实现商品图批量标签化:一、结构化整理图片并建CSV;二、用AI Studio逐张调用API输出JSON标签;三、Python脚本自动批量处理;四、Chrome扩展人机协同标注;五、建立类目化提示词模板库提升精度与复用性。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
如果您是电商卖家,需要为大量商品图片添加标签以提升上架效率,但手动标注耗时费力,则可以借助 Gemini 的多图理解与文本生成能力实现半自动化批量标注。以下是具体操作路径:
一、准备结构化图片数据集
Gemini 本身不支持直接上传数百张图片并一键生成全部标签,需通过编程接口或分批交互方式调用其视觉理解能力。因此,第一步是将待标注图片整理为可被程序读取的结构化形式,确保命名规范、格式统一,并预留标签存储位置。
1、将所有商品图片存入同一本地文件夹,文件名不含空格与特殊符号,例如“dress_blue_001.jpg”“shirt_cotton_002.png”。
2、确认图片尺寸适中(建议长边≤2048像素),避免因超分辨率导致 Gemini API 拒绝解析或返回截断结果。
3、创建一个空的 CSV 文件,列名为“filename,category,color,material,style,description”,用于后续写入 Gemini 输出的标签字段。
二、使用 Google AI Studio 调用 Gemini Pro Vision API
通过 Google 提供的 AI Studio 平台,可调用支持图像输入的 Gemini-1.5-flash 或 Gemini-1.5-pro 模型,逐张发送图片并获取结构化文本响应。该方式无需本地部署,适合无开发经验但熟悉网页操作的卖家。
1、访问
https://aistudio.google.com/
并登录关联 Google Cloud 账号。
2、在左侧菜单选择“Get API key”,创建新密钥并复制保存;注意启用 billing 及 Gemini API 配额。
3、在 Playground 区域选择模型为
gemini
-1.5-flash
,点击“Add image”上传单张商品图,然后在提示框中输入:
“请用 JSON 格式输出以下6项:品类、主色、材质、风格、适用场景、简短卖点描述。字段名用英文小写,值用中文,不要额外解释。”
4、点击“Run”获取响应,复制 JSON 内容,粘贴至 CSV 对应行,完成单图标注。
三、用 Python 脚本批量调用 Gemini 多模态接口
对具备基础代码能力的用户,可通过 Python 调用 google.generativeai 库,循环读取文件夹内图片,自动构造请求、解析 JSON 响应并写入 CSV。此方法真正实现“批量”,单次运行可处理 50–100 张图片(受速率限制约束)。
1、安装依赖库:
pip install google-generativeai pandas
。
2、在脚本开头设置 API 密钥:
genai.configure(api_key="YOUR_API_KEY")
。
元典智库
元典智库:智能开放的法律搜索引擎
下载
3、定义 prompt 模板,固定要求输出字段与格式,例如:“你是一名资深电商运营,请针对这张商品图,严格按以下 JSON Schema 输出:{"category":"string","color":"string","material":"string","style":"string","occasion":"string","selling_point":"string"}。”
4、遍历图片路径列表,对每张图调用
model.generate_content([image, prompt])
,捕获 response.text,用 json.loads() 解析后追加到 DataFrame。
四、利用 Gemini Chrome 扩展快速人工辅助标注
对于图片数量在 20–50 张以内、且需兼顾语义准确性的中小卖家,可采用“人机协同”模式:用浏览器扩展快速唤起 Gemini 视觉分析,人工校验后一键复制标签,跳过编程环节。
1、在 Chrome 应用商店安装官方认证的
“Gemini for Google Search” 扩展
(图标为蓝白双色对话气泡)。
2、打开商品图片所在网页或本地 HTML 预览页,右键点击任意图片,选择“Ask Gemini about this image”。
3、在弹出侧边栏中输入指令:
“列出5个适合电商平台搜索的关键词,按相关性降序排列,用顿号分隔”
。
4、复制返回结果,粘贴至 Excel 表格对应单元格,批量填充后统一整理为标准标签字段。
五、构建本地提示词模板库提升复用性
不同类目商品需差异化提示词才能获得高精度标签。例如服饰强调版型与穿搭场景,数码配件侧重接口类型与兼容型号。建立分类提示词库可减少每次重复编辑,确保标签维度一致。
1、新建文本文档,命名为“prompt_templates.txt”,按类目分段落,如【女装】下写:“请识别图中服装的领型、袖长、裙长、季节适配性、搭配建议,忽略模特妆容与背景。”
2、【手机壳】类目下写:“提取产品图中的材质工艺(如磨砂PC、液态硅胶)、防护等级(是否包角)、功能特征(带支架/磁吸/无线充兼容)、适用机型(精确到iPhone 15 Pro Max)。”
3、实际使用时,从模板库中复制对应段落,粘贴至 Gemini 输入框,再附加当前图片,即可获得定向优化的标签输出。
