当前位置:首页 > AI技术 > 正文内容

开发怎么 Gemini 批量标注图片?电商卖家提升上架效率的教程案例|Duuu笔记

admin1天前AI技术3

基于真实项目经验的前端实战分享

电商卖家可通过Gemini实现商品图批量标签化:一、结构化整理图片并建CSV;二、用AI Studio逐张调用API输出JSON标签;三、Python脚本自动批量处理;四、Chrome扩展人机协同标注;五、建立类目化提示词模板库提升精度与复用性。

如果您是电商卖家,需要为大量商品图片添加标签以提升上架效率,但手动标注耗时费力,则可以借助 Gemini 的多图理解与文本生成能力实现半自动化批量标注。以下是具体操作路径:

一、准备结构化图片数据集

Gemini 本身不支持直接上传数百张图片并一键生成全部标签,需通过编程接口或分批交互方式调用其视觉理解能力。因此,第一步是将待标注图片整理为可被程序读取的结构化形式,确保命名规范、格式统一,并预留标签存储位置。

1、将所有商品图片存入同一本地文件夹,文件名不含空格与特殊符号,例如“dress_blue_001.jpg”“shirt_cotton_002.png”。

2、确认图片尺寸适中(建议长边≤2048像素),避免因超分辨率导致 Gemini API 拒绝解析或返回截断结果。

3、创建一个空的 CSV 文件,列名为“filename,category,color,material,style,description”,用于后续写入 Gemini 输出的标签字段。

二、使用 Google AI Studio 调用 Gemini Pro Vision API

通过 Google 提供的 AI Studio 平台,可调用支持图像输入的 Gemini-1.5-flash 或 Gemini-1.5-pro 模型,逐张发送图片并获取结构化文本响应。该方式无需本地部署,适合无开发经验但熟悉网页操作的卖家。

1、访问

https://aistudio.google.com/

并登录关联 Google Cloud 账号。

2、在左侧菜单选择“Get API key”,创建新密钥并复制保存;注意启用 billing 及 Gemini API 配额。

3、在 Playground 区域选择模型为

gemini

-1.5-flash

,点击“Add image”上传单张商品图,然后在提示框中输入:

“请用 JSON 格式输出以下6项:品类、主色、材质、风格、适用场景、简短卖点描述。字段名用英文小写,值用中文,不要额外解释。”

4、点击“Run”获取响应,复制 JSON 内容,粘贴至 CSV 对应行,完成单图标注。

三、用 Python 脚本批量调用 Gemini 多模态接口

对具备基础代码能力的用户,可通过 Python 调用 google.generativeai 库,循环读取文件夹内图片,自动构造请求、解析 JSON 响应并写入 CSV。此方法真正实现“批量”,单次运行可处理 50–100 张图片(受速率限制约束)。

1、安装依赖库:

pip install google-generativeai pandas

2、在脚本开头设置 API 密钥:

genai.configure(api_key="YOUR_API_KEY")

元典智库

元典智库:智能开放的法律搜索引擎

下载

3、定义 prompt 模板,固定要求输出字段与格式,例如:“你是一名资深电商运营,请针对这张商品图,严格按以下 JSON Schema 输出:{"category":"string","color":"string","material":"string","style":"string","occasion":"string","selling_point":"string"}。”

4、遍历图片路径列表,对每张图调用

model.generate_content([image, prompt])

,捕获 response.text,用 json.loads() 解析后追加到 DataFrame。

四、利用 Gemini Chrome 扩展快速人工辅助标注

对于图片数量在 20–50 张以内、且需兼顾语义准确性的中小卖家,可采用“人机协同”模式:用浏览器扩展快速唤起 Gemini 视觉分析,人工校验后一键复制标签,跳过编程环节。

1、在 Chrome 应用商店安装官方认证的

“Gemini for Google Search” 扩展

(图标为蓝白双色对话气泡)。

2、打开商品图片所在网页或本地 HTML 预览页,右键点击任意图片,选择“Ask Gemini about this image”。

3、在弹出侧边栏中输入指令:

“列出5个适合电商平台搜索的关键词,按相关性降序排列,用顿号分隔”

4、复制返回结果,粘贴至 Excel 表格对应单元格,批量填充后统一整理为标准标签字段。

五、构建本地提示词模板库提升复用性

不同类目商品需差异化提示词才能获得高精度标签。例如服饰强调版型与穿搭场景,数码配件侧重接口类型与兼容型号。建立分类提示词库可减少每次重复编辑,确保标签维度一致。

1、新建文本文档,命名为“prompt_templates.txt”,按类目分段落,如【女装】下写:“请识别图中服装的领型、袖长、裙长、季节适配性、搭配建议,忽略模特妆容与背景。”

2、【手机壳】类目下写:“提取产品图中的材质工艺(如磨砂PC、液态硅胶)、防护等级(是否包角)、功能特征(带支架/磁吸/无线充兼容)、适用机型(精确到iPhone 15 Pro Max)。”

3、实际使用时,从模板库中复制对应段落,粘贴至 Gemini 输入框,再附加当前图片,即可获得定向优化的标签输出。

相关文章

LLM介绍

。LLM 被证明在使用指令形式化描述的未见过的任务上表现良好。这意味着 LLM 能够根据任务指令执行任务,而无需事先见过具体示例,展示了其强大的泛化能力。 :小型语言模型通常难以解决涉...

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

【DL】2023年你应该知道的 10 大深度学习算法

3. 循环神经网络 (RNN) 4. 生成对抗网络 (GAN) 5. 径向基函数网络 (RBFN) 6. 多层感知器 (MLP) 7. 自组织图 (SOM)...

几种主要的神经网络

卷积神经网络的输入为二维的像素整阵列,输出为这个图片的属性,当网络训练学习后,所输入的图片或许经过稍微的变换,但卷积神经网络还是可以通过识别图片局部的特征而将整个图片识别出来。 :该层...

AI实战详解:Perplexity 怎么做市场调研 Perplexity 市场分析实操教程【商业】最佳实践|Duuu笔记

掌握Perplexity AI市场调研需五步:一、结构化提问嵌入地域/时间/主体/指标四要素;二、限定PDF等原始信源提升可信度;三、分步提问生成制表符分隔文本以自动导入Excel;四、启用Pro S...

深入理解前端开发:Minimax 视频生成中负面提示词(Negative Prompt)写法完全指南|Duuu笔记

Minimax视频生成中负面提示词需用英文、逗号分隔,支持权重调节(如(blurry:1.3)),按构图/主体/画质/风格四类精简选取,禁用not/no/中文及违规词,须通过A/B测试验证有效性。...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。