当前位置:首页 > AI技术 > 正文内容

如何用 Gemini 识别食物照片并自动生成营养分析报告指南最佳实践|Duuu笔记

admin1周前 (03-29)AI技术16

可通过三种路径实现食物照片营养成分识别:一、Gemini App直接上传图片并提问;二、Google Lens识别食物名后,用Gemini网页端深度分析;三、开发者用预处理图像调用Gemini API生成结构化营养报告。

如果您拍摄了一张食物照片并希望快速获取其营养成分信息,则可能是由于缺乏直接调用 Gemini 视觉识别与营养数据库联动的标准化流程。以下是实现该目标的具体操作路径:

一、通过 Gemini App 直接上传图片并提问

此方法依赖 Gemini 移动端应用内置的多模态理解能力,可对食物图像进行视觉解析,并基于训练数据中的常见食物特征推断品类及大致营养构成。

1、在手机应用商店下载并安装官方 Gemini 应用(需确保为 Google 发布的正版应用)。

2、打开应用后登录已启用 Gemini Advanced 权限的 Google 账户。

3、点击输入框旁的“图片图标”,从相册选择一张清晰、主体明确的食物照片。

4、在文字输入框中键入:

“请识别这张食物照片,并列出主要食材、估算每100克的热量、蛋白质、脂肪和碳水化合物含量”

5、发送请求,等待 Gemini 返回结构化文本响应。

二、使用 Google Lens + Gemini 网页端协同分析

当 Gemini App 对复杂摆盘或非标准食物识别准确率较低时,可先通过 Google Lens 提取高置信度的食物名称,再将结果作为提示词输入 Gemini 网页端进行深度营养扩展。

1、在 Android 设备上长按食物照片,选择“Google Lens”选项;iOS 用户需打开 Google App 并点击镜头图标上传图片。

独响

一个轻笔记+角色扮演的app

下载

2、等待 Lens 返回最匹配的食物名称(例如“宫保鸡丁”或“牛油果吐司”)。

3、访问

gemini

.google.com,在对话框中输入:

“根据 Google Lens 识别出的食物‘宫保鸡丁’,提供一份典型家常做法下的每份(约300克)营养成分分析,包括热量、蛋白质、脂肪、碳水、钠和膳食纤维”

4、确认 Gemini 引用的是通用烹饪数据库(如 USDA FoodData Central)中的对应条目。

三、借助第三方工具预处理图像后接入 Gemini API

面向开发者或高级用户,可通过图像裁剪、背景去除、光照归一化等预处理提升识别稳定性,再调用 Gemini Pro Vision API 实现定制化营养报告生成。

1、使用 Python 调用 OpenCV 或 PIL 对原始食物图进行中心区域裁剪与白平衡校正。

2、将处理后的图像 base64 编码,并构造包含 system instruction 的 API 请求体,其中明确要求输出 JSON 格式营养字段。

3、在请求中嵌入约束条件:

“仅输出标准营养标签字段:name、serving_size_g、calories_kcal、protein_g、fat_g、carbs_g、fiber_g、sodium_mg;不添加任何解释性文字或额外字段”

4、接收 API 响应后,将 JSON 数据导入本地 Excel 或 Markdown 模板自动生成可视化报告。

相关文章

【大模型应用开发

二、大模型的泛化与微调 模型的泛化能力:是指一个模型在面对新的、未见过的数据时,能够正确理解和预测这些数据的能力。在机器学习和人工智能领域,模型的泛化能力是评估模型性能的重要指标之一。...

【DL】2023年你应该知道的 10 大深度学习算法

3. 循环神经网络 (RNN) 4. 生成对抗网络 (GAN) 5. 径向基函数网络 (RBFN) 6. 多层感知器 (MLP) 7. 自组织图 (SOM)...

前端开发高级应用:MuleRun如何连接Slack通知 MuleRun消息推送集成配置步骤实战案例|Duuu笔记

若MuleRun无法向Slack推送通知,需依次配置Incoming Webhook或Bot Token、在MuleRun中设置对应通知目标参数,并通过最小化任务测试验证;常见失败原因包括凭据错误、权...

几种主要的神经网络

卷积神经网络的输入为二维的像素整阵列,输出为这个图片的属性,当网络训练学习后,所输入的图片或许经过稍微的变换,但卷积神经网络还是可以通过识别图片局部的特征而将整个图片识别出来。 :该层...

深入理解优化:如何利用 Gemini 3.1 的阶梯计费策略?企业级大规模调用实务完全指南|Duuu笔记

需深入理解Gemini 3.1阶梯计费与调用联动关系,通过识别阶梯区间、请求级Token预估截断、多模型路由调度、响应缓存去重、项目拆分配额绑定五种路径优化成本。 ☞☞☞AI 智能聊天, 问答助手,...

AI核心技巧:如何重置openclaw硬件设置 openclaw恢复出厂设置操作方法【操作】深度解析|Duuu笔记

重置 OpenClaw 配置有四种方法:一、交互式向导重置(openclaw onboard --reset);二、指定作用域的命令行重置(如--reset-scope config);三、手动删除~...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。