当前位置:首页 > AI技术 > 正文内容

开发如何 Gemini 识别食物照片并自动生成营养分报告最佳践|Duuu笔记

admin4天前AI技术10

在生产环境中优化前端,本文分析

可通过三种路径实现食物照片营养成分识别:一、Gemini App直接上传图片并提问;二、Google Lens识别食物名后,用Gemini网页端深度分析;三、开发者用预处理图像调用Gemini API生成结构化营养报告。

如果您拍摄了一张食物照片并希望快速获取其营养成分信息,则可能是由于缺乏直接调用 Gemini 视觉识别与营养数据库联动的标准化流程。以下是实现该目标的具体操作路径:

一、通过 Gemini App 直接上传图片并提问

此方法依赖 Gemini 移动端应用内置的多模态理解能力,可对食物图像进行视觉解析,并基于训练数据中的常见食物特征推断品类及大致营养构成。

1、在手机应用商店下载并安装官方 Gemini 应用(需确保为 Google 发布的正版应用)。

2、打开应用后登录已启用 Gemini Advanced 权限的 Google 账户。

3、点击输入框旁的“图片图标”,从相册选择一张清晰、主体明确的食物照片。

4、在文字输入框中键入:

“请识别这张食物照片,并列出主要食材、估算每100克的热量、蛋白质、脂肪和碳水化合物含量”

5、发送请求,等待 Gemini 返回结构化文本响应。

二、使用 Google Lens + Gemini 网页端协同分析

当 Gemini App 对复杂摆盘或非标准食物识别准确率较低时,可先通过 Google Lens 提取高置信度的食物名称,再将结果作为提示词输入 Gemini 网页端进行深度营养扩展。

1、在 Android 设备上长按食物照片,选择“Google Lens”选项;iOS 用户需打开 Google App 并点击镜头图标上传图片。

独响

一个轻笔记+角色扮演的app

下载

2、等待 Lens 返回最匹配的食物名称(例如“宫保鸡丁”或“牛油果吐司”)。

3、访问

gemini

.google.com,在对话框中输入:

“根据 Google Lens 识别出的食物‘宫保鸡丁’,提供一份典型家常做法下的每份(约300克)营养成分分析,包括热量、蛋白质、脂肪、碳水、钠和膳食纤维”

4、确认 Gemini 引用的是通用烹饪数据库(如 USDA FoodData Central)中的对应条目。

三、借助第三方工具预处理图像后接入 Gemini API

面向开发者或高级用户,可通过图像裁剪、背景去除、光照归一化等预处理提升识别稳定性,再调用 Gemini Pro Vision API 实现定制化营养报告生成。

1、使用 Python 调用 OpenCV 或 PIL 对原始食物图进行中心区域裁剪与白平衡校正。

2、将处理后的图像 base64 编码,并构造包含 system instruction 的 API 请求体,其中明确要求输出 JSON 格式营养字段。

3、在请求中嵌入约束条件:

“仅输出标准营养标签字段:name、serving_size_g、calories_kcal、protein_g、fat_g、carbs_g、fiber_g、sodium_mg;不添加任何解释性文字或额外字段”

4、接收 API 响应后,将 JSON 数据导入本地 Excel 或 Markdown 模板自动生成可视化报告。

相关文章

LLM介绍

。LLM 被证明在使用指令形式化描述的未见过的任务上表现良好。这意味着 LLM 能够根据任务指令执行任务,而无需事先见过具体示例,展示了其强大的泛化能力。 :小型语言模型通常难以解决涉...

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

使用 ESP

针对该分类问题,我们使用了 Kaggle 手势识别数据集 中的一个开源数据集。原始数据集包括 10 个类别,我们只使用了其中 6 个。这些类别更容易识别,且日常生活中更有用,如...

前端开发高级应用:MuleRun如何连接Slack通知 MuleRun消息推送集成配置步骤实战案例|Duuu笔记

若MuleRun无法向Slack推送通知,需依次配置Incoming Webhook或Bot Token、在MuleRun中设置对应通知目标参数,并通过最小化任务测试验证;常见失败原因包括凭据错误、权...

深入理解优化:如何利用 Gemini 3.1 的阶梯计费策略?企业级大规模调用实务完全指南|Duuu笔记

需深入理解Gemini 3.1阶梯计费与调用联动关系,通过识别阶梯区间、请求级Token预估截断、多模型路由调度、响应缓存去重、项目拆分配额绑定五种路径优化成本。 ☞☞☞AI 智能聊天, 问答助手,...

前端开发实战详解:骡子快跑怎么注册账号 骡子快跑账号注册流程最佳实践|Duuu笔记

骡子快跑注册仅需1分钟,但激活码需从Discord指定频道获取,输错3次将锁账户24小时;积分与注册邮箱强绑定且不可更换;部分地区即使注册成功也无法运行Agent。 ☞☞☞AI 智能聊天, 问答助手...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。