10 行代码实现 Gemini 3.1 Flash 流式输出实战案例|Duuu笔记
可通过Google Generative AI SDK快速体验Gemini 3.1 Flash流式响应:先安装google-generativeai库,再配置API密钥为环境变量,最后用10行代码调用stream=True实现逐块输出。
如果您希望在没有编程经验的情况下,快速体验 Gemini 3.1 Flash 模型的流式响应能力,则可通过调用 Google 提供的 Generative AI SDK 实现极简集成。以下是完成该目标的具体步骤:
一、安装必要依赖
要运行 Gemini 模型,需先安装 Google 官方 Python SDK,它封装了认证、请求构造与流式响应解析等底层逻辑,避免手动处理 HTTP 协议和 JSON 解析。
1、打开终端(Windows 用户使用命令提示符或 PowerShell,macOS/Linux 用户使用 Terminal)。
2、执行 pip 命令安装 google-generativeai 库:
pip install google-generativeai
。
“
Python免费学习笔记(深入)
”;
3、确保 Python 版本为 3.9 或更高版本,可通过
python --version
验证。
二、获取并配置 API 密钥
Google 要求所有 API 调用携带有效密钥,该密钥用于身份识别与配额管理,必须通过环境变量安全注入,不可硬编码在脚本中。
1、访问
https://aistudio.google.com/app/apikey
登录 Google 账户并生成新密钥。
2、在终端中设置环境变量:
export GOOGLE_API_KEY="your_api_key_here"
(Linux/macOS)或
set GOOGLE_API_KEY=your_api_key_here
(Windows 命令提示符)。
3、验证密钥是否生效:在 Python 交互环境中运行
import os; print(os.getenv("GOOGLE_API_KEY"))
,应输出非空字符串。
三、编写 10 行核心代码
流式输出依赖于模型返回的分块响应(chunk),SDK 提供 generate_content 方法的 stream=True 参数启用该模式,并通过迭代器逐帧读取文本片段。
1、新建文件
gemini
_stream.py。
ima.copilot
腾讯大混元模型推出的智能工作台产品,提供知识库管理、AI问答、智能写作等功能
下载
2、输入以下代码(严格计为 10 行,不含空行与注释):
import google.generativeai as genai
genai.configure(api_key=os.environ["GOOGLE_API_KEY"])
model = genai.GenerativeModel("gemini-3.1-flash")
chat = model.start_chat()
response = chat.send_message("你好,请用一句话介绍你自己", stream=True)
for chunk in response:
if chunk.text:
print(chunk.text, end="", flush=True)
print()
input()
