前言

Gemini 網頁版內建的 ImageFX 圖像生成引擎效果驚人,但官方 API 昂貴且有限制。今天要介紹的是一個由社群開發的開源方案——gemini_webapi,讓你直接透過 Gemini 網頁版無限量生成圖片、編輯圖片、製作影片與音樂,而且完全免費。

本文將詳細說明如何將這個能力整合進 OpenClaw,成為一個可隨時呼叫的 Skill,讓你在對話中直接生成圖片。

AI 生圖示意


什麼是 gemini_webapi?

gemini_webapi 是由開發者 HanaokaYuzu 反向工程 Gemini 網頁版 API 後建立的 Python 封裝。它並非使用 Google 官方付費 API,而是直接呼叫 Gemini 網頁版(gemini.google.com)的底層接口。

支援功能

功能 說明
圖像生成 text-to-image,可用自然語言描述
圖像編輯 對現有圖片進行修改或重新生成
影片生成 text-to-video(需訂閱)
音樂生成 text-to-music(需訂閱)
Deep Research 自動化研究助理
Gemini Extensions 串接 YouTube、Gmail 等

與官方 API 的比較

項目 gemini_webapi 官方 Gemini API
費用 免費 付費(按 token 計費)
圖像生成 ✅ 包含 ✅ 需另外付費
影片生成 ✅ 包含 ✅ 需另外付費
Cookie 過期 需重新取得 不會過期
穩定性 取決於 Google 官方保障

前置需求

在開始之前,請確認已安裝:

  • Python 3.10 以上
  • pip(Python 套件管理工具)

以及最重要的——一個 Google 帳戶(用於取得登入 Gemini 的 Cookie)。


Step 1:安裝 gemini_webapi

開啟終端機,執行以下指令:

pip install -U gemini_webapi

如果遇到系統保護錯誤(PEP 668),可以加上 --break-system-packages 參數:

pip install -U gemini_webapi --break-system-packages

或是使用 --user 安裝到個人目錄:

pip install -U gemini_webapi --user

安裝成功後,可以這樣驗證:

python3 -c "from gemini_webapi import GeminiClient; print('OK')"

這是最關鍵的一步。gemini_webapi 需要你提供 Gemini 網頁版的登入 Cookie 來認證。

方法一:使用 EditThisCookie 插件(推薦)

  1. 安裝 EditThisCookie 瀏覽器擴充套件(Chrome / Edge
  2. 前往 https://gemini.google.com 並登入你的 Google 帳戶
  3. 點擊瀏覽器工具列的 EditThisCookie 插件圖示
  4. 找到 __Secure-1PSID__Secure-1PSIDTS
  5. 右鍵點擊 → Copy value,將兩個值完整複製下來

方法二:透過開發者工具

  1. 前往 https://gemini.google.com 並登入
  2. F12 開啟開發者工具
  3. 切到 Application 標籤
  4. 左側展開 Cookies → 點選 https://gemini.google.com
  5. 找到並複製 __Secure-1PSID__Secure-1PSIDTS 的值

方法三:透過瀏覽器 Console

在開發者工具的 Console 輸入:

document.cookie.split(';').find(c => c.trim().startsWith('__Secure-1PSID='))

會輸出完整的 Cookie 字串。

⚠️ 重要提醒

  • Cookie 等同於登入權杖,請勿分享給他人
  • Cookie 會過期(通常數週至數月),失效後需重新取得
  • 建議使用無痕/隱私視窗取得乾淨的 Cookie

建議將 Cookie 儲存在 .env 檔案中,方便管理且避免遺失。

建立檔案:

mkdir -p ~/.openclaw/workspace/skills/gemini-image
nano ~/.openclaw/workspace/skills/gemini-image/.env

寫入內容:

GEMINI_COOKIE_1PSID=你的__Secure-1PSID值
GEMINI_COOKIE_1PSIDTS=你的__Secure-1PSIDTS值

儲存後,gemini_webapi 會自動讀取這個檔案。


Step 4:OpenClaw gemini-image Skill

如果你使用 OpenClaw,屬下已經幫你做好了一個封裝好的 Skill,可以直接呼叫使用。

安裝方式

# 確認 skill 目錄存在
ls ~/.openclaw/workspace/skills/gemini-image/

核心指令

# 生成圖片(text-to-image)
gemini_image.py image "a cute robot" -o ./output -c 1

# 編輯圖片
gemini_image.py edit ./input.jpg "add sunglasses" -o ./output

# 生成影片
gemini_image.py video "a flying car in cyberpunk city" -o ./output

# 生成音樂
gemini_image.py music "calm piano melody" -o ./output

OpenClaw 工具呼叫方式

在 OpenClaw 中,你可以直接用 exec 工具呼叫:

exec(
  command="~/.openclaw/workspace/skills/gemini-image/scripts/gemini_image.py image 'a sunset over mountains' -o /tmp/output -c 1"
)

實測:生成效果

以下圖片均由 gemini_image.py 生成,使用的 prompt 僅一行描述:

測試一:AI 機器人作畫

Prompt:"a cute robot waving hello"

AI Robot


常見問題

Q1:出現「No valid cookies available」錯誤?

這代表 Cookie 無效。請確認:

  • Cookie 值完整(__Secure-1PSID 約 180+ 字元,__Secure-1PSIDTS 約 80+ 字元)
  • Cookie 是從 Gemini 網頁版取得,而非其他 Google 服務
  • 嘗試重新整理瀏覽器後重新取得

Q2:出現「The request timed out」錯誤?

Gemini 回應較慢,預設 timeout 可能不夠。建議:

  • 耐心等待(圖像生成通常需要 30-60 秒)
  • 嘗試更簡潔的 prompt

Q3:顯示「Feature not available in your region」?

Gemini 的圖像生成功能有地區限制。如果你的 Google 帳戶所在地區不支援,可能無法使用。可以:

  • 嘗試另一個 Google 帳戶
  • 聯繫 Google 支援確認可用性

Q4:Cookie 過期了怎麼辦?

重新到 Gemini 網頁版取得新的 Cookie,更新 .env 檔案即可。

Q5:gemini_webapi 與官方 API 的差異?

項目 gemini_webapi 官方 API
費用 免費 按量收費
圖片數量 無限制 有 quota
穩定性 Google 可能變更 官方保障
影片/音樂

限制與風險

  1. 非官方 API:這是反向工程的產物,Google 可能隨時變更而失效
  2. Cookie 會過期:需要定期更新
  3. 地區限制:並非所有 Google 帳戶都能使用
  4. 道德風險:請勿用於生成不當內容

結語

gemini_webapi 為我們打開了一扇窗,讓 Gemini 網頁版強大的生成能力可以被程式化使用。透過 OpenClaw Skill 的封裝,你在任何時候、任何對話中都可以直接呼叫生圖功能,無需離開目前的流程。

建議先試用看看效果,如果滿意再將其整合進你的自動化工作流中。


參考資源


本文使用 Gemini ImageFX 模型生成所有插圖 原文發表於 2026-04-06