告別繁瑣步驟!Gemini "Gems" 實測:手把手教你打造專屬的 AI 自動化工作流


說起來這真的有點瘋狂。如果你還在把 Gemini 當成普通的聊天機器人,那你可能錯過了它最近最亮眼的一次進化。Google 最近把原本代號叫 Opal 的技術直接塞進了 Gemini,雖然目前名字似乎還在調整中,有人叫它 AI Apps,也有人稱之為 Gems,但重點不在名字,而是它具備了像 Zapier 或 Make.com 那樣的自動化潛力。

想像一下,你不再需要對著 AI 一句句下指令,而是直接蓋出一座「自動化工廠」。無論是寫部落格、生成產品描述,還是設計圖片與音樂,只要設定好流程,剩下的就交給 Gemini 跑完。

想玩新功能?先打開你的電腦

有一點或許會讓你稍微失望,我翻遍了手機版的 Gemini App,目前還找不到這個功能的蹤跡。這意味著如果你想嘗試這種自定義工作流,暫時必須使用電腦網頁版

直接導航到 gemini.google.com,打開側邊欄導航,你就會看到「Gems」這個新選項。進去之後,你會發現 Google 其實已經幫你準備了一些範例模板,你可以直接拿來「改裝」(Remix),或者乾脆點,跟我一樣從零開始挑戰。

像跟朋友聊天一樣,把你的「需求」說出來

這個工具最迷人的地方在於,你不需要懂任何程式碼。你只需要描述你想要達到的目標,它就會自動幫你搭好框架。

舉個例子,我有個點子:我想做一個「姓名圖標生成器」。只要使用者輸入一個名字,AI 就會去分析這個名字背後的起源、語源意義,最後根據這些意義畫出一張專屬的圖標(Icon)。

我在對話框裡輸入了這段指令:

「我想建立一個工作流,使用者輸入任何名字後,AI 會分析該名字的詞源,接著根據分析結果生成一張代表該名字的圖標圖片。」

發送指令後,你會看到畫面開始閃動,那是 Google Opal(或者說新的 Gem 引擎)正在後台幫你組裝邏輯節點。

內行人才知道的隱藏版:進階編輯器

當 Gemini 幫你搭好初步框架後,你會發現它像是一個簡化版的預覽介面。如果你覺得不夠精準,或者想微調某些細節,這時候就要點開 Advanced Editor(進階編輯器)

這會把你帶回 Google Opal 的原始介面,這裏就像是一個「邏輯調度室」:

  • 你可以看到每一個**節點(Nodes)**代表的意義。
  • 你可以手動修改 AI 的提示詞(Prompt)設定。
  • 甚至能調整圖片生成的參數或輸出的格式。

這對於追求完美的人來說簡直是福音,你可以確保 AI 不會跑偏,而是乖乖地按照你設定的軌道前行。

實測效果:這真的只是一次點擊就能完成的嗎?

我試著輸入了 "Leo" 這個名字。

有趣的事情發生了。Gemini 開始跳動,它先執行了分析步驟,抓出了 Leo 代表「獅子」以及勇氣的含意,接著它自動切換到圖片生成模式。雖然它目前使用的是 Gemini 的影像生成模型(可能還不是最強的 Pro 版本,但水準已經相當不錯),但最讓我驚艷的是,它最後居然還渲染出了一個簡單的 HTML 網頁來呈現結果。

雖然在預覽時圖片看起來有點模糊(可能是因為嵌在 HTML 介面裡的關係),但實際點開看,質感非常到位。一個具有現代感的獅子圖標,配上文字說明的網頁,就這樣在我輸入一個名字後,幾秒鐘內誕生了。

為什麼你應該現在就開始嘗試?

你有沒有想過,每天有多少重複性的數位工作消耗了你的精力?

  • 對於自媒體創作者:你可以設定一個「標題→大綱→內文→配圖」的一條龍 Gem。
  • 對於行銷人員:你可以做一個「產品賣點→廣告文案→社群貼文」的自動化流程。

這不僅僅是節省時間,更是在解放你的大腦。實際上,這就像是你有了一個免費的、24 小時待命的實習生,而且這個實習生還非常擅長執行你設計的標準作業程序(SOP)。

雖然這項技術還在實驗階段,有時候會出現小小的 Bug 或連線延遲,但它展示的未來已經足夠清晰。現在就去 Gems 選單裡動動手,蓋出你的第一個 AI 工作流吧!或許你會發現,那些原本讓你頭痛的瑣事,其實只需要一鍵就能搞定。

留言

這個網誌中的熱門文章

【重磅】諾貝爾獎得主 David Baker 再出招!RFdiffusion3 全原子蛋白質設計模型問世,成本狂降 90%

Google Antigravity 全新開發環境震撼登場

透過AI自動化打造月入數萬美元的「助眠影片」事業:完整步驟教學