🌳來用 AI 生出兒童聖經金句卡

起源:
這次來聊聊 AI 生圖這件事。
最近老婆在網路上看到一篇報導,是有一位 3 歲半的小男孩可以背誦英文 A-Z 共 26 個字母開頭的聖經金句。
報導連結在這邊:國度復興報 - 3歲半幼童能背26句聖經金句
聽到時,我原以為那是發生在亞洲的事情,看完報導才發現原來是在美國德州啊!
腦海中的男生瞬間從台灣人,變成美國人了。
於是我們打算也來製作這主題的圖卡。
AI 生圖技巧概述
順便來分享我所知道關於 AI 產生圖片的技巧。
--
以下我使用的是 Google Gemini 的 Nona Banana Pro 的 AI 模型。
--
挑選聖經金句
對於這個任務,首先我需要先把聖經金句的英文版本找出來。
我試著用以下的 prompt (提示詞) 指定範圍讓 AI 推薦 26 句英文給我。

選擇這個英文翻譯版本的原因是因為 AI 建議用 NIV (New International Version) 版本。
理由: 這是安全牌。你去隨便一家英語教會,大概率是用這本。它的句子通常修飾得比較順口,很適合「朗讀」和「背誦」。
缺點: 有些極端保守的學者會嫌它翻譯得稍微太「意譯」了一點點,不夠死板(但在兒童教育上這反而是優點)。
不過最後我們找到當時這位小男孩所用的英文句子來產生圖片了。
接下來,我們可以嘗試各種畫風,來看 AI 會產生出什麼樣的圖片。
當找到喜歡的畫風後,我們當然是希望每張圖卡都保持一致的風格。
但是,越想要保持一致,就越需要把 prompt (提示詞) 指定得越清楚。
關於 AI 生圖片是這樣,越詳細的描述,越容易得到你想要的結果,因為它沒有發揮幻覺,或者優雅點的說法是沒有「創造力」。當你越希望它產生出一些「意想不到」的結果時,就要盡量減少描述的內容。
其實 AI 沒有「創造力」,有創造力的是人類。AI 只是大語言模型,背後的訓練資料是人類的智慧,它只是根據你的指令,產生出最可能的結果。
鎖定畫風:結構化描述
回到鎖定畫風這件事。
我們需要盡可能把風格描述的越詳細越好,只是一般人的詞彙是有限的,也沒那麼多精力去描述。這邊教一招,就是 AI 界常說的「用魔法戰勝魔法」。既然圖是 AI 產生的,也可以叫 AI 去描述它。現在知名的 AI 模型都是多模態的,輸入圖片、語音、文字,它都能夠吸收了解。
使用 JSON 描述畫風
以下我把喜歡的風格匯入對話框,然後叫 AI 去描述它。 我故意叫它用 Json 這種程式語言的格式來描述它。 因為 Json 屬於結構化的格式,比起自然語言的描述,它更容易被 AI 模型理解。

使用 XML 描述畫風
還有一種結構化的格式叫做 XML。 以下是我叫 AI 用 XML 來描述的結果。

可以看到,AI 會自動產生很多欄位標籤,你看,這如果是人類有手動產生有多麻煩。 產生這些資料後,我們還可以自己針對某個欄位微調,改成自己喜歡的要求。
<?xml version="1.0" encoding="UTF-8"?>
<visual_style_guide>
<metadata>
<genre>平衡式雙語繪本風 (Balanced Bilingual Picture Book)</genre>
<aesthetic_category>圖文共生設計 (Symbiotic Layout)</aesthetic_category>
<overall_vibe>溫馨、易讀、兼具藝術感與學習功能</overall_vibe>
</metadata>
<artistic_technique>
<medium_emulation>數位仿手繪 (Digital Faux-Traditional Media)</medium_emulation>
<texture_details>
<detail>水彩暈染: 用於背景烘托氛圍</detail>
<detail>色鉛筆/粉彩: 用於角色細節與文字周邊裝飾</detail>
</texture_details>
<line_work>
<style>有機柔和線條</style>
<color>大地色系,避免生硬黑線</color>
</line_work>
</artistic_technique>
<color_palette_system>
<temperature>暖色調 (Warm)</temperature>
<brightness>高明度 (High Key)</brightness>
<harmony>色彩需同時服務於插畫美感與文字可讀性</harmony>
</color_palette_system>
<composition_elements>
<layout_distribution>
<rule>平衡三段式分割 (Balanced Tri-Partite Hierarchy)</rule>
<total_coverage>90% Content + 10% Whitespace</total_coverage>
<element type="typography_english_primary" percentage="40%">
<description>
視覺主體。
包含精緻設計的首字母 (Drop Cap) 與英文經文。
字體造型與插畫風格融合,但保持獨立的視覺區塊,清晰醒目。
</description>
</element>
<element type="illustration_scene" percentage="30%">
<description>
情境演繹區。
**重點更新**:插畫不再只是邊框裝飾,而是擁有獨立的「微型場景」。
內容:具體的角色(兒童男孩、女孩或小動物)在簡單的背景(草地、雲朵)中互動。
作用:提供畫面的溫度與故事感,稍微凸顯角色個性,但構圖上不會干擾文字區塊。
</description>
</element>
<element type="typography_chinese_secondary" percentage="20%">
<description>
清晰閱讀區。
繁體中文搭配注音符號。
字體大小適中,行距寬鬆,確保在不搶奪英文風采的前提下,讓閱讀者能輕鬆識字。
背景需乾淨,確保注音符號的清晰度。
</description>
<mandatory_requirement>
<script>繁體中文 (Traditional Chinese)</script>
<notation>必須標註注音符號 (Must include Bopomofo/Zhuyin)</notation>
</mandatory_requirement>
</element>
<element type="whitespace_margin" percentage="10%">
<description>
視覺緩衝 (Breathing Room)。
環繞在各區塊之間,避免畫面壓迫感,提升整體精緻度。
</description>
</element>
</layout_distribution>
<typography_integration>
<style>區塊式佈局 (Block Layout)</style>
<interaction>角色位於插畫層,視線引導至文字層,形成視覺動線閉環</interaction>
</typography_integration>
</composition_elements>
</visual_style_guide>
產生圖片的方法
結構化聖經金句
以下是叫 AI 用 Json 格式整理我準備好的聖經金句,
使用 Json 的原因同前面說的
「因為 Json 屬於結構化的格式,比起自然語言的描述,它更容易被 AI 模型理解。」
因為有 26 個英文字母,所以 AI 會產生 26 個 JSON 物件。
非常長的 Json,我只取其中一個例子。
[
{
"Letter": "A",
"Verse": "Ask and it will be given to you; seek and you will find",
"Reference": "馬太福音 7:7",
"中文經節": "你們祈求,就給你們;尋找,就尋見"
},
{
"Letter": "E",
"Verse": "Every good and perfect gift is from above",
"Reference": "雅各書 1:17",
"中文經節": "各樣美善的恩賜和各樣全備的賞賜都是從上頭來的"
},
{
"Letter": "N",
"Verse": "Now faith is being sure of what we hope for and certain of what we do not see.",
"Reference": "希伯來書 11:1",
"中文經節": "信就是所望之事的實底,是未見之事的確據。"
},
{
"Letter": "V",
"Verse": "Very truly I tell you, the one who believes has eternal life.",
"Reference": "約翰福音 6:47",
"中文經節": "我實實在在地告訴你們,信的人有永生"
},
{
"Letter": "W",
"Verse": "We are more than conquerors through him who loved us",
"Reference": "羅馬書 8:37",
"中文經節": "靠著愛我們的主,在這一切的事上已經得勝有餘了。"
},
{
"Letter": "Y",
"Verse": "You are the light of the world.",
"Reference": "馬太福音 5:14",
"中文經節": "你們是世上的光。"
}
]
實際產圖步驟
有了結構化的畫風描述與聖經句子後,就可以開始一一產生圖片了。
怎麼做呢?
先貼上一節聖經句子的 Json 段落,再貼上畫風描述檔,然後送出。
你想顛倒,先貼畫風描述檔再貼聖經經句,我認為效果不會有差別。
雖然我沒大量實驗過顛倒的部分。
然後呢,就像下面這樣:
{
"Letter": "A",
"Verse": "Ask and it will be given to you; seek and you will find",
"Reference": "馬太福音 7:7",
"中文經節": "你們祈求,就給你們;尋找,就尋見"
}
<?xml version="1.0" encoding="UTF-8"?>
<visual_style_guide>
裡面省略
</visual_style_guide>


一次一句聖經就好,不要一次放太多。
放太多肯定不好的,AI 產圖時,只要給它必要的資訊就好了。
最後出來的效果就如下面所示:

AI 生圖的限制與挑戰
我得說,AI 產圖就像是隨機抽卡片一樣,
上面的技巧只是讓抽到好卡片的機率變高而已。
增加穩定度,但無法保證張張都好。
就像是我這張,它在注音的部分就出錯了。

並不是因為 Gemini 不懂注音符號,而是因為細節太多了。
因為當你改成只要它產生一張短短幾個字的國字與注音時,就會發現它其實很懂注音符號。
那為什麼會這樣呢?
就是我為了鎖住畫風給了太多細節,同時我還要求有英文、中文、注音符號,
雖然我今年被 Google 特價活動吸引,買了 Gemini Pro 的訂閱,但 Google 背後給我的算力也有限,
如果 Google 願意給我更多算力,相信怎麼密密麻麻的文字都生得出來啦。
而且我的經驗看來,有時候大量連續生圖,產出品質也會下降。我不清楚是不是算力問題,還是有其他原因。
還是我人類的幻覺 ??
有時候乾脆睡一覺,隔天再繼續,品質就會回升。 (真是太不負責任的說法了,哈哈)
打到這邊,差不多了,最後我再分享一個小技巧,
表情生成技巧
記得我這篇的最一開始的封面圖嗎?裡面的男生小老師,如果喜歡這個角色,我們也可以透過 AI 來產生各種表情哦!
這可能很多人早就知道了,不過我還是順口提一下。
只要截下他的臉的範圍,傳入 Gemini 對話框,然後下提示詞,像是這樣

男生再各自給我 8 個表情,總共變成 9 張大頭貼臉部截圖於一個 16:9 的大圖片內。
表情分別是
1. [張嘴大笑]
2. [無奈搖頭]
3. [難過低頭]
4. [驕傲抬頭],
5. [嚴肅認真],
6 [閉眼打瞌睡],
7. [溫柔微笑],
8. [低頭沉思],
9. [閉眼禱告]
出來的效果,往往都很好!

結語
這都歸功於 Google 這套 Gemini 3 Pro 模型的強大,2026 年的年初,繁體中文要生得漂亮,還是只有它辦得到。
一面佩服,一面又擔心年底會不會只剩下 Google 一家了......
其它公司加油啊! Grok、Chat GPT 等等的。
OK 結束!
📌 備註: 目前還沒有將 26 張聖經卡片全部調整好,很多 99 分的卡片,都差在注音符號有點失敗,有消息再說囉。