Photoshop與AI共創:辛蒂瑞拉圖片創作流程教學
文、Simi
在本篇教學中,將以上回與AI(Bing)以及吾兒共同發想的「騎著南瓜機車前往舞會的辛蒂瑞拉」,在Photoshop中使用Auto-Photoshop-SD這個Plug-in進行實際共創流程。
安裝方式請見前文👉文字轉圖像的神奇合作:Stable Diffusion如何革新Photoshop設計
接下來我就以「騎著南瓜機車前往舞會的辛蒂瑞拉」這張圖的創作流程為例,來介紹具體的使用方式。
1. 設計草稿
在這邊主要先粗略的規劃整個場景的元素、構圖以及大約的透視線,以便後續動作都能遵循規劃來製作。
2. 影像處理
首先選擇上次Bing幫我生成的圖當中比較適合的一張,執行:選取 / 主體,接著按Ctrl+J將人物獨立複製出來,將此圖層暫時關閉備用。接著用套索大致選取留在背景上的人物後,執行:編輯 / 填滿,選取內容感知後按確定就能消除背景上的人物(這邊沒有很精緻沒關係,能看就好,之後還會再處理)。
由於Bing生成的圖是正方形,構圖的規劃為橫式,因此 執行:編輯/內容感知比率,就能維持兩邊建築的比例,只把中間空地加寬。
P.S. 在寫此文的同時,Photoshop也在他們的beta版加上了「生成填滿」功能,個人實測結果覺得處理照片很強,但是畫圖就…暫時還不太能用。
Photoshop beta版「生成填滿」試用
3. 加筆調整
由於辛蒂瑞拉參加的是晚宴,時間落在黃昏時段應比較合理,所以利用漸層填滿圖層快速將天空的色系調整為由黃到紫的色系,其他則視需求直接手繪或是從之前算的圖中擷取需要的元素進行整理。
4. 進行局部算圖
由於電腦的配置有限,生成圖像的尺寸通常沒辦法太大,因此在畫面中相對較小的部位(例如臉、手等)就比較容易扭曲變形,這也是為什麼上次用Bing算出來的人臉多半不太好看的原因。在Photoshop中可以用局部算圖的方式,使每個運算的區塊都可以用到本機完整的資源,使畫面的細節更加完整。
由於我們接下來會分區算圖,如果要讓算出來的圖像風格不要差距太大,除了描述主體以外的prompt 都要儘量固定,我的prompt 編寫格式通常為:
(1) 品質描述
(2) 風格描述
(3) 主體描述
例如:(1)高水準的、(2)粉彩風格、(3)白色柴犬
(1)、(2)、(3)並沒有很嚴格的順序要求,但是放在前面的比較不容易被AI遺漏掉
📖 延伸閱讀:體驗Stable Diffusion!快速上手、輕鬆應用的界面技巧大揭密
(1) 品質描述:
我的品質prompt是固定的,大概就是每次直接複製貼上的程度。(這邊的4k是SD玩家慣用以強調清晰度的方式,並非尺寸可以達到4k)
“best quality, masterpiece, highres, original, extremely detailed wallpaper, 4K”
(2) 風格描述:
近年我常常會混用鉛筆跟水彩質感的筆刷作畫,所以就用柔和色調、色鉛筆質感等字眼。
“soft tones, colored pencil texture”
(3) 主體描述:
這邊就是依照當下要處理的部分直接描述就好了。
由於(1)(2)是固定不變的,接下來只針對不同的主體描述來搭配圖片說明。
4-1. 城堡
主體描述:“There were some crowds in front of the castle.”
打開Auto-Photoshop-SD的介面後,首先利用矩形選取工具選擇想要生成的區塊,接著點選
❶ img2img,並設定以下數值
(其他模型、採樣方式等設定請參考:Stable Diffusion的基本使用方式_介面篇)。
❷ Steps:數字越高畫面越細緻但是速度也更慢,且數字太高有時也不見得比較好看,我通常是設定在50~80之間,在這邊是設為80。
❸ 輸出尺寸:依照自己電腦能負荷的程度設定即可,我這邊是設定1080 x 1080 px。
❹ Denoising Strength:降噪強度數值越高會使生成的圖跟原圖差異較大,如果我希望畫面能維持現狀的話,通常會將數值設定在0.2~0.35之間(要多測試看看),這邊是設為0.22。
數值設定完成後打開「Viewer」標籤,點選Generate MoreImg2Img即可,如果同一個範圍要修改數值後再次輸出,可以直接點選Generate Img2Img,如果要生成新的範圍則要回到「Viewer」標籤,再次點選Generate MoreImg2Img才能指定新的生成範圍。
右方城鎮的主體描述為:“The ramp to the town”也是類似的做法,這邊就不重複贅述。
4-2. 人物
主體描述:“Cinderella rides to the palace on a pumpkin-turned-motorcycle, a cat grabs her skirt”
將之前複製出來的人物圖層❶打開後拉到最上面,❷跟❸分別用不同的模型以及採樣方式來跑(其實一邊加筆一邊跑了更多張,這邊只列出主要採用的兩張),❹則將前面幾張圖適用的部分合在一起,並微調頭部的尺寸(因為後面還會需要算圖,不用修到太細緻)。
4-3.玻璃鞋
主體描述:Cinderella’s Glass Shoes
其實這部份是穿插在4-2中間做的,由於腳的範圍很小,不獨立拉出來算效果實在不明顯,因為草圖真的很潦草,所以Denoising Strength的數值要高一點才行,最後選的這張雖不滿意但尚可接受,之後再手動改就好。
4-4. 貓
主體描述:a scared tabby cat grabs the skirt
因為覺得畫面少了點趣味性,想說加隻貓貓上去好了,於是先快速撇了輪廓先算一次圖,再以生成的結果加了大致的光影位置,由於生成的效果比較不穩定,決定一口氣生成8張(等待的時間去晾個衣服)再擷取可用的部分。
4-5. 局部算圖:主體特寫
主體描述:Cinderella Wearing a crown
因為之前修補過的地方筆觸比較粗糙,Denoising Strength數值調低可以讓生成的圖保持原本的狀態,但是變得更加精緻。
5. 最終修飾
這個階段以手繪為主,直接加上點綴的月亮、飛鳥、雲層等,並對整體進行細修,最後用色階調整圖層處理對比度,耗費了一個工作天約8小時完成。
像這樣的一張圖,依照我原本的速度可能要花費一到兩週的時間,但是利用生成式AI進行共創只要一天就能完成,除了節省時間之外,我認為這種一氣呵成的流暢感能讓人進入心流的狀態,不會受到外在挫折或干擾影響而中斷畫圖的樂趣。
FB粉絲團:https://www.facebook.com/lccnetzone
YouTube頻道:https://www.youtube.com/user/LccnetTaiwan
痞客邦Blog:http://lccnetvip.pixnet.net/blog