用 GPT Image 2 生成兔子涂色页:细节和边缘更稳
做 AI 涂色页生成时模型效果不能只看“图片好不好看”还要看它能不能变成一张真正适合打印和上色的线稿。这次选了一张真实兔子照片作为输入用 GPT Image 2 image-to-image 做转换重点看耳朵边缘、五官、胡须和毛发细节能不能稳定落到黑白线稿里。输入图是下面这张兔子照片。它看起来简单但很适合观察涂色页模型长耳朵要有清楚外轮廓脸部不能糊眼睛、鼻子、胡须和脚掌不能丢毛发也不能变成一团灰。我使用的约束不是普通插画提示词而是明确要求clean black-and-white printable coloring page、crisp dark outlines、white background、no grayscale shading、no filled black areas并要求保留兔子的姿态、耳朵、眼睛、鼻子、胡须、脚掌和毛发轮廓。下面是实际返回的涂色页结果Nano Banana 的问题不是不能生成而是线稿不够稳定之前用 Nano Banana 生成兔子涂色页时整体画面可以成立但经常会遇到几个问题边缘有时发虚局部细线容易粘连背景装饰和兔子主体的层次不够清楚。结果在屏幕上看还可以放到打印场景里就会变成“能看但不好涂”。这不是说 Nano Banana 完全不适合涂色页而是它在这种细节密集的主题里需要更多筛选和返工。对一个在线工具来说返工次数越多用户越难判断到底是 prompt 问题、照片问题还是模型本身对线稿的理解不够稳。GPT Image 2 更适合这类可打印线稿从这次结果看GPT Image 2 的优势主要在几个位置耳朵外缘是闭合且清楚的脸部五官没有被糊掉胡须和毛发被转成可读的细线身体边缘也没有大面积灰色阴影。对涂色页来说这些变化比“画面更炫”更重要因为最终结果要留给人上色。如果把这套流程落到网页上页面不应该只是“生成一张图”的入口还要能展示最终结果是否真的可用。我把这次兔子照片转线稿的效果放到了vercel的页面上作为最终成果展示入口输入图片、约束 prompt、得到 printable line art这三步能连起来看才方便判断模型输出是否达标。写 prompt 时也要围绕“可涂色”约束即使用 GPT Image 2也不能把 prompt 写成普通插画生成。更稳的写法应该直接约束输出black and white coloring page、clean outline、clear edges、printable line art、no grayscale shading、no filled black areas。如果主题是兔子可以继续补充large clear ears、separated fur outline、simple flowers in background、wide areas for coloring。这样模型更容易把重点放在线稿结构上而不是生成一张彩色插画再强行转黑白。小结这次主题可以概括成一句话我们用 GPT Image 2 生成兔子涂色页是因为它在真实照片转线稿时对细节保留和边缘清晰度更适合可打印 coloring page。相比之前 Nano Banana 的效果它减少了线条粘连和边缘发虚的问题也让生成结果更接近“拿来就能打印、能上色”的目标。