你有没有遇到过这种情况:
写着写着文章,感觉需要插入图片来丰富文章内容,但是自己又没有合适的图片素材
去网上搜找不到合适的,而且还有版权风险 使用ai配图吧,还要不停地切换窗口去写提示词,生成图片,下载。 哦对了,有的app和网站生成的图片还带水印,你还得想办法去去水印,然后再复制到我们的文本编辑框里。
这样一套流程下来,效率低不说,更痛苦的就是刚刚写作的思路被打断了,突然忘了接下去怎么写了。 也就是我们所说的
打断了写作过程的心流状态
那么,有没有什么办法,在不打扰我们的情况下
不需要写复杂的提示词,不需要切换窗口,直接帮我们生成符合文章段落内容的配图呢?
当然有,我使用阿里最新的生图模型qwen-image的api,然后用腾讯的codebuddy,制作了一个ai配图助手的浏览器插件。 如图,这个插件长这个样子。

使用方法:
基于 ModelScope 文生图 API,一键把网页上的文字生成“封面图/插图”。适合写公众号、博客、文档配图。
选中文章中的一句话或一段文字 右键菜单选择“生成封面图”或“生成插图” 弹窗可临时调整:模型/尺寸/风格 页面会出现进度浮层,完成后展示预览 结果操作:插入到编辑器
接下来就让我来带着大家一起学习,如何制作这样一个调用api来实现一键生成高质量配图的工具呢。 首先先给大家说一下我为什么选择qwen-image这个模型
第一:能力强
开源 Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。

Qwen-Image的主要特性包括:卓越的文本渲染能力: Qwen-Image 在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。 一致性的图像编辑能力: 通过增强的多任务训练范式,Qwen-Image 在编辑过程中能出色地保持编辑的一致性。 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。
更详细的介绍可以看一下官方的介绍:告别文字乱码!全新文生图模型Qwen-Image来咯
为了更好的阅读体验,来飞书看吧:
https://jx680r0cil.feishu.cn/wiki/JFk4wnLbIi8kkykAWl6cbccYnMb
Comments on "一键生成高质量配图,阿里qwen-image搭配腾讯codebuddy,解决了我的写作焦虑" :