在Gemini 2 image(谷歌大模型)刚出来的时候,我立马去测试了一下。
它新增的功能是文生图,我就按照我脑子中传统的文生图逻辑来测试了一些提示词生成图片的效果,看完了我觉得很一般,Gemini又弄出来了一个一般般的模型。



反正也不能说很烂,反正不要钱整个效果也能接受吧。
结论我也得出来了,我就跑去继续研究我的Agent如何提升准确率去了。
晚上下班前看到一泽他们测试的Gemini2,我一脸懵逼,这跟我测的真的是一个模型吗???


他们怎么能做到用Gemini 2达到这么强的效果???
以及这群人脑洞是怎么长的,这测试方法我想都想不出来。
当时我就一直在跟小伙伴说,我觉得AI时代见得多是非常的重要,想象力被局限了非常容易变成一只井底之蛙。
4o image(ChatGPT的文生图)出来之后我长了个心眼,我立马拉了个一个素材汇总群,把各个地方看到的素材都收集起来。


最后不得不感慨网友脑洞真的大,4o image这个模型居然能被各种整活。
炉石卡牌都搞出来了!!!
于是我顺手也抽了张卡,发挥了一下我的脑洞,哈哈哈

为了更好的阅读体验,来飞书看吧:
https://t16jzwqrzjx.feishu.cn/docx/CJsPdhooDob0T9xfPF9cHBNRnzK
Comments on "AI月报v2丨跳出“我的视角”陷阱:3月最大领悟来自看见世界" :