一、写在前面:从互联网老兵到 AI 新手
大家好,我是一名拥有 10 多年互联网行业经验的产品经理,虽在大厂算专家级,但面对飞速发展的 AI 领域,我如同纯新手,无代码基础。今年年初,AI 的飞速发展让我兴奋不已,仿佛回到当年初经历移动互联网浪潮的时候。平时我有很多产品小想法,以往开发产品需要大力出奇迹,如今大模型诞生,让我觉得一个人或少量人配合就能实现过去团队才能完成的事。
于是,8 月 27 日我加入生财,第一次参加 9 月的航海实战,在“爆款古诗词生成”实操中踩了不少贴近普通新手的“非技术型坑”。比如不懂如何优化提示词、不熟悉付费工具的操作细节等。这些经历没有复杂的技术门槛,或许能给和我一样零基础入局的朋友,提供更实用的避坑参考。
二、实操准备:工作流思路分析拆解+风险预估
带着这样的期待和背景,我开始按照航海教程进行“爆款古诗词生成”的实操:
2.1、分析拆解整体工作流思路:
根据教程,整个工作流大致分为以下几个步骤:

1、根据输入诗词短句,调用大模型,检索出完整古诗词和作者等相关信息 2、调用大模型,根据诗词内容,产出文生图提示词——免费 3、调用豆包大模型,根据提示词胜生成图片——付费,智界 4、调用豆包大模型,把图片拆解成,分镜视频提示词——免费 5、调用豆包大模型,提示词生成视频——付费,智界 6、生成语音、拆分字幕、挑选bgm 7、大量插入“超级剪映小助手pro”插件,进行整体视频的剪辑 8、生成剪辑视频草稿,同步到剪映app草稿箱
2.2、实操前的风险预估:
1、第3步和第5步需要付费调用智界api ,教程提示到图片约0.3 一张,视频0.7一段;需要填入api-key;
2、第6步开始需要频繁的设置剪映小助手pro,太多的文字、时间线、字幕等需要设置,步骤容易出错。
3、教程的最后提醒到,工作流试运行如果不成功,不要频繁的试运行,成本太高。需要检查配置界面,单独节点的入参和出参。——此处对成本太高,还没有概念,后面会发现此处才是精华。
三、实操过程:编程与试运行的那些坑
3.1 工作流编程遇到的问题
工作流比较长,编写起来耗时较久,我大概花了 2 小时。而且整个工作流非常卡顿,我不知道是什么原因,画布的左右上下拖动都需要响应好几秒。我先后换了 3 台电脑,一台 mac 一体机,一台 MacPro 2019 16G,一台 MacPro 2019 32G,也许是我的电脑配置都比较旧?卡顿加上工作流节点太多,让我中间挺没耐心的。不过我还是尽量对照教程,仔细做好各节点的配置,大概用了 70%的仔细程度,想着问题应该没太多了,等运行有问题再检查吧。
3.2 试运的“九九八十一难”
第一次试运行:试运行的过程有点漫长,刚开始视频生成不成功,提醒“运行不成功”,现在看日志,会发现,错误提醒的很清楚,是图片生成文字未生成;但当时,我觉得毫无头绪、、、此时,我采用了最笨的办法,把节点配置都检查了一遍。确实检查出一些小错误,但还并不是下面日志里提示的错误。

第二次试运行:运行到一半自己停止了,忘记什么原因了,大概是跨天了,对自己写的工作流准确度没信心,然后全部检查了一遍~

第三次试运行:果然不出我的预料,没成功,又卡在了视频生成阶段,我都要焦虑且没有耐心了。一股脑地截图发给教练,教练提醒是大模型设置有问题,图片生成的尺寸设置错误,应该是 1080✖️1920,而我写成了 1080*1920,这一个小小的符号差异,就像一颗小石子,搅乱了我整个的试运行计划。同时,我还犯了个大错,截图的时候把智界的 api - key 发到了微信群,教练赶紧提醒我要重置,后续发 key 可得打码、、、有点羞愧。

为了更好的阅读体验,来飞书看吧:
https://wwubzutkpo.feishu.cn/wiki/HtFbwAEhli54Cekv2bhcatW3nzk
Comments on "小白亲测“爆款古诗词生成”:那些踩过的坑,比成功更值得说" :