今天测评了一下智能体一键生成视频
他的视频生成逻辑不是所谓的文生视频和图升视频,而是把视频制作过程拆解成工作流,然后按顺序执行。
简单梳理下视频制作过程,拆解需求-查找资料-构思分镜-调用MCP生成分镜图-调用minimaxMCP生成音频-调用分镜图图生视频-合成文音画
1.整体速度很慢,一个一个单线在运行,可能是区别对待了非充值用户。
2.整体逻辑没问题,但是生成出的成本还是有一些无法忽视的瑕疵,主要是在视频画面上。
3.工作流思路很好,充分调用其他厂商的优秀资源做整合很好。
优化建议:
1.文案方面,需要教会智能体辨别优质资料,直接忽略搜狐 网易等水贴多的垃圾资料
2.整理工作流方面,应该在全局有一个审核结果的智能体,就像一线员工与项目主管,每个智能体给出的结果不符合要求的可以直接让返工重做,比如生成的图片明显是外国人的,不符合要求,可以打回重做,比如生成的视频不符合现实物理逻辑,穿模等等,打回重做。
以上两点改进后,这个产品才不是只能跑起来炫酷,而是能给用户交付满意的结果。