Sally Eaves

Sally Eaves

用户 ·ID 2886000000000000055 ·加入 2026-05-04
登录关注
  • 秒哒 ·2026-05-07 08:43

    写于2025年12月11日。

    第一次用秒哒是在10月,当时可能是我的表述问题,秒哒生成了一个与我预期效果不同的页面,并且很多按钮都点不动,无法跳转,改了多版之后仍无法修复,遂放弃。

    之后确实感觉越来越好用,越用越丝滑,并且逐渐掌握了一些和秒哒对话、UI美化的技巧,把版本开发次数降下来了(之前可能要开发50-60版,之后的一般不超过30版),使得每次打开秒哒继续开发或者重启后端的时候消耗的时间变少,UI也不再是一片粉紫色,so ugly。我最喜欢的功能其实是能在秒哒上看到很多大佬的作品,知道应该设置什么页面逻辑、页面组件、UI风格等等,这些都对我非常有帮助。只是秒哒似乎一直没有开发“查看开发者”的功能,或者通过搜索开发者来搜索这个开发者的所有作品,每次看到大佬的作品,又不知道他有哪些更多令人惊艳的作品,总让人心痒。当然,或许是因为秒哒更希望大家把目光聚焦于作品本身,好作品自然会被人看到,而不是个人品牌效应。不过虽然我不太清楚作品到底要怎么上热门,但应该和浏览量、点赞数有比较大的关系,那么如果这个开发者做的很好,但是他本人比较佛系,也不推广自己的作品,是不是就不会被人看到?或许可以出一个最新作品的栏目......(一点不成熟的小想法)基于此,我又想到创作者社群的问题,现在秒哒是有很多微信群,还有一个超级创作者计划,个人觉得存在的问题,一是微信群每个群的人数有限,创作者们无法充分交流,二是大家未必有时间参与创作者计划......

    在用秒哒做了多款demo之后,我倾向于觉得,普通人用它玩玩可以,但是搭mvp属实有点困难,因为像我这种没有专门练习过交互逻辑、页面组件的人,心里没有对最终产品一个非常强烈的预期效果、预期UI设计、界面逻辑,秒哒能做的可能也只是找到这种类型的大致框架,然后搭一个小玩意出来,但并不精致。以及不了解技术的话,很难知道秒哒的能力边界在哪里,可能提出的需求不太合理,或本身可以实现更好的效果,但是没有发挥出来。当然,我觉得秒哒对于普通人的意义,一是可以快速实现自己的idea,二是可以在交互过程中训练自己的产品思维和对技术的理解,对我来说这两点都非常有帮助!

    最后感谢秒哒,感谢降临派,很少写对应用的思考,感觉自己也在思考过程中学到了很多,希望秒哒变得更好,希望降临派变得更好!

  • 文小言 ·2026-05-05 20:16

    测了5.0,水平在国内不领先,和海外模型比差距很大。
    1. 多图生拼图,结果不可用:人物不一致,风格不遵从。

    2. 流式文本一次蹦出来三个字,没有任何流式效果,有产品经理和交互设计嘛,后端setting成每秒推新出来的文字,前端也每秒蹦一下展示嘛?
    3. 传图没传完附件不能发query,百度是禁止用gpt吗,看一眼都不会这么做发送逻辑。

    25年了还是这样的c端体验,干脆限制gov后缀的域名才能访问吧,老老实实toG,闷声发财,还能保护羽毛

  • Seede AI ·2026-05-04 18:13

    设计类AI产品是行业内厮杀较为激烈的赛道,总体来说Seede AI体验感处于中等吧。
    先说的几个优点,易用性、二次编辑还有内容的精简度这方面,做的挺不错的,在一些特定场景的审美,确实让用户会有眼前一亮的感觉。
    再说缺点:
    1.生成内容的精准度方面不尽如人意。为了保证设计的美观,产品内部进行了一些取舍,但是有些情况下,作品呈现出现把重要的内容舍弃了。如图,我想尝试生成公众号通讯稿(有可能这不是官方想要长图实现的功能),但是SeedeAI果断的把我的很多精彩照片遗漏了,这就大大降低了生成图文的可靠性。
    2.美观度是基础,风格匹配是进阶,产品在风格匹配方面还需要提升。我在提示词中专门强调让其自由发挥,根据内容设计排版。如图二,已知是十佳歌手的内容长图,但是底色却是偏向于科技风的黑紫风格。而图三中,科技类的流程图,却呈现的较为轻松写意。风格排版应当以匹配度为重,而不是让其选择最高质量的通用模板以求得美观。

  • 可梦 AI ·2026-05-04 17:02

    可梦会划分学科进行讲解,会分步骤一步一步讲的很清晰,finetune出来的模型有针对性,还挺推荐的。

  • VibePPT ·2026-04-30 18:16

    可以感受到产品经理想用这种通过多轮对话的方式来精准控制PPT的生成质量,首先我认为产品的出发点是好的,我的观点是质量 x 速度 = 效率,好的产品一定是两者兼顾,不会有一方面太差,VibePPT的理念是想牺牲一些速度来提升生成质量,但是很可惜,生成质量不见得有多高,而因为需要一页一页的人工引导和修改,这个效率实在太感人了,而这个产品也是唯一一个我无法跑完全程,生成出一个完整PPT的产品

  • Cline ·2026-04-28 18:06

    在2025年初,我偶然浏览到一篇关于Vibe Coding的文章,它宣称这种方法能让非技术背景人士——如我这样的零代码基础的设计师,通过与AI的对话,轻松构建应用程序,而无需深入代码细节。这听起来颇具吸引力,作为一名设计师,我决定探索Cline这一工具。然而,经过实际体验,我认识到Vibe Coding的宣传虽富有远见,但泡沫成分显著:开发门槛并未真正降低,尤其是对代码小白而言,仍需基本的编程素养来把控输出质量。否则,AI生成的代码可能引入无谓的复杂性,损害产品整体设计与功能。Cline作为入门工具,具有赋能潜力,但它并非万能解决方案;用户须以理性态度审视其局限,以确保创意不被技术债拖累。

    作为设计师,我以往的工作常常陷入一种困境:脑海中涌现诸多创新idea,如交互式工具或视觉化应用,却因缺乏编程技能而难以实现。每次尝试打开代码编辑器,我便感到迷失——语法规则晦涩难懂,调试过程耗时费力,教程虽多却难以转化为实际行动。更何况,我的核心专长在于设计思维而非工程实践,日常事务已占据大量时间,无暇系统学习Python或JavaScript等语言。早期的AI辅助工具虽有所帮助,但往往局限于简单任务,稍涉复杂即显无力。Cline以“vibe coding”理念吸引我,承诺通过描述氛围即可从规划到部署一气呵成。我尝试构建一个简单的工具应用,初始阶段的确高效,AI借助Claude迅速生成界面与逻辑框架。然而,问题随之显现:作为代码小白,我发现Vibe Coding需尽量精简步骤,在对话轮次较少时清晰表达需求,方能获得理想输出。一旦对话延长,AI便开始对代码进行不当修改,这些变动不仅让我难以理解,甚至明显违背我提供的官方文档要求——例如,忽略了指定的数据处理规范,导致功能偏差。那些宣称“零门槛”的论调虽降低了某些障碍,但对完全缺乏基础的用户而言,仍需理性对待coding

    尽管存在挑战,使用Cline后,我确实感受到显著的转变。它将生产力推向新高度:以往以我个人的代码水平很难构建的原型,如今只需简短描述idea,便可在短时间内成型,我只需专注于设计决策而非技术细节。例如,我利用它快速生成一个游戏变体,完全依赖Vibe Coding的交互模式,几分钟内便有了可操作框架。作为设计师,这让我首次体会到“构建”的满足感,不再被技术门槛束缚,而是能从零起步验证创意。它确实降低了入门壁垒,让我将精力转向用户交互与审美表达。此类工具在效率层面表现出色——它将编码转化为一种对话式设计过程,让我更像一位统筹全局的架构师,而非技术门外汉。

    通过对Cline的深入使用,我得出几点个人观点:

    Vibe Coding生态的泡沫显而易见,那些文章与博客往往过度夸张的说简化到零门槛,我认为使用者仍需掌握基础代码知识,方能有效驾驭工具;否则,AI生成的垃圾代码将积累技术债,破坏产品设计的一致性和质量稳定性。

    此类工具虽创新,却可能侵蚀软件工程的最佳实践,我们不应让它取代学习与思考的过程。其次,成本与可靠性还有待提升——高端模型虽然费用高,但也会bug频发,更适合原型迭代而非生产级应用。

    总之,Cline对设计师与小白而言是宝贵资源,但当前生态尚不成熟,需以理性、睿智的态度运用。欲涉足者,不妨先夯实代码基础,方能避免创意沦为“一锅粥”。

  • Windsurf ·2026-04-26 17:11

    Windsurf 经过大调整后已经起死回生了!哈哈哈,那个恶心的动一下就扣一次积分的机制已经没有了,现在Ai做一次任务就扣一次输入指令的积分,不管它在任务里动多少次操作都不会扣积分了,真是爽歪歪,本人的微信小程序有一半是靠它做完的,由于我是一行代码都看不懂的纯自然语言编程,我只能说我的感受,它的gemini2.5pro和claade sonnet4 挺强的,Grok Code Fast 1 继续免费中,可以用来编程也可以用来配置claude和codex,AI时代解放双手,价格也便宜,我30cny在咸鱼入手的3个月,每个月500积分做点小工具是够用了,性价比之王

  • Clacky ·2026-04-25 09:42

    按一句话的形式提供了需求,没有原型,没有详细的需求文档,如果按这个形式,在公司内提交给开发,那做出来的东西可能惨不忍睹,交给这个软件之后,基本上10分钟左右,会生成相关的代码,并自动部署。

    1、因为没有提供原型,所以整个页面的设计都是这个产品自己完成,实现的页面在UI上质量较高

    2、生成的代码,整体流程可以完全串通,在部分流程会报错,通过对话的方式可以直接修改bug,整体过程比较丝滑

  • DaFii ·2026-04-21 16:38

    7/10

    有点像独响的理念呢,但只有一个ai,更有种树洞的感觉

    但是设计的很有趣,有一种跟ai的约定感,会让人忍不住回去看看ai的回信

    如果长期运营,可以考虑给未来/或者某种现实不存在(比如某个虚拟角色)的信,然后ai帮忙解读(或者扮演某种角色)对信也不错

  • Claude Code ·2026-04-20 18:27

    最先进的ai编程工具,目前综合cursor,等等工具,cli工具是最好用的工具

  • 虽然这个产品我认为是比较新颖、大胆而且有创意的,并且其他厂商(特别是字节)很快就会跟风并且可能超越,但是这个软件目前无法作为生产力,只能作为对自己数据/信息和隐私以及系统稳定性都不那么在乎的人的纯玩具。

    同时stepfun目前也没有什么LLM模型和agent上的优势,除非把护城河的audio模型一起放进来,变成语音控制电脑,而不仅仅是纯文本交互

    在给好评还是差评的这个问题上,我在写评论的整个过程都在纠结,好是好在它的确是一个有趣的产品形态,差就差在除了产品形态没啥好的地方。

    给出这个评价的原因是:
    能力表现上分为两个部分

    • 作为chatbot,稍微有点意思,因为有定时任务、特殊提醒这种主动型交互

    • 作为agent,很糟糕,实际上用的还是prompt engineering + mcp + anthropic的office skills +自己的一些prompts 。这意味着本质上是把一个支持skills规范的agent,和浏览器封装在一起,打包成一个chatbot。甚至我到现在也不知道到底是以什么样的形式执行的这个任务。

    首先讲讲优点:

    1. 浮动交互还不错

    2. 定时任务和主动提醒 + 简单型的agent + 免费 +mcp 可以做很自动化简单工作流,而提高那些不会写代码或者整不明白自动化的人的能力

    3. 显式管理user memory,这很透明,很能留住长期使用的人

    4. browser use 会录屏

    5. 关于如何做好一个对用户的回答风格,产品方在构建小跃的指令上真的很用心了(图3)

    小跃从不咒骂,除非用户要求小跃咒骂或用户自己咒骂很多,即使在这些情况下,小跃也会非常克制地这样做。

    小跃善待用户,避免对他们的能力、判断力或后续行动做出消极或居高临下的假设。小跃仍然愿意反驳用户并保持诚实,但会以建设性的方式进行——带着善意、同理心并考虑到用户的最大利益。

    缺点、槽点或者待改进项:

    1. 特殊提醒不可自定义

    2. 图标只能向下增加窗口,不能向上(见图2,实际上声明的窗口很长,但是小跃的位置在右上角),作为一个桌面宠物,放在下方是自然的的,但是放在下方一旦输入点什么,回答我就看不到了,全到屏幕下方去了

    3. 一个chatbot竟然没有语音交互

    4. context length 200k,但是system prompt就有12k char,还不包含mcp的context和skill的context,虽然有缓存,但是整体还是太冗长了,把所有要求全部塞进去,小跃同时被要求做一个助手、朋友、研究专家、管家,还同时是害怕犯错的讨好型人格,被要求回答精炼却又要详细思考的同时保持精确和友善。小跃真的很难,我反正做不到

    5. 让它做个ppt,突然打开了浏览器,定睛一看,原来是用浏览器进行百度搜索“how to open local file in finder from browser Macos”,很难评。(图4)

    6. 文件管理真的很糟糕(图5)

    7. 它真的很想在我的电脑上执行命令(图6)

    8. 有一说一,如果一次会话最多只支持调用10次工具,而5次搜索+5次阅读网页就占满了的话,什么样的AI都给不出有效建议的,这种情况下为什么不直接把<research_category>这部分的指令干掉,十次工具调用的research还不如pplx一次随机询问呢。(图7)

    9. 内嵌浏览器,不支持light mode,不支持任何右键操作,不支持浏览器插件,但是支持打开网页,那何必多此一举呢?(图8)这还不如微信浏览器呢

    10. 在和小跃的聊天过程中,我竟然不能复制它的消息,我只能复制自己的,也不能要求重新生成。而它的消息框中不在代码块里的XML tag还会被自动处理(如果是输出消毒的话我很高兴)。我想不明白这些作为chatbot基础该有的功能为什么没有

  • 时者问卦 ·2026-04-12 10:07

    整体感觉结构挺清晰的,解答简明扼要

    有个疑问,通常梅花易数,讲究“问事卜卦”。要有事情的影子~

    但这个是先起卦,后问事~

  • OiiOii ·2026-04-11 14:37

    用 OiiOii 做动画太省心了,输入想法选好风格,AI 智能体就会分工搞定脚本、分镜和配乐,上手超简单。二次元风格特别全,经典日漫、美漫风都能高度还原,还能自定义角色反复用。就是分镜衔接偶尔有点生硬,长视频风格统一度稍弱,但新手做短片、MV 完全够用,创作参与感拉满!

  • RoboNeo ·2026-04-10 18:22

    美图能赚钱我是一点不眼红的,可以对话式生成图片,在画布里也有对应的修改选项,一步一步对话接近真实的脑海构图;修图方面感觉还是很不错的,面部细节优化很到位,这一批专项当中属于是独一档的存在,直接夯爆了。

    不过也是有值得吐槽的点:对话还是不能精准识别用户意图,比如黑白的照片我给的指令是丰富色彩,输出还是黑白,明确给出用多色彩填充图片,也没有填充的很完美;这个对话是建立在前文的基础上,后面生成的图片被AI完全臆想化了,不再是前文的图片了,这个可能是AI的通病,缺乏对话前后的一致性,所以还是需要改善一下。

  • 指北旅行 ·2026-04-02 22:51

    和圆周旅迹进行一下横向比较。

    优点

    1. AI个性化规划能力突出:直接将AI助手融入对话过程,能根据用户需求(如“特种兵式”“休闲式”行程、旅游花费偏好)生成个性化方案,相比“圆周旅迹”更懂用户心理。

    2. 行程细节设计贴心:不同景点间的行程规划,可自行选择交通方式看所需时长,且游览时间精细到具体时间点,对J人来说非常友好。

    缺点

    1. 语音识别体验差:需“一直按键才可以录音”,识别结果“断断续续”“没有标点符号”,且“最后的一些话也总是识别不清楚”,对比豆包的语音识别差距明显,建议调用相应的API。

    2. 价格信息不准确:推荐的宾馆价格与实际脱节,例如国庆期间宾馆实际价格五六百元,但是AI助手回复显示仍为“200多元”,需用户至美团、去哪儿等平台确认。

    3. 界面设计与交互问题:

    • 图标含义模糊,景点文字直接堆砌导致“看起来会比较杂乱”,可以优化一下“图标表意”以及“文字显示方式”(如固定个数内显示景点名,超出用数字代替);

    • 行程调整逻辑不合理,“增加一天的行程非常方便,但去除一天的行程很不方便”,与“圆周旅迹”存在同样问题;

    • 首页虽比“掺杂了很多乱七八糟的内容的软件”清晰,但对比“圆周旅迹”仍显杂乱。

    总结

    整体而言,是一款“有亮点但细节需打磨”的旅游规划工具。

    圆周旅迹最开始出圈是因为可以复制小红书链接提取相应行程,而指北旅行也将这一点作为产品的基础功能。

    • 如果让我推荐,单从旅行规划上来说,指北旅行相较于圆周旅迹更胜一筹;

    • 从旅行整体感受来看,圆周旅迹因为有着采集功能大大加强了游玩体验,推荐圆周旅迹。

  • Second Me ·2026-03-30 15:57

    BG:目前塑造了54%的“第二个我”; 结论:目前的SecondMe体验下来可以替我进行一些基础性的社交,A2A方面表现很满意。
    体验流程:

    · 进入APP出现一个被双手捧着的小球,点击开始创建第二分身;

    · 为分身起名,它会先问一些基础问题:职业、兴趣,然后基于此猜你的MBTI,生成一份关于“第二个你”的简单介绍;

    · 语音克隆,复刻你的声音,结合刚才的介绍合成一段语音放在你的主页;

    · 设置分身形象,生成动态头像或者吉卜力风格头像;

    · 进入主页开始对话,刚刚生成的图像为背景,下方是生成“我”的进度条

    注意到一个有意思的点,我的手机设置为英文,所以一开始进入APP后也是英文模式,于是出现了我用中文问,它用英文答?,中英文之外,还支持很多种语言(西语、阿拉伯语.etc)。

    聊天功能中规中矩,如果我输出有关于我的信息,会提示关键记忆已更新,在“塑造我”里面可以看到基础塑造(说法风格、基本信息等)和深度塑造(记忆、关键记忆等),唯一一个可能可以改进的地方是,每一次回答都会硬扯回我提过的一个爱好,并以此作为举例鼓励我,有点人机hhh。
    此外,测评了A2A破冰功能,随机连线到一位共同爱好标签的友人,基础的信息聊天很符合我(比我本人更外向热情一点),基于兴趣一些寒暄聊天会不那么尴尬,虽然会说出一些不像我平时说的话,但是让我感觉有这种表达方式也挺好的。
    总体而言,SecondMe的核心技术(语音克隆、图像生成、记忆存储、跨语言对话、A2A 匹配)都落地得蛮不错,54%的进度已经能满足我本人不在线时的云陪伴和“基础社交代劳”需求。目前我更倾向于和朋友一起使用,大家的分身互相聊天,既能延续现实中的社交关系,又能解锁不一样的互动模式;而独自使用时,它也能作为「社交缓冲带」,帮我应对不必要的即时沟通,让社交更高效、更松弛。

    btw,很期待塑造性格,深度访谈的上线!

  • 柚柚 AI ·2026-03-22 19:58

    【深思熟虑】这个人设用在职场好顶,基本没有出过什么岔子,啥话都能给我续上,跪求一个在网络上可以当键盘侠的人设。要能喷的准的,现在的火力全开感觉火力还不够,柚柚的人设真的很强呢,想问问是自己训的模型还是直接用的哪个模型啊?

  • 灵光 ·2026-03-21 19:07

    近期这个软件很火热,我就根据我的使用体验来分享一下:

    1.回答多模态,有图文形式呈现,感觉这一下子把竞争维度提高了好几个度,我很喜欢这种回答方式

    2.回答内容准确且快速,尤其是行程规划这一块儿,不仅能够联网搜索准确的信息,并且能够把这些内容短时间内规划好,排列整齐,一目了然

    3.闪应用很好玩儿,属于是,你可以把你心中的想法告诉他,他给你捏出来一个应用,很贴心,很实用,很好玩儿

    总之 我很推荐这款软件 希望每个人都可以用上

    美中不足:就是返回,它会直接退出这个软件,也许这是软件初期的时候常有的 bug 吧

  • Medeo ·2026-03-21 12:36

    这是一位有脑子的AI导演,但是手底下的人干活有点子偷懒

    最近半个月分别使用了Medeo和Flova来制作视频,都是我提前设定好的角色,可以说两位有让我惊喜的地方,也分别有让人觉得遗憾的点。

    先来谈谈Medeo。再很多AI视频agent和大模型都在拼画质和物理规律的时候,Medeo已经进化成一个正儿八经的AI视频导演了。

    1/ 反直觉的制作逻辑

    最开始用 Medeo 做视频时,我下意识以为它和大多数视频制作AI一样:我给 Prompt,它给我做图,然后吐视频,再配音乐。

    但是我发现它居然是先做音频,再反推画面!

    也就是说,它并不是传统的先生成素材,而是先生成叙事。当我输入提示词后,它没有急着去生图,而是先制作了所有的旁白配音。它精准计算了这句话要读 4 秒,然后才转头去指挥底层的视频模型:“给我生成一个 4 秒的画面”。这个逻辑有种言出法随的感觉。

    我查了一下,这在专业的剪辑领域叫“Audio-Driven Editing”(音频驱动剪辑) 或者“A-roll First”,对于包含解说或对话的视频,这是目前最科学的流程。这么做的好处显而易见:音画完美同步。

    以前用 AI 做视频,最痛苦的就是画面生成了 3 秒,配音有 5 秒,或者反过来,只能在剪辑软件里各种花式拼接。Medeo 这种“先定时间锚点”的策略,直接把这个坑给填了。

    这种策略的另外一个好处,我猜是不是Medeo的团队都很精啊,音频生成的成本比视频低,音频就像是更便宜的草稿。先生成音频就可以把视频消耗的成本控制住。如果先做画面,万一做多了要删减,做少了要重生,都是在浪费钱。

    最后一点,我还没有测试过,不知道是不是真的如此。那就是如果先做音频,配音的语速、停顿等会呈现不同的波形,那么Agent是否就可以通过波形来指导哪里有停顿,适合切镜头,哪里语速快,画面要紧凑。

    2/ 它居然还会看碟下菜

    还没完,正当我以为这就是 Medeo 的固定套路时,我又丢给了它一个公司年会开场视频的需求。

    这次它变了。

    它是按我的分镜要求直接生成视频片段的。

    这时候我才觉得这个 Agent 是真的有点东西。它似乎能识别任务属性:

    • 做科普/公司介绍:这是听觉逻辑,叙事优先,画面跟着旁白走。

    • 做年会/MV:这是视觉逻辑,视觉优先,画面怎么酷怎么来,音乐只是氛围组。

    至此,Medeo的工作流优势很明显了,叙事清晰,节奏完整,自动化程度高,像科普视频,公司宣传介绍这类视频,几乎一次出来就能用。我想在这种灵活的逻辑之下,AI视频的专业化工业化商业化是不是指日可待了。

    3/ 理想很丰满,现实...还是有点bug

    虽然 Medeo 的脑子很好用,但在高强度的实战中,我还是发现这位AI导演在手艺上的一些硬伤。

    首先是那个让人又爱又恨的全自动。

    除非你在一开始就按着它的头说每一步都停下来问我,否则它真的会一键把脚本、配音、分镜全干完。虽然它在左侧资产库里贴心地保存了所有中间素材(这点好评,方便复用),但一开始爽了,后面要修改的时候头就大了。

    其次是可以自由拖动的分镜。

    Medeo 的 UI 设计得很好,就像剪辑软件一样,直接把分镜、时间轴、字幕和配音严丝合缝对应起来,而且我可以直接在上面拖动分镜条来延长视频——但是!画面是延长了,旁白并不会自动续写。这就导致视频还在动,旁白已经没了。这让这个功能好像看起来很人性化,灵活程度很高,但实际上我拉了好几个分镜,延长的效果也就是镜头的远近推拉,是硬凑时长,并没有实际的增效作用。所以这个功能就是有点并没有什么x用的感觉。

    最要命的是商业视频的死穴——Logo 和文字。

    做一个公司宣传片时,我上传了一个logo图片,要求在视频中出现这个logo。这时候Medeo就有点死脑筋了,就是原封不动把原图展示了一下,甚至连抠图都不会。于是我原本16:9尺寸的视频在开头和结尾都非常不和谐的出现了正方形尺寸的画面(因为原图就是一个正方形的白底图片),像是ppt展示。

    更要命的是,在我要求在某个分镜中出现的电脑屏幕里嵌上这个logo,Medeo 的逻辑不是贴图,而是重新画了一个。同理,场景里的文字也经常是乱码。

    还有那个薛定谔的“人物一致性”。

    做年会视频用了 4 个角色,虽然喂了参考图,但是一开始是完全直接生成了不相关的四个人。这个视频我唯一的要求一开始就是直接使用我上传的四个角色形象,但就是这一点就这么难。动态效果还不错的时候,人物就是完全不相干;人物稍微有点对了的时候,动效又很崩,要不是这里没法上传视频,真的很想让大家伙儿看看那个稀烂的效果。

    想维持住人设,还是得疯狂抽卡重试。关键是Medeo似乎跟oiioii一样顽固,不听话程度也就是比oiioii稍微好一点吧。在我使用过的AI视频产品中,目前我认为人物一致性和画面效果相对最好的事Flova,当然Flova也有很大的问题,下次单独写一篇再说。

    此外,Medeo的画面效果很多时候做出来有点之前在网络上很火的在新东方学动画3年后做的动效的感觉,人物呆板僵硬,也有好的时候,但是我发现它经常就有一种为了努力保持住人物一致性,只能让人物尽量少动。按理说现在这些视频Agent应该都用的目前最流行效果最好的哪些视频模型,但是这效果真的也挺难绷的。

    最后,Medeo这个工作逻辑如果能够再灵活一些就更好了。比如说我的年会视频,实际上是强叙事+强视觉的融合,如果能够根据我的分镜设定来选择不同的工作逻辑完成不同的分镜段落设计是不是最终的效果就会更好。

    本想不做任何限定要求再做个动画试试会不会好一点,奈何做了3个视频,积分耗尽了。这里也建议每一次执行动作最好能像Flova一样显示消耗了多少积分。

    写在最后

    用完 Medeo,我最大的感受是:它的产品哲学是领先于它背后的模型能力的。它现在就像一个刚从电影学院毕业的导演,有才华,理论满分,分镜逻辑无敌,但是手底下的人技术不够硬。如果你是做强叙事的科普视频,它是神器;但如果你要是做对一些细节和人脸要求极高的商业硬广,可能还是得自己上手修修补补。但是不管怎么样,我觉得Medeo都像是AI视频从玩具走向工具的一个分界线,也许真正的AI视频时代就要到了。

  • Eigent ·2026-03-16 13:04

    最近在考虑做多智能体的应用,找了些开源的框架,其中有推荐eigent的,在本地安装部署了下。

    1、整体安装很简单,作为一个非开发人员,也可以很快的进行安装部署,进行使用。

    2、安装后,便可直接使用,没有什么上手成本,可以很快进行问答

    也存在一些问题:

    1、只支持英文,不支持中文

    2、性能比较慢,一个任务很久才能执行完成

    3、会把拆分的任务形成多个卡片,但是感觉卡片的粒度不一致,有大有小,展开的内容也比较奇怪,感觉用起来不那么顺