我不常用这个场景,作为一个未大规模推广的试验性产品,我认为技术驱动大于需求驱动,只是放在微信小程序端,既没有足够的用户基数产生大量评价,也没有足够的技术成熟度解决根本性的AI识图难题,唯一的价值可能就是未来和滴滴打车高绑定?比如识别到地点立马叫车?,但我觉得这本质上还是“人找信息”,并没有真正实现“信息主动服务于人”
从我的日常生活来看,远一点的要么是看抖音、小红书又或者是一些论坛偶然刷到推荐,近一点的打开美团、高德扫街、大众点评这一类的软件简单搜一搜就可以出发了,这种通过照片反向定位地点的需求不能说没有但确实不多,姑且算作一个长尾能力吧
在体验上缺点简单列一些,毕竟我也不是专业的:
识别准确率低,我识别了手机相册里的一堆地点场景,经过多次尝试我发现,背景里有明显标志的图片,识别准确率稍高,没有明确性地理建筑标志的判断全靠幻觉,那么问题就来了,有明确地标的我基本上都看得出来,或者最简单的百度搜图都知道,不需要通过这个软件告诉我,不明确的地标你又不知道,那么我用你干嘛?包括识别食物也是,像烤匠这类因表面配料繁杂、缺少典型鱼类特征,即便我特意提供了带盘子侧面角度的清晰图,依然无法正确识别,当然毕竟产品刚上线,只期待未来能有持续改进
偏差问题未解决,AI Sees Your Location, But With A Bias Toward The Wealthy World之前这篇论文里曾经提到过视觉语言模型存在三大偏差:偏向知名城市、跨区域准确率差异、与发展水平的虚假关联,这几个也符合我们大众的猜想,结合我的测试以及一些输出的COT信息,这些问题并没有通过这款微信小程序在工程化上给我有任何的改善的体感,这里我打个问号,毕竟只是结合我的体验猜测
交互设计缺失重试机制,在测试过程我遇到了两个BUG,一个可能是大模型API调用过程中途出现网络错误,导致输出一般就卡住了没有继续输出,不过我也可以接受下发的刷新小按钮重试,但如果能通过工程化解决会更好,另一个是前端状态异常的BUG,明明已经全部完成了结果的输出呈现,结果下发一直还是“识别中”,并且无法停止,这个确实让我很烦必须重启微信才最终中断掉了,在这样一个大公司里确实算是比较低级的错误了,你们又不是没有测试
图片审核过于严格,不知道是基于模型识别机制还是调用的第三方审核的API做识别,给了个寺庙外面宣传墙壁背景,文字是“天西尺咫”,这张图既无敏感内容,也无违规文字,为何会被拦截?
至于优点,坦白讲,现阶段我实在想不出明显的优点,唯一可以预见的可能性就是未来或许能与滴滴的出行生态深度整合,比如识别出目的地后一键叫车,或将常去地点纳入个性化服务推荐体系。但我们回到现实来讲,谁会专门下载滴滴软件打车,不都是集成到导航类软件里了,如果没有场景上的不可替代性,这样的功能很容易沦为鸡肋,那靠什么呢,难道是优惠券么?从另一方面想,一开始就只放在了小程序端,多半内部也不重视吧hhh