-
测试对话与即时优化
测试对话与即时优化
我之前帮奶茶店搭的机器人“小甜”,刚上线那会儿闹过笑话——用户问“杨枝甘露能做去冰吗?”,它回“杨枝甘露18元一杯~”,把老板娘急得直拍大腿。后来我才明白:测试不是“做完流程点个发布”,而是得像“陪用户聊天”一样,把机器人“按在地上摩擦”,逼它暴露问题,再当场改。 这节就用“小甜”的血泪史,教你怎么“虐”机器人,再“救”它变聪明。
一、测试前:先当“事儿多用户”,列份“找茬清单”
测试不是随便问两句,得像“甲方爸爸”一样,把机器人可能遇到的情况全列出来。我给“小甜”列的清单分3类,你可以直接抄:
基础功能必测项(机器人“本职工作”):
1.用户问“有杨枝甘露吗?”→ 得答“有的~杨枝甘露18元,可选大杯/中杯,加椰果1元哦~”;
2.用户说“我要下单”→ 得按“选饮品→选规格→选加料”引导;
3.用户问“热饮有哪些?”→ 得从知识库调出“姜枣茶、热可可”。
多轮对话折磨项(机器人“连续聊天”能力):
1.用户:“我要一杯奶茶。”→ 机器人:“您想选哪款呀?有杨枝甘露、芒果冰沙~”;
2.用户:“杨枝甘露。”→ 机器人:“大杯还是中杯呢?”;
3.用户:“大杯,加珍珠。”→ 机器人:“好的~大杯杨枝甘露加珍珠,19元~需要帮您下单吗?”。
异常场景搞事项(机器人“抗揍”能力):
1.用户乱输入:“一杯空气奶茶。”→ 机器人:“空气奶茶暂时没有哦~试试杨枝甘露吧~”;
2.用户绕弯问:“杨枝甘露比冰沙贵吗?”→ 机器人:“杨枝甘露18元,冰沙16元~杨枝甘露稍贵但料更足哦~”;
3.用户骂街:“什么破机器人,半天答不上来!”→ 机器人:“抱歉让您着急了~您具体想问什么,我再仔细帮您查~”。
划重点:清单里的问题越“离谱”越好!你越“***难”,机器人越能暴露短板——比如用户打错字(“杨枝干露”)、用方言(“大杯杨枝甘露几多钱?”)、绕着问(“冰沙有没有小杯?”),这些都得测。
二、测试时:开“上帝视角”,把机器人“扒光了看”
测试不是光看“机器人说了啥”,得像“拆机器”一样,看它“怎么想的”。我用Coze平台测试“小甜”时,开了俩窗口:
对话窗口:模拟用户,输入问题,看机器人回复;
后台日志:看机器人“内部运转”(比如它查了哪个知识库,调了哪个插件,变量传没传对)。
-
第一步:盯“回复准不准”——对答案,揪错别字
用户问“杨枝甘露多少钱?”,机器人答“杨枝甘露18元”→ 合格;
用户问“大杯杨枝甘露多少钱?”,机器人答“杨枝甘露18元”→ 不合格(漏了“大杯”);
用户问“杨枝干露多少钱?”,机器人答“不知道”→ 不合格(没识别错别字)。
实操技巧:用Excel列“测试用例表”,左边是用户问题,右边是“预期回答”和“实际回答”,一目了然。比如:
用户问题 预期回答 实际回答 是否合格
大杯杨枝甘露多少钱? 大杯杨枝甘露18元~ 杨枝甘露18元 不合格
杨枝干露多少钱? 杨枝甘露18元一杯~ 不知道 不合格
-
第二步:看“流程顺不顺”——卡在哪一步,为什么卡
用户说“我要下单”,机器人没问“选哪款”→ 看后台日志,发现“点单引导节点”没连上;
用户选了“大杯杨枝甘露加珍珠”,机器人答“订单已提交”,但后台没收到数据→ 看日志,发现“表单节点”的“提交接口”填错了(写成了“/order/add”,正确是“/order/create”)。
关键提醒:流程卡壳90%是“连线没连对”或“参数填错”!比如“用户输入节点”没连到“知识查询节点”,或者“加料”变量名写成了“jia_liao”(正确是“topping”)。 -
第三步:查“语气对不对”——像不像“活人”说话
用户问“有热饮吗?”,机器人答“有热饮”→ 太生硬(正确语气:“有的呀~热饮有姜枣茶和热可可,冬天喝超暖的~”);
用户说“谢谢”,机器人答“不客气”→ 太冷淡(正确语气:“不客气~能帮到您超开心!”)。
小技巧:把机器人回复读出声,感觉像和“奶茶店小妹”聊天吗?如果像“客服机器人”,说明语气设定得调(比如把“专业”改成“亲切”)。
三、优化:发现问题,当场“打补丁”
测试不是“挑刺”,是“给机器人治病”。发现问题后,按“定位→修改→复测”三步,当场解决。 -
案例1:用户问“大杯杨枝甘露多少钱?”,机器人漏答“大杯”
定位:看后台日志,知识查询节点返回的“价格”字段只有“杨枝甘露=18元”,没标“大杯/中杯”;
修改:去知识库编辑“杨枝甘露”的价格,补充“大杯=18元,中杯=16元”;
复测:用户再问“大杯杨枝甘露多少钱?”,机器人答“大杯杨枝甘露18元~”,合格。 -
案例2:用户打错字“杨枝干露”,机器人答“不知道”
定位:知识库里“杨枝甘露”的“同义词”只有“杨枝甘露”,没加“杨枝干露”;
修改:在知识库“杨枝甘露”的“同义词”里加“杨枝干露”;
复测:用户问“杨枝干露多少钱?”,机器人答“杨枝甘露18元一杯~”,合格。 -
案例3:用户骂街“破机器人”,机器人没安抚
定位:基础指令里没写“用户骂街”的应急回复;
修改:在“不能做”指令里加“当用户输入包含‘破’‘垃圾’等负面词时,回复‘抱歉让您不满意了~您具体遇到什么问题,我帮您反馈给老板~’”;
复测:用户说“破机器人”,机器人答“抱歉让您不满意了~您具体遇到什么问题,我帮您反馈给老板~”,合格。
四、上线后:持续“喂数据”,让机器人越用越聪明
测试通过不是结束,是“机器人成长”的开始。上线后,我教老板娘做了两件事:
收集“真实问题”:在奶茶店群里发问卷,让顾客写“机器人没答好的问题”(比如“能不能做少糖?”“冰沙有小杯吗?”),每周整理一次,补充到知识库;
观察“高频错误”:看后台日志,统计机器人“答非所问”最多的问题(比如“加料多少钱”),针对性优化指令(加一条“当用户问加料价格时,回答‘珍珠/椰果/布丁各加1元哦~’”)。
总结
测试对话和即时优化,就像“教小孩学说话”——你得先“挑刺”,再“纠正”,它才会越学越乖。别嫌麻烦,你测的每一个问题、改的每一条指令,都会让机器人离“贴心小助手”更近一步。
现在,打开你的机器人后台,按这节的方法“虐它”吧!记住:机器人不是“一发布就完美”,而是“越用越聪明”——你多花一分心思,它就能多懂用户一分。
本站原创,转载请注明出处:https://www.xin3721.com/ArticlePrograme/robot/52905.html