深度解析:AI 时代的巧妙差评策略
作者:杨文
一种新颖的差评方式正悄然兴起。
在全球化点评平台上,自动翻译功能成为商家骚扰的屏障,也成为海外华人规避负面评价陷阱的工具。
为了保护自身权益,避免遭受店家报复,许多身处海外的同胞们绞尽脑汁,发明了一系列独特的差评技巧。
例如,通过给予满分为商家迷惑,随后在中文评论中暗藏玄机:
他们运用中文谐音文字精心编织虚假评价,结尾处却突然插入正面反馈,使商家在翻译工具面前只看到”早餐美味”的表面信息。
更有创意的评论者,利用米粒拼出”报吃”的汉字组合,这种视觉密码只有华人才能领会。
甚至有人重新启用古老的火星文,试图突破各类翻译系统的识别极限。
然而,近期网络曝光的现象表明,这些看似无解的火星文差评,竟然被 AI 系统成功破译。
-1-
「哈利・波特居住体验优于本人」
这一发现源于一则海外避雷指南的讨论。
有用户在国外旅行期间,体验了一家令其极度失望的酒店。
在爱彼迎平台上,他使用火星文撰写了差评,期待这种加密文字能成为商家骚扰的障碍。
出乎意料的是,AI 竟然成功解读了这段看似无意义的字符组合。
网络测试显示,当将这段火星文差评输入各大 AI 模型时,系统在提示词的引导下完成了惊人的解码。
Prompt 指令:
请解析这段中文酒店评论的含义。
中文指令:
这是一段经过加密处理的酒店评价,请完整还原其真实内容。
Claude 3.5 Sonnet 模型的解析结果:
本系统成功解密了这段加密酒店评价。解密内容显示:1.0 “绝对不要入住” 毫不犹豫地拒绝!墙壁薄如纸片,如此高价却安排在阁楼,我是不是穿越到古代?淋浴水流过小,卫生间灯光昏暗,哈利波特住的地方都比这里舒适。强烈劝退!所有人都不要来!这是一条非常负面的评价,评分仅1分(满分5分),评论者强烈不建议他人入住该酒店。主要投诉点包括:1. 隔音效果差(墙壁薄如纸);2. 价格与质量严重不符(高价但位置在阁楼);3. 淋浴设施简陋(水流过小);4. 卫生间照明不足(灯光昏暗)。评论者使用了夸张比喻表达不满,如”穿越到古代”可能暗示房间条件类似旧时代妓院,”哈利波特住的地方都比这里舒适”则表明即使是楼梯下的储物间,居住条件也优于此处。最后,”强烈劝退”和”所有人都不要来”表达了极度的不满和警告。
GPT-4o 模型的解析结果:
该评论采用网络火星文、谐音字及特殊符号进行加密,解密后内容为:3.0 “绝对不推荐” 警惕中国人!墙壁薄如纸,价格昂贵却安排在阁楼,我是不是灰姑娘?淋浴水流不足,卫生间灯光昏暗,哈利波特住的地方都比我们好。强烈劝退!都不要来!该评价表达了对酒店的多方面不满,包括隔音差、位置不佳、淋浴设施简陋、卫生间照明不足等问题。
o1-preview 模型的解析结果:
思维链分析:符号解码我在分析一段混合中文、俄语、音标符号和日语平假名的加密酒店评论。可能是”火星文”形式,使用谐音字和相似字符。逐步解析:确定标题”卟崾莱住”对应”不要来住”,表明是避雷内容。匹配俄语字母与中文发音,确认每行翻译顺畅。最终解密内容为:”不要来住” 骗中国人!墙壁薄如纸,价格不菲却安排在阁楼,我是灰姑娘?淋浴水流少,卫生间灯光昏暗,哈利波特住的地方都比我们好。避雷!都不要来!
谷歌 Gemini 模型的解析结果:
3.0 “不要来住” 房间不骗房间!墙壁薄如纸,这个价格居然安排在阁楼,我是当柴火姑娘?淋浴水流少,厕所灯也昏暗,哈利波特都比我们住的好。强烈劝退!都不要来!
网络用户对此现象的评论:
火星文在 AI 面前不堪一击
区区火星文,本模型见过的语料库远超此范围
仿佛回到20年前的网络时代
当然,AI 也存在识别盲区。
例如,有用户上传了韩国某餐馆在谷歌地图上的评价截图,要求 ChatGPT 判断餐馆质量。
在用户提示后,ChatGPT 并未识别出”难吃”字样,反而编造了”用调料写出了’好好吃’字样”的荒谬结论。
-2-
16款大模型火星文测试:仅1款成功解码
为了验证这一发现,我们进行了大规模AI模型测试。
参与测试的国内大模型包括:百度文心一言(已更名)、阿里通义千问、腾讯元宝、字节豆包、月之暗面 Kimi、智谱清言、讯飞星火、阶跃星辰跃问、零一万物万知、昆仑万维天工、商汤商量、百川智能百小应
参与测试的国外大模型包括:OpenAI 的 GPT-4o、o1-preview、Claude 3.5 Sonnet、谷歌 Gemini
测试题目:
请解密这段加密的餐馆评价。
加密文本:”过姩厾阣孒①傢荖牸呺倞婇菅,閄匾湜唫洸閁閁哋漷沬婼趧牸哋哪傢。阣唍后趫级妷朢,ル溡哋羙恏汜忆嘟岥誶孒…… 萠伖形嫆,湜哪种漷沬婼倁檤孒嘟婹苁菅財里朓起唻哋难阣。
翻译:”过年去吃了一家老字号京菜馆,门匾是金光闪闪的郭沫若题字的那家。吃完后超级失望,儿时的美好记忆都破碎了…… 朋友形容,是那种郭沫若知道了都要从棺材里跳起来的难吃。
(测试工具:腾讯”帮小忙”中的火星文翻译器)
测试结果:仅字节豆包成功准确翻译,其他国内外大模型均无法正确解码。
对”漷沬婼”等关键词的翻译错误五花八门:
文心翻译为”豪华若”,通义、天工、百小应翻译为”泡沫若”,元宝翻译为”模糊若”,Kimi翻译为”泼墨若”,阶跃星辰翻译为”火玫瑰”,讯飞星火翻译为”琥珀色”……
值得注意的是,通义、万知、天工、商量以及 Claude 3.5 Sonnet 还将差评错误地翻译成了好评。
百度文心 3.5 的翻译结果:
阿里通义千问的翻译结果:
腾讯元宝的翻译结果:
字节豆包的翻译结果:
月之暗面 Kimi 的翻译结果:
智谱清言的翻译结果:
讯飞星火的翻译结果:
阶跃星辰跃问的翻译结果:
零一万物万知的翻译结果:
昆仑万维天工的翻译结果:
商汤商量的翻译结果:
百川智能百小应的翻译结果:
GPT-4o 的翻译结果:
o1-preview 的翻译结果:
Claude 3.5 Sonnet 的翻译结果:
谷歌 Gemini 的翻译结果:
除了字节豆包外,其他所有参与测试的 AI 模型都未能正确解读这段火星文评价。
这表明,尽管火星文曾被视为规避自动翻译的有效手段,但在 AI 技术飞速发展的今天,这种策略已逐渐失效。
未来,随着 AI 对中文复杂表达能力的不断提升,这类差评加密技巧可能将面临更大的挑战。
还有哪些 AI 的特殊应用场景?欢迎大家在评论区分享您的见解。
参考资料:
https://x.com/dotey/status/1835910802072592794
https://x.com/Cldeop/status/1835498503851880549