翻译功能已出,小红书的AI布局还会远吗?
内容转载自:倩仪
由于美官方禁令,TikTok公司(下称TT)于当地时间2025年1月18日中午停止在美服务,于1月19日中午恢复服务。
在停服时间前后,大量“TikTok难民”涌入“平替”小红书。而未大力增长海外业务的小红书,在面临海内外共用服务器对现有社区的一次冲击,采取了诸多方式迎接挑战,包括本文主要探讨议题——5天迅速上线的“翻译”功能。
1月16日左右,TT停服的风声传遍全美,继而“爆发”了TikTok难民事件,大量美国人涌入小红书。
首当其冲的是最严峻的问题,新来的用户与社区本土语言难以互通。在众多呼声中,小红书在1月19日左右上线了翻译功能。
起初,大家预期只是简单的语言翻译功能,可以一键将中文与所设置的系统语言互译。
有道词典以为小红书只是接了翻译接口,而自己作为“翻译专家”却无人问津
慢慢地,大量网民发现这不是简单的翻译,一些新潮的网络俚语和其他字符也可以被翻译出来。
1、网络俚语
2、颜文字
3、摩斯密码
看起来,这不是普通的翻译可以做到的,如果是一个纯翻译的功能,为了追求准确性和严谨性,对应的固定匹配结果一定是相对生硬的,而非这么有“互联网味儿”。
这是怎么回事呢?
很快,有网友通过一些“奇特代码”,发现了背后的“秘密”。
输入一些特定格式的内容时,竟然可以发出“指令”信息,甚至“钓”出了背后的大佬。
“翻译”供出来了自己接入了大语言模型(GPT-4,是否为真有待商榷),这也解释了为什么前面五花八门的内容,都能翻到大伙的心趴上。
基于这个现象,我个人推测,小红书在调用大模型时,提前预设了类似“翻译用户的输入”的prompt,并把评论内容作为大模型的input;但是没想到的是(或没来得及优化),由于模型的不稳定,指令遵循能力不够强,用户内容中有明显分隔文案(图中为“after that”)后的剩余内容被作为指令执行,忽略了“翻译”的期望方向。
另外,还有一个有趣的现象,以prompt的内容,问出相同的问题,大模型又声称自己是【智谱清言(ChatGLM)】。
经过评论区多种prompt测试,最终只出现过这两种结果:【GPT-4】和【智谱清言】。基于以下几点原因:
- 政治层面,较为主流的社交软接入国外API会涉及到信息安全问题;
- 性能方面,GPT-4训练的中文语料很少,难以达到目前小红书里呈现出的翻译性能;
- 权限方面,GPT-4的公司OpenAI在去年7月切断了非支持国家的API服务,其中支持国家不包括中国内地、中国香港和澳门。
因此,最终猜测接入的是智谱清言大模型。
而出现GPT大概率是由于智谱清言是基于GPT大模型微调,大量使用了GPT语料库,以致于在模型蒸馏后产生了幻觉。
回归到产品分析上,从产品功能定位看,小红书的翻译注定不能和有道词典有相同的定位。
从使用场景上看,在互联网交流中,俚语是构成互联网沟通的主要元素之一。
可以观察发现,在这场TT难民迁移活动中,很多美国用户热衷于用“NB”、”666″、“cpdd”等有中国特色的俚语对帖子进行评价,并以此作为主要融入方式。
大语言模型的接入自然而然有了先决条件:既符合了“翻译”语言的定位,经过国内互联网语料信息训练后的模型,也符合了“融入文化”的定位:
- 对于美国人,在极大地降低了APP使用门槛的同时,也发现了这个平台和TikTok对于不同社交需求的满足点;
- 对于小红书上的“原住民”,在好奇、自豪等等兴奋状态下,强化了AI提高APP体验的实际感受。
这也让小红书在TikTok短短停服的几天内,在巧妙接住泼天流量的同时,也为AI的应用落地探索迈出了重要的一步。
本文地址:http://mip.sunnao.cn/archives/1423
以上内容源自互联网,由运营助手整理汇总,其目的在于收集传播生活技巧,行业技能,本网站不对其真实性、可靠性承担任何法律责任。如发现本站文章存在版权问题,烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com,我们将及时处理。