如果说有人猜测因为人工智能的发展,人们渐渐不再有学习外语的需求,那么一些数据反映出来的情况正好相反——尽管人工智能在各种跨语言的场景中发挥着越来越重要的作用,但“肉身”学外语的乐趣,仍旧不可替代。从一门语言的入门、进阶,再到综合运用,人工智能在每个阶段都可以起到很好的辅助作用,关键在于如何运用。
这只古灵精怪的绿色猫头鹰,好像很难让人忽视它的存在。
它是吕宇珺手机桌面上的一个组件,一天之内会变换各种表情,时而是振臂呼唤“坚持就是胜利”,时而是撒娇状的跪地祈求“来学一个嘛”,时而又是翻白眼的鄙视眼神“还不去学习?!”。当这只猫头鹰因愤怒而变红,发出咆哮“最后的机会!”,随之进入按秒走的倒计时,吕宇珺经常会在这一刻点进这个叫“多邻国”(Duolingo)的外语学习APP,开始当日的打卡。这是保持连胜的最后机会。
吕宇珺是一位资深译者,翻译过《毫无意义的工作》这样的畅销书,之前还是新东方的英语教师,长期教授《新概念英语》的课程。对外语的兴趣,让她很自然地成为“多邻国”在国内的第一批使用者。如今她已经是一位“重度”用户,每天在上面做题的时间加起来能有半小时左右,还解锁了上面所有的外语课程。
吕宇珺原来担任过新东方的英语老师,现在是一位资深译者
凭借突出的下载量,“多邻国”成为语言类线上学习工具的代表。“通过它,很容易就对一门外语建立一个初步的了解。当有一天你突然心潮澎湃想要学习一门语言,不可能一下就砸几千块钱进去。这时候用‘多邻国’来开启一门新语言就最合适了。”吕宇珺说。目前为止,用户在“多邻国”上能够接触到42种语言的课程,不仅有夏威夷语、纳瓦霍语、威尔士语等六种濒危语言,还有完全虚构出来的克林贡语——在科幻电影《星际迷航》里外星种族克林贡人使用的语言,另外针对中国用户还有粤语这样的方言课程。
“要说这款APP为什么那么让人上瘾,还要归功于它从游戏借鉴来的设计,比如排行榜、宝石奖励,还有类似NPC一样的人物出场。”“多邻国”中国区教学负责人杨丹晨这样告诉我。
《翻译官》剧照
许多用户有所不知的是,游戏一样的外语学习体验背后,“多邻国”有着人工智能的支持。“多邻国”的课程结构,是由一个个三分钟的课程构成的,每天完成它,就算一次打卡,能够获得经验值。完成得越多,经验值也就越高。一个叫作Birdbrain的模型会根据学习者答题情况,来不断调整接下来练习题的难度,“它会把正确率稳定在80%,既不会太难以至于让人想放弃,也不会太简单而无法激起人的胜负心。用户做题的时候会感到题目仿佛是给他量身定制一般”。“多邻国”的练习题也是用大语言模型(Large Language Model)来生成的。“比如我们会给它一些指令,像是这节课的教学目标是什么、希望用户练习的词汇语法是什么,然后模型会形成课程习题的初稿,我们还要人工来审核。等于一头一尾有人来进行把关,中间繁琐而又重复性的环节交给AI。”
社交平台X上专门有一个话题叫作“‘多邻国’上的奇怪句子”(Strange Duolingo Sentences),汇总了奇奇怪怪的习题练习句,比如英语课程里的“The bride is a woman and the groom is a hedgehog.”(新娘是一个女人,新郎是一只刺猬。)又例如,“The man eats ice-cream with mustard.”(那个男人吃冰淇淋时搭配芥末。)不少用户猜测这些完全是人工智能生成的无意义的还有点好笑的句子。杨丹晨告诉我,事实上这些句子也都是经过人工审核的,这样出乎意料的词语搭配是为了让学习者能够对某个词和对应的用法加深记忆。难免有人会留言说:“难道指望我在日常对话中用到这些句子吗?”但这点对吕宇珺很奏效。她说,上“多邻国”的一个快乐,就是可以看到这些搞笑的表达。
《归去来》剧照
去年,“多邻国”和OpenAI合作,将GPT-4这样的生成式人工智能嵌入到了APP中。如果是更高等级的“Duolingo Max”付费订阅用户,就能享受到和GPT-4相结合的两项功能:一个是“角色扮演”(Role Play),还有一个是“解释我的回答”(Explain My Answer)。在普通级别的“多邻国”中,用户是在购物、点菜、买机票这样的生活情境中来练习单词和句型,但“角色扮演”提供了更细致的对话情景,使用者可以与里面的人物在巴黎的咖啡馆点一杯咖啡,聊一次爬山登顶的喜悦。更重要的是,这完全是一种自由交流的对话,AI会根据你的回复给出反应,每一次应答也是不一样的。而“解释我的回答”中,用户则可以选中某些习题的答案,和AI来讨论里面的语法现象。就算这样在实时与人工智能生成内容,“多邻国”也会强调人工介入的重要性——像是“角色扮演”中,一个大致关于什么内容的对话情景仍然是由人来做限定的,初始的聊天信息也是由后台专家先写好发出来的,这样才保证对话内容不会跑偏。
“但如果你指望用‘多邻国’就能掌握一门外语,那其实不太现实。”吕宇珺说。她认为,这些相对零散的小练习,并不能代替一门外语的相关系统课程,而“多邻国”更像是主线学习之外的一种陪伴,让你随时能对这门语言保持感觉。“它帮助你把碎片时间有效利用起来。等人的时候,打开‘多邻国’上个课,总比刷短视频要有收获。”她形容手机里那只绿色的猫头鹰“多儿”,就仿佛是一个随时都在的AI外语练习“搭子”。
外语进阶,如何善用ChatGPT?
你可以用“多邻国”来开启一门外语,感受人工智能在里面的体现,当然还可以直接就使用ChatGPT,这个OpenAI公司推出的人工智能聊天机器人程序,作为外语继续进阶的辅助手段。事实上,ChatGPT自从2022年底发布以来,就在改变外语学习的方式。
“多邻国”游戏一般的课程设计背后,有着人工智能的支持
谷大白话是一名美式脱口秀的翻译者,以对美国俚语的熟悉和中国本土化的翻译风格著称。他对任何一种语言类的工具都有着尝试的热情,不仅是“多邻国”上的“卷王”,常年霸占排行榜榜首,也在ChatGPT上线的第一时间来做了各种测试。“ChatGPT是靠庞大的语料库检索出你所要的信息,所以它并不善于创造。”谷大白话让它去写诗,规定了韵脚和风格,结果发现写出来的第一篇很惊艳,接下来再写五六篇,就非常雷同。
“它擅长的是来进行归纳和整理,我们可以让ChatGPT充分去发挥这方面的优势。”谷大白话早年也在培训机构教过GRE和托福,他就感叹有了ChatGPT后,顿时就可以产生不少有意思的练习题和例文,让应对这类标准化考试的过程不再枯燥。“比如托福阅读,老师一般会拿历次真题来做训练,我觉得那样时效性和趣味性会差很多,曾经我自己就会把哈利·波特的某段故事出成阅读题。有了ChatGPT就简单多了。第一步让它以哈利·波特的故事为原型来出一篇托福水平的阅读;第二步按照托福的命题思路来出题,还可以进一步说要包括主旨题、指代题等,再埋藏一些小陷阱;第三步让它给出每道题的答案和解释。”而托福和GRE的作文,谷大白话认为尽管注重思辨,但“其实是一种有套路的八股文”,他试着让ChatGPT来生成例文,认为它写出来的质量能超过99%的培训机构老师。
《小舍得》剧照
北京航天航空大学外国语学院院长梁茂成在ChatGPT出现之后,就很关注它在教学中的应用,这和他同时拥有英语和计算机方面的专业背景不无关系。他不仅在公开讲座中分享过如何设计和ChatGPT对话时的提示词(prompt),还与其他学者合作发表期刊文章,提出要发展师生的“人机互动协商能力”。他告诉我,ChatGPT进行回答的原理,是根据上下文语境来生成答案,并不是在现有的知识库中去查询答案。“这就导致了事实性的东西它会回答不准,不能够依赖它去查阅文献。有时候它是在‘一本正经’地说瞎话。”梁茂成曾经试过问ChatGPT-3.5:鲁迅与周作人之间是什么关系?它给出的回答是:他们是中国现代文学史上两位不同的作家。这到了ChatGPT-4.0才有了更正。
“但正是这种基于语境生成答案的回答能力,决定了我们在给出提示词的时候,要尽可能将语境描述清楚而具体,避免模糊词,效果就越好。”梁茂成举出的一个例子,是如何让ChatGPT给学生的英语作文提供修改的帮助。“如果你笼统告诉它,‘请帮我修改这篇文章’,那它一下子就会被改得面目全非,几乎找不到本来学生写作的影子。因此很重要的第一步,你要给ChatGPT赋予一个角色,让它能在执行任务的时候精准地调动相关数据。比如,你可以说:‘这是一篇把英语当作外语来学习的学生写下的习作,请你作为一位英语老师来修改这篇文章。’而就像我们平时提倡学生修改作文应该有若干版改稿,每一版有不同的修改重点一样,你也可以让ChatGPT每一轮修改中针对不同问题,如论点、论据、语法、词汇、语篇结构等等。”
《欢乐颂》剧照
不仅英语学习可以从ChatGPT的使用中获益,小语种更是能通过它来获得最快捷的帮助。鲁楠目前正在瑞典读语言习得方向的博士,他本科毕业于北京外国语大学的挪威语系,研究生阶段在挪威读了对外挪威语的硕士,同时也在那里教新移民挪威语。北外的挪威语系从2007年开始招生,每四年招一届。鲁楠2015年入学,对这样小语种的学习资源相对缺乏体会颇深:系里一共就三位老师,两位中国人一位挪威人,使用的挪威语教材是老师买的原版教材再进行复印的;北外图书馆一共四层,挪威语的书就是一个小书架,有时候大使馆会资助过来一箱书。“当时碰到一个句子看不懂很麻烦。先要查字典,搞清楚单词的含义。再去看语法书,对应找到它的语法点。可问题是当时没有中文的语法书,我们挪威语刚学不久,就要看挪威语写成的语法书,可想而知有多费劲。”
鲁楠在挪威教新移民挪威语的时候,就鼓励他们用ChatGPT来辅助学习。他给我演示平时作业中最常见的一种句子纠错题:如果给ChatGPT-3.5一个提示词“为什么这句话写错了”,它是能把句子改对的,比如这句话中缺少冠词,它的修改版本中冠词就加上了。“但它的问题是可能会缺乏解释。我更鼓励学生的是去对比前后修改的版本,继续让它就某一语法现象来进行阐释,比如你可以继续提问挪威语中冠词的用法是什么。”
鲁楠毕业于北京外国语大学的挪威语专业。在挪威读研究生时,他在那里教新移民挪威语
鲁楠还发现,尽管目前用英文向ChatGPT提问,其回答质量最高,但至少在用中文让它解释语法上,并不会有什么问题,“因此新移民用他们的本国语言来提问题就会很方便”。鲁楠说,由于这些新移民学挪威语的目的是尽快能够使用以融入当地社会,并不需要担心他们出于做出一份满分作业的目的来用ChatGPT。“但我还是鼓励他们有了ChatGPT,也要在这个基础上多思考,毕竟人是有惰性的。”
翻译,有多少能交给人工智能?
当外语学习进入高阶,就会有一项综合能力的运用来考验学习者,这就是翻译。那么,人工智能的出现从何种程度上能够辅助传统的翻译,又会给以翻译作为职业的人带来哪些改变?
曾在澳大利亚驻中国使馆担任过大使翻译,现为自由翻译者的李新告诉我,就口译而言,像是科大讯飞这样的公司早几年就在会议场合做实验,把机器翻译出来的内容投到大屏幕上,“但是效果并不好。一个原因是在说口语时会有口音和一些特有的表达习惯,对机器识别是个障碍;另外很重要的一点,就是讲话人如果出现思维混乱的情况,翻译者会有一个帮着理顺逻辑、归纳总结的过程,这点机器还做不到,只能做一个逐字逐句的翻译”。
《三十而已》剧照
因此人工智能更能施展手脚的领域是笔译。北京大学外国语学院英语系副主任林庆新专门在系里做过一次讲座,比较了ChatGPT和之前几种翻译工具的区别,也谈了人工智能时代译者功能的转变。林庆新告诉我,以往机器翻译很容易出错的一个地方就是当一个单词有多个含义时,它并不能判断在文本的上下文中到底应该选择哪个意思。而基于大语言模型的ChatGPT正是在把握语境上有着优势。他谈起他最近和学生合作翻译的一本书《杂草、玫瑰与土拨鼠:花园如何教育了我》中的一个例子,写到一群浣熊在一天夜里踩过了菜地,破坏了作者种下的玉米。“‘菜地’这个表达,原文中用的是bed这个词。谷歌翻译直接翻成了‘床’,ChatGPT则知道这里对应的是‘菜地’。”
林庆新了解到目前有不少职业英译汉的翻译者都会先用ChatGPT将全文跑一遍,之后自己再来做校正。“提高效率是一方面,这样做会更能刺激译者的积极性,因为看到一个出错的译稿要比从头开始翻译,会更有一种冲动。”这种翻译流程上的变化,就让“机器翻译译后编辑”变得尤其重要。“尤其是复杂句,译者就要特别留心ChatGPT的译法,里面的平行结构和修饰结构它容易理解错,还会出现机械对应导致的生硬译文,这都是人工需要去改译的地方。”
《我在他乡挺好的》剧照
林庆新在北大教授英语系大四的学生汉译英的课程,ChatGPT的出现也给他布置作业带来了挑战,因为“的确会有同学借助ChatGPT来完成作业,其实翻译的知识和技巧并没有掌握,考试的分数就和平时作业成绩很悬殊。”让他苦恼的是,这比抓抄袭要难得多,因为给ChatGPT文本后它每次生成的结果都不相同,完全拿不出确凿的证据。林庆新的应对办法是在布置作业之前,都把汉译英的中文选段让ChatGPT翻译一下,如果翻出来的文章基本无误,那就是选段太简单了。所以他现在更倾向于去选一些民国文人的作品让学生来尝试,这些作品完全没有被翻译过,文字里的古朴色彩对ChatGPT又有难度。或者他干脆就给学生ChatGPT的译稿,让他们来练习译后编辑。
即使人工智能可以确保语义的准确和句子的流畅,它在叙述的口吻和风格上也未必能体现出原文的特点。北京大学西葡意语系的助理教授郑楠业余时间从事文学作品的翻译,之前翻译过墨西哥作家瓦莱里娅·路易塞利(Valeria Luiselli)的小说《我牙齿的故事》,不久前又翻译了路易塞利另一本书《失踪儿童的档案》。她告诉我,这本书有一种类似“剧中剧”的嵌套结构,第一层叙事的声音是这位作家来讲她在美国的日常生活,接着她就讲到自己读到一本书,又进入了书中的另一个故事。这样就有两种不同的叙述风格,一种是简约轻快的,一种则更具文学性,更为繁复和沉静。“仅凭机器翻译它是辨别不出区别的,这个必须要译者才能把握”。
《翻译官》剧照
“其实由外文到中文,不仅考验对外语的理解,还有你中文的水平。”谷大白话这样对我说。翻译有“异化”和“归化”两种不同的策略,前者是尽量保留原文中的“异国情调”,后者是把它变成地道的本国语言。在语言本土化方面,谷大白话对美国脱口秀的翻译就体现得淋漓尽致。他把脱口秀主持人John Steward翻译成“囧司徒”,把脱口秀节目对于美国共和党候选人竞选时的突然忘词brain fart翻译成“大脑嗝屁”,把taco这种墨西哥玉米饼翻译成“肉夹馍”。既能体现美式幽默,又“俗”得足够接地气,让他收获了一众粉丝。他把这种对中文的运用能力归结到从小爱读经史子集中的古文,以及东北人饭桌上喝酒扯淡锻炼出来的语言本领。因此,人工智能只能给出一个标准翻译,但却无法取代一个有个性的译者。
“肉身”学外语,无法被替代的乐趣
人工智能可以作为外语学习的辅助工具贯穿在每一个阶段。尽管出门旅行、问路点菜、看懂外文的标志和文章,都可以借助机器翻译,人工智能在各种跨语言的场景中发挥着越来越重要的作用,但并没有打消人们去学习一门外语的积极性。
这从“多邻国”近两年来的增长数字就可以看到。2023年第四季度“多邻国”在全球的日活用户是2690万,同比增长65%;月活用户是8840万,同比增长46%。根据“多邻国”发布的《2023全球语言学习趋势报告》来看,英语毫无悬念仍然是最受欢迎的语言,背后的原因是英语能力对取得经济成功和学业成就都至关重要。而Z世代在选择学语言的动机上显现了个性化的趋势,有人是为了在政治上表示声援,比如学习乌克兰语的人中,有超过一半都是Z世代;还有的是为了满足自己的兴趣爱好。
2015年8月6日,海南省琼海市,志愿者辅导乡村的孩子们学习英语(蒙钟德 摄 / 视觉中国 供图)
多语言者(polyglot)的经历,最能说明学习外语的吸引力。王赟毕业于计算机相关专业,现在就职于一家美国的互联网公司,他同时是知乎上有关语言类问题非常活跃的答主,拥有超过17万粉丝。他对自己的形容是“英语、日语、韩语听说读写都没问题,西班牙和法语稍差一些,越南语更擅长阅读,后三种语言理论水平高于实践水平”。
王赟的多语言学习是从日语开始的——小学时因为觉得《大风车》里播放的日文动画片片尾曲很好听,一下子就“入了日语的坑”。他的日语自学全靠边抄写日语歌词,边翻《现代日语大词典》。凭借200多首歌词的积累,他在清华大学读书时和“日语角”的日本人聊天已经毫无压力;他对韩语的兴趣,也是由《我的野蛮女友》里面的那首《I Believe》开始的。大三是他学习韩语的全盛时期,主要得益于和学校大量韩国留学生的交往,甚至还有一段教韩国人学日语的经历;开始学习西班牙语是因为大三暑假去美国洛杉矶的南加州大学交换,街上有不少标牌都是英语和西班牙语双语写成的,“干脆学一下这门语言好了”,接着又走了歌曲学习的老路,同时配合塞万提斯学院在清华开的西班牙语课;大四开启法语学习时,他已经意识到自己成为多语言者的潜质,当时他借助了一个名叫“罗塞塔石碑”(Rosetta Stone)的外语学习软件,得以沉浸在法语的语境中;而他最近一门进入的语言是越南语,因为想把构成“汉字文化圈”的四门语言的最后一个缺口补上。
《垫底辣妹》剧照
拥有多语言的能力,让王赟感到乐趣无穷。他会根据场合,自由切换语言:他的工作用语是英语,并且有的工作内容只会用英语来说;他多年都坚持写日记,写日记的时候他会用日语,因为吸收了大量日语的歌词,他更擅长用日语来表达情绪和进行文学化的描述。切换不同的语言时也让人能拥有不同的人格。王赟告诉我,好比说韩语的情境都是和韩国朋友们聚会,所以讲起韩语来就会有种很哥们儿义气的爽快感。
发现不同语言之间的关联,也让王赟觉得很有意思。之前他在学习了日语和韩语后,就隐约觉察出这两种语言中汉字的读音存在对应关系,比如所谓的“入声字”的韵尾。他用这个规律去猜越南语中的汉字音,很多时候都能猜中。慢慢地他意识到,这三种语言之所以在汉字音上有共通之处,是因为在唐朝时期,由于中国国力强盛,文化也向外输出,日本、韩国、越南都在这个时期借入了大量的汉字词,所以说中古汉语是这几种语言中汉字音的共同祖先。结合计算机方面的特长,王赟自学了Android开发,写出了一个叫“汉字古今中外读音查询”的应用程序,可以同时查询汉字的中古音以及普通话、粤语、日语、韩语、越南语读音。这个程序目前已有上千的下载量,王赟也通过它结识了不少音韵学的同好。
《天才枪手》剧照
郑子宁也是一位多语言者。除了熟练掌握英语之外,法语、西班牙语、土耳其语、泰语都有涉猎,出版过《东言西语》《中国话》《南腔北调》这样几本语言类的著作。如果不是同时接触几种语言,大概很难意识到不同语言在表述一件事情上有着不一样的精细程度。“你有没有想过,为什么在英语中uncle和cousin就可以把中国话里的七大姑八大姨都代表了?”郑子宁问我。“越精密的亲属称谓系统,就对应着更复杂的社会结构。英语称谓的简化,就发生在诺曼人入侵、打破原有秩序的时代。中国的亲属称谓系统固定于魏晋南北朝,当时战乱频发,家族的重要性空前提升,以父系血缘为核心的家族登上历史舞台。”郑子宁说。语言和文化与历史密切相关,郑子宁很喜欢透过语言现象去思考背后形成的逻辑,学习多种语言正打开了新的视角。
“有的词语是不太能够被翻译的。在本国语言里,很难找到一个单独的词去对应它,因为缺乏相同的生活经历。”鲁楠对我说。他举的例子是挪威语中koselig这个词,丹麦语中也有类似的hyggelig,对应成中文可以是“舒适的”。“但是这种翻译又简单了。它描述了一种氛围:外面下着大雪,你坐在小木屋里面,面前是燃烧的壁炉。你穿着那种厚厚的毛袜子,喝着一杯咖啡,和家人依偎在一起。也许你要和挪威人共同度过一个寒冬,才能明白这个词的感觉。”有一本叫《在翻译中迷失》(Lost in Translation)的小书,就汇总了世界上形形色色“只可意会,不可翻译”的词语。唯有学习另一门语言,并进入它背后的生活,才能把握这门语言所代表的全部。
《翻译官》剧照
为什么有了人工智能,人们也不会停止学一门语言呢?这个问题我同样问了斯坦福大学的历史学教授墨磊宁(Thomas Mullaney)。他也是一名精通中文的汉学家,写过《中文打字机:一个世纪的汉字突围史》这样的著作。他这样告诉我:“学习语言也是一种‘肉身’体验。当你开始学一门语言,你是用嘴巴去感受它,通过变换舌头的位置和唇齿的开合,发出不同的声音,做出音调的抑扬顿挫。你好像坐着时光机回到了生命的最初,做一个咿呀学语的婴儿。我喜欢这样的感觉。”