专访传神语联创始人何恩培:翻译不死,但必须借助大模型重构丨AI先行者档案

近日,国家专精特新“小巨人”企业传神语联创始人何恩培接受了《每日经济新闻》记者的专访。他认为,当前大模型竞争虽激烈,但远未成熟,类似1920年电气时代,应用尚未被充分发掘。智能语言服务行业正从“单纯的语言转换”转向“知识理解与应用”。传神语联选择“后撤一步”,提供底层技术和工具。何恩培强调,数据质量重于数量,AI未来竞争在于底层技术框架,“根原创”是根技术中最有生命力的部分。

每经记者 可杨    每经编辑 张海妮    

开栏语

大模型正从技术竞逐的“实验室”加速奔向产业落地的“深水区”。在这波浪潮中,一些先行者以敏锐的洞察力与破局勇气,率先探索技术与场景的融合边界——他们是打破算力桎梏的开源先锋,是深耕垂直领域的场景拓荒者,是构建生态协同的产业布道者。

聚焦大模型应用落地的“最后一公里”,我们对话以技术为矛、以场景为盾的探索者,试图勾勒出一幅大模型赋能千行百业的“清明上河图”,为行业提供可复用的方法论,也为中国AI产业的全球化突围注入信心与动能。

策划:郭荣村、李少婷)

义乌小商品城外贸出海成风,不懂英语的店员对着海外直播平台热情阐述,大模型帮他们将订单统统揽下,这离不开AI(人工智能)翻译的功劳。

在大模型重塑千行万业的浪潮中,传统翻译已发展成为集语言理解、知识处理、文化适配于一体的综合性智能服务体系。换句话说,翻译不再是被动接受技术赋能的领域,而是主动引领大模型产业变革的前沿试验场。

但热潮的另一面,是智能语言服务行业静默的变革——机器翻译增多,人类译员的工作并没有随之减少,然而单价出现下降;订单量的增长与盈利能力的滞涨构成悖论。在这场人机博弈中,终极胜负手或许就藏在未被算法吞噬的认知褶皱与知识基因之间。

近日,《每日经济新闻》记者专访了国家专精特新“小巨人”企业——传神语联网网络科技股份有限公司(以下简称传神语联)创始人何恩培。

当前,大模型的竞争已迈入第三年,新的玩家突出重围,座次又生变化。何恩培认为,此时谈定局为时尚早,大模型还远未成熟,当前更像是1920年的电气时代,基础技术已经诞生,但五花八门的应用尚未被发掘。

在他看来,智能语言服务行业正在从“单纯的语言转换”转向“知识理解与应用”。趋势之下,传神语联选择“后撤一步”,提供服务于行业的底层技术和工具。而在面向应用提供服务的过程中,他们意识到,“大数据”并不适用,质量更重于数量。

 

 

人机博弈:订单贬值,发力底层

技术发展的脚步越快,各行各业面临的拷问就越相似——人工智能会取代我们吗?

在这场关乎生存的讨论中,智能语言服务行业是最早被卷入的领域之一。早在大模型热潮来临之前,机器翻译就在不断进化,逐步蚕食着人工翻译的生存空间。

这种焦虑也冲击着客户的预期:如果机器翻译能做到“基本能看懂”,为什么还要支付高昂的翻译费用?

生成式AI席卷而来,人工翻译会成为最先被取代的职业吗?

“我可以给大家一个结论:翻译可能是人类和机器博弈中最后消亡的行业。”何恩培笃信,语言不仅仅是沟通工具,也是人类思考的“操作系统”,是一个复杂而动态的体系,机器需要通过自然语言来理解世界。

但在这场人类与机器的“博弈”中,智能语言服务行业呈现出一个值得探究的信号:订单增长幅度显著高于收入增长。何恩培抛出这样一组数据:2024年,传神语联的智能语言服务收入增长了10%,但订单量增长了30%。

表面上看,这是一个乐观的信号,订单量增长说明市场需求仍然旺盛,但订单的碎片化趋势正在重塑行业——过去,一个翻译订单可能价值不菲,现在订单金额却越来越小,“因为客户自己能‘看懂’了”。

机器翻译的普及使得语言不再是障碍,提供智能语言服务也不再是一项“从头到尾”的工作,而成为一种“修订和优化”的服务。客户的需求变得更加精准。同时,客户对人工翻译的付费意愿也在下降。既然机器能做到95%的准确率,为什么还要收这么多钱?

然而,何恩培认为,知识型产品具有一个显著特征,即使机器翻译的准确率高达95%,但只要还需要人工从头至尾审阅,以识别那5%的误差,处理速度就会回落至人工水平。

人与机器的博弈最终带来了企业间的博弈。客户普遍认为,机器进行初步翻译,仅需稍作修改即可,进而付费意愿降低;而为了获客,智能语言服务企业选择压低价格,而成本端唯一的对冲方式,是不得不在部分场景中使用机器翻译;机器不可避免地抢走了一部分市场,而人类译员的工作量减少,但单价也随之下滑。

博弈中,传神语联选择“后撤一步”。何恩培解释,过去,智能语言服务公司直接服务于终端客户,但未来,传神要做的是“赋能”,让合作伙伴,比如翻译公司、中介机构,去覆盖直接的语言需求,而传神为他们提供底层技术和工具。

这一策略背后的核心逻辑是智能语言服务行业,正在从“单纯的语言转换”转向“知识理解与应用”。“传统翻译的总量并没有减少,而是产品形态发生了变化。”何恩培说,“客户需要的,不再是简单的文本转换,而是一整套基于大模型的知识处理能力。”

数据不是越多越好:质量决定价值

出海,早已成为各家科技企业绕不开的话题。何恩培认为,对于中国企业而言,AI出海的真正挑战不仅是语言问题,而是帮助企业在新的市场环境中实现知识迁移和业务落地。

“他们关心的是能不能听‘懂’。”何恩培认为,理想的场景是,大模型成为一个知识转换与传递的工具,但现实总比理想复杂。今天的大模型在语言覆盖上仍存在很大局限,尤其是对于非英语市场,数据的训练深度和准确性仍不足以支撑高质量的业务应用。“每家企业的现有数据都很重要,因为企业是依据自身特色出海。”

企业高质量数据的稀缺,导致大模型在解决客户的深度问题上还没有呈现出绝对优势。“我认为(当下)距离大模型真正解决客户问题还有一段路要走。”何恩培表示。

“过去企业把记录和数据混在一起,他们认为工单、硬盘(上的内容)也是数据,但这只能叫记录和资料。”他指出,数据的价值并不在于存量,而在于其系统化以及可被机器学习和推理的程度。

在人工智能发展初期,行业普遍追求“大数据”——投入数量庞大的数据进行训练,以换取更强大的模型能力。然而,当大模型逐渐成为基础设施时,数据的“质量”将比“数量”更重要。

在何恩培看来,数据、参数和算法并非孤立存在,而是一种动态平衡关系;数据和参数规模在一定范围内能带来性能增长,但算法创新才是突破“天花板”的关键。

早期开发翻译软件时,何恩培已经体会到数据和规则规模的边际效应。“当我们设定了1.5万条翻译规则时,效果非常好。但当规则规模扩展到2万条(时),(效果)反而变差了。”原因很简单,数据之间、规则之间存在冲突,统计概率的关系也可能产生矛盾——换句话说,数据或参数在某个阶段的增加确实能带来提升,但当增长到一定程度,如果算法不突破,模型的质量反而会下降。

数据问题是传神语联提出“数推分离”架构的核心原因。何恩培回忆,最早在2021年,传神语联为法律行业开发了一套AI系统,能够学习过去十年的法律案例。然而客户很快提出了一个关键问题:新产生的数据怎么办,还要重新训练一次吗?

这促使他们开始思考:如果数据和推理能够分离,AI系统就可以在不依赖大规模训练的情况下,实现自我学习和进化。“我们不需要把所有数据压缩到神经网络里,而是让推理大脑保持轻量化,同时支持实时学习。”何恩培解释道,这种架构不仅降低了模型的计算成本,还提高了适应性,使其能够在动态环境中不断优化自身。

DeepSeek热潮后,知名投资人朱啸虎曾提出,以后给数据打标签的(工作)都需要博士生来做。何恩培认同这个观点:“我们现在在处理数据时,很多时候已经是博士生在做了。”在当下的人工智能热潮中,数据的价值并不取决于它的数量,而取决于质量,以及隐藏在其中的知识密度。

他举例,如果一名律师在过去十年处理过500个案件,他的大脑中就沉淀了丰富的专业经验。当有人请教他相关的问题时,他不需要拿出所有的案卷逐条翻阅,而是可以直接给出综合判断和方法论,这位律师的大脑就是一个“行业大模型”,其价值在于知识的提炼,而不是原始数据的堆积。

何恩培认为,AI的未来,也将走向这样的方向。企业往往不愿意分享自己的高价值数据,因为数据往往涉及核心业务和商业秘密,但这并不意味着数据无法转化为价值:“数据可以不外流,但由数据训练出的智能是可以共享的。”

谈定局为时尚早:大模型还远未成熟

“回看我们的成长路径,从最早的2.1B模型,到现在的9B,我们从未在参数规模上盲目堆砌,也从未在算力上无止境投入。”何恩培表示,这并不是因为资源不足,而是因为公司始终认为,这是一条更有效的技术路线。

在他的观点中,衡量大模型价值的核心指标并非参数规模,而是能否真正解决客户的问题。这种路径在行业内也带来了一定的认知挑战,销售和前端团队有时会遇到客户的疑问:模型参数还不到100亿,算得上是大模型吗?“但当客户真正使用后,他们就会明白,关键不在参数,而在效果。”

在当下的科技语境中,“国产”“根技术”“0到1”已然成为热词,但在何恩培眼中,这些概念的边界远比市场讨论的更加复杂。

何恩培认为,根技术是产品和应用最基础的底层能力,它可以是自己研发的,也可以是基于开源的,甚至是通过授权获得的。但无论如何,“我们掌握了这项技术,这项技术也属于根技术,掌握了根技术,至少代表我们自己有了一定的主动性”。而“(从)0到1的技术”则等于是某项应用发明,它既可以在应用层,也可以在根层。

在他看来,AI的未来竞争,不仅仅是参数规模的竞赛,而是底层技术框架的竞争,未来人工智能会衍生出无数的行业专用模型,而这些模型的底层架构将决定它们的智能边界。

“根原创”是何恩培提出的概念,他认为这是根技术当中最有生命力的一部分,“你只有在‘根’上创新,才能真正拥有自己的技术思想。”何恩培强调,技术体系是带有思想性的,如果所有的技术来源都依赖于外部的开源框架,就很难摆脱既有框架的思想束缚。而当企业在根技术层面拥有自主权时,它不仅能摆脱对外部技术的依赖,还能决定自身技术演进的方向,这才是最有创新价值的部分。

在商业层面,大模型竞赛迈入第三年,关于大模型的商业模式、技术最终是不是应该是免费的,在行业内越来越被关注。过去,许多科技公司的商业模式都是先“烧钱做免费”,再通过其他方式盈利。例如,搜索引擎免费,但靠广告赚钱;手游免费,但靠道具收费。

然而,大模型的情况似乎更为复杂。何恩培的核心观点是:To B(企业级)市场的AI服务,不可能是免费的。“企业使用AI的核心目的是解决业务问题,而解决问题就一定会有成本。”他说,“只是说在竞争中把成本降到最低,一定不会免费。因为(一旦)免费,它就缺乏了这项技术持续运转的能力,这由技术的稀缺性和商业模式共同决定。”

何恩培认为,今天的大模型远远没有成熟,市场格局还未定型,现在讨论最终格局为时尚早。

当前更像是1920年的电气时代,电力技术已经成熟,但没人能想到后面还有那么多家电、设备会被发明出来。一方面,今天的大模型很多问题尚未解决,不可能像一个成熟产品一样占领所有领域;另一方面,当前市场竞争依旧集中在通用大模型方面,但垂直场景中的模型尚未爆发。“也许未来可能有一万个AlphaFold在不同行业,这才(会)形成大模型的完整生态。”何恩培说。

责编 张海妮

原标题: 专访传神语联董事长何恩培:翻译不死,但必须借助大模型重构|AI先行者档案

Copyright© 2014 成都每日经济新闻社有限公司版权所有,未经许可不得转载使用,违者必究

互联网新闻信息服务许可证:51120190017  

网站备案号:蜀ICP备19004508号-2  

川公网安备 51019002002025号