(讲座)关于语言纠纷的神回复

 LICENSE 许可证 LICENCIA 許可證 CC BY-ND 4.0 

始作俑者造谣,说汉语最高效,导致好多人跟风造谣。谁曾想,2011年有人推翻了这个结论,2018年有了声势浩大的抗议。2011年: https://www.zhihu.com/question/323036930/answer/673523921 越南语的信息密度最大,因此越南语最高效。2018年:没有更高效的语言 https://www.guokr.com/article/442800 。此话并非自恋:我尚未发现2018年的结论前,早已连续几次否定了“信息密度大等于高效”这个观点(不是自恋,而是事实)。语言没有 faster 也没有 fastest ,并且语言没有 slower 也没有 slowest 。那么问题来了,我未看2018年的文章前,我是如何判断的?此时您应该在浏览器中关闭那个2018年的网页。我是这么判断的:(建议将书面语和口语分离。量子力学:电或光通过双缝后碰到屏幕即有干涉条纹。) 

★ 不可能有一门语言包含各种缺点:运动员怕缺氧是缺点(高原反应),在冬天抗寒是优点,以运动员的体魄不可能同时存在两个缺点。法语被公认为最严谨的语言,其实法语是避免了问题A但引发了问题B。英语“红茶”是 black tea ,叶子是黑的;汉语人士看水,英语人士看叶子。繁体中文“發”“髮”区分“发”,特殊语境下反而不如简体中文。 

① 汉语“男孩”只有两个音节(省力), https://www.rosettastone.com 越南语 một đứa con trai 要四个音节(费力)。 

② 人们容易把“葛立恒数”读成“葛立,恒数”(错误),其实是“葛立恒,数”(正确);“中非”的歧义明显:中非共和国、中国与非洲。 

③ 人们说的“Linux内核”容易被误解成内核的内核(错误),其实是说Linux本身是内核(正确)。因为“神经系统”是很多根神经相互关联,所以“Windows系统”是很多个Windows连起来。“自然语言”可代表地震、海啸、雷雨等等,其实是英语、汉语、冰岛语等等;写到这儿,不得不提:英语、汉语、冰岛语都是人类发明的,因此也能说它们是“人造语言”。 

④ https://zhuanlan.zhihu.com/p/22886819 还原佛教历史有歧义。(冷知识:按照2011年媒体的标准,梵语的信息密度大于越南语) 

⑤ 自由软件的版权 copyleft 翻译有漏洞:一提到“谁能正确翻译,悬赏一亿欧元”,反而让人闻风丧胆、谈虎色变。 copyleft 本质上还是版权,所以“反版权”是错误的;“左版”“佐版”“版权属左”也都有漏洞。西班牙语 sobremesa estrenar 用英语和汉语无法一一对应。 

⑥ 量子计算机无法淘汰电脑。 

⑦ en la caja 在盒子里、 en la mesa 在桌子上,介词都是 en ,可被误解为“在桌子里”。 

⑧ 青蛙的叫声未必是“呱”,「英语人士」听着像 frog ;猫的叫声未必是“喵”,有些「汉语人士」认为猫叫就是“猫”。重要提示:别以为我用拼音输入法打错了,可能有的读者怀疑这里是「韩语人士」;我用五笔输入法也会打「汉语人士」。 

⑨ quantum supremacy 被不恰当地翻译成“量子霸权”。有的语言有大舌音,大舌音更兼容某某领域。英语 Sunday Monday 暗示了基督教,我觉得白开水比汉语更香甜美味。→假如←语境合适, Monday 过了 24 小时是 Tuesday ; week one 过了 168 小时是 week two 。 

⑩ 吃完巧克力自造语言、跳舞时自造语言、研究鱼肝油时自造语言,随时随地自造语言,结果发现任何语言都有漏洞。温馨提示:世界语、汎语也有漏洞。 Richard M. Stallman 对世人宣称 liberated freedom 这两个词有歧义。 He eventually used the word “unfettered”. 

⑪ “今天骑车差点摔倒,还好我反应快,一把把把把住了;今天起床晚了差点没上上上上海的车”。照这样思考的话,汉语被英语打成渣,犹如葛立恒数被 TREE(3) 打成渣: Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo. 

★ 有人说上下文和语境能避免“葛立,恒数”,大错特错!上下文可能只说了葛立恒数是一个上限、共面完全图同色、下限已从 11 上升至 13 。 

★ 那么问题来了,怎么定义“高效”?一些定义和另一些定义打架了,如果高效是容易讲笑话,就和“严谨”打架。据「不完全」统计,语言都能描述的笑话:小明吃汤圆时,馅喷出来了。有的笑话需要特定语言来描述, God, it’s too hard. 是语言本身的笑话。温馨提示: hard 有歧义。如果高效是容易考古,就和别的定义打架:甲骨文“鼎”很像一只猫;现代语言包含之前所有变化,点餐时一言难尽。用葛立恒数个字词去定义“高效”,也没有更高效的语言。有人骂韩语难听,这大概是反例: https://www.howtostudykorean.com/wp-content/uploads/2014/01/Lesson-1-3.mp3 

对于葛立恒数那个,汉语有歧义,英语 Graham’s number 能清晰表达,但可能被误解为 Graham is number ,建议用西班牙语 número de Graham ;对于“Linux内核”和“Windows系统”,汉语和英语都有歧义,用西班牙语 el núcleo Linux 和 el sistema Windows 能清晰表达;越南语问题,反驳了2011年的媒体;关于 ④  提到的问题,我不知道哪门语言没有歧义,假如您发现哪门语言没有歧义,请您迅速回复;写到这儿,不得不提《杂阿含经》,释迦牟尼明令禁止梵语,释迦牟尼可能发现梵语的某些漏洞能被别的语言弥补。不知道哪门语言能解释清楚 ② 的“自然语言”和“人造语言”,也请您帮忙寻找。大力鸣谢 Richard M. Stallman ,他建议人们说 GNU/Linux ,开源软件不等于自由软件。写到这儿,不得不提 https://slashmerriam.wordpress.com/2018/10/16/embarras-de-choix-of-software/ 。 

⑥ 的解释:新鲜葡萄脱水了是葡萄干,电子在某些环境下呈量子态,氢也有量子态;氢气易燃易爆,防火请用氦气。薛定谔的猫概括了量子处于叠加态,冷知识:升级版是把薛定谔放入箱子。若要破解 AES RSA ,叠加态让人类猜不中密钥,优势变劣势,必须连根拔除劣势。 RSA-2048 用量子破解,要准备 4099 个量子位,少一位则无法破解; RSA-4096 用量子破解,要准备 8195 个量子位,少一位则无法破解。 ECC 还要难,量子位要大约六倍: ECC-256 用量子破解,要准备大约 1536 个量子位。两台电脑(陌生)能直接通信,除非对方有防火墙。即使彻底删除了防火墙,两台量子计算机(朋友)也无法直接通信,需要先用电脑确定协议。距离太远了,两个量子无法纠缠;距离越远,夸克禁闭反而越强。 

⑧ 的解释: Edward Joseph Snowden 俗称“斯诺登”,他在俄罗斯避难。假设俄罗斯吞并了美国,斯诺登随时被捕。很多人发帖称“出现新事物,汉语只要把字组合起来,保持中国大陆统一”(这个“很多人”并不包括我),“拿”是手合起来,英语 take 看不出 hand 。那些人还发帖“欧洲分裂是因为表音文字”。万一您像斯诺登一样,您或许很庆幸这些小国无法统一。那么问题来了,“表音文字百亿个单词”以及“汉语把字组合起来”一定造成如今的场面吗?有几率失败;量子力学的话说,叠加态。西班牙语名词的 el 和 la 是阴阳性(或者说男女性),必定更兼容某领域,大舌音更兼容某领域。 🎉 西班牙语 en la mesa 无法篡改效率, 🎉 汉语“葛立,恒数”无法篡改效率, 🎉 越南语 một đứa con trai 无法篡改效率。 

❌ 有人说:无歧义且简洁,无损压缩;有歧义但简洁,有损压缩;无歧义但冗长,低效。大错特错! 

✅ 此人忽视了两点:其一,电脑和人脑的算法不同;其二,局部和整体的区别。虽然 TREE(3) 大于葛立恒数,但是 TREE(2) 等于三, TREE(1) 等于一。因为 TREE(2) 只有树根和树枝,所以只有三; TREE(3) 生长树叶了,且树枝超多,因此大于葛立恒数。电脑是有限的,数学上有无限,因此不能这么比喻;电脑和人脑的算法不同,还是不能这么比喻。 

游戏规则支持旧树包含新树,仅仅禁止新树包含旧树。节点减少属正常现象。

三角形面积公式是底乘高除以二。底下放两个角,顶上剩一个角;过顶上的点画一条和底平行的虚线,把顶上的角按着虚线移动四万米,三角形面积不变。量子叠加了葛立恒数门语言,也找不到哪门更高效;所以法语避免了问题A但引发问题B。貌似西班牙语 la señal de derecho de autor 很怪异。 

¿? 那么问题来了,所有语言相加能否描述全宇宙?根据量子力学,我认为不能;两个语言相加出现某歧义,两个语言分离删除该歧义。汉语“窗户”翻译成日本語 窓 ;猫咪谈恋爱可能汪汪叫,汉语“老公”翻译成日本語 主人 。 copyleft 汉语无法翻译, https://lists.gnu.org/archive/html/www-zh-cn-translators/2019-02/msg00005.html ,用另一门语言也许能翻译,假设翻译成 ♨︎ ;用汉语传授这门语言, ♨︎ 指代 copyleft ,也可用 Rosetta Stone 传授这门语言。混合多门语言,甚至不知道对方用的什么语言,更不可能描述全宇宙。 https://www.merriam-webster.com/dictionary/ampersand , & per se and 。

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Crea tu página web en WordPress.com
Empieza ahora
A %d blogueros les gusta esto: