bet3365官网

语言中下滑杠

语言中下滑杠

我很喜欢的卡牌游戏万智牌最近发布了一张新卡。卡图中,一位角色正在深思熟虑,他并不是人类,而是属于一个虚构的种族“维多肯”。他们的特征是蓝皮肤、每只手6根手指。这张卡的背景介绍里写道他数了5个人的名字,加上他自己“正好”6人。我不知道设计者是不是有意为之,这张叙述完美地展现了一个语言现象:“整”这个概念显然在大部分语言中是同我们手指数量相关的。这位维多肯并不像大部分评论者说得一样“不会数数”,他数得很好,只不过他得语言有着区别于我们的数字系统。

数字系统对于每个人来说都不陌生。在我们学习一门外语时,在了解过“你好”“谢谢”“我爱你”“X你妈”这些表达怎么说之后,我们基本都会开始学习在这门外语中,人们是怎么数数的。我们母语汉语的数字系统看起来浑然天成,与当今数学运算使用的最基本的10进制系统完美契合。契合到什么程度呢?在普通话中,我们为数值ø(无)、/、//、///、////、/////、//////、///////、////////、/////////、//////////分别指定零、一、二、三、四、五、六、七、八、九、十这十一个数词之后,就可以根据一套非常简单的打包规则,完成100以内的数字表达,而这个打包规则中甚至不会产生语音变化。100以上的数字,我们使用几乎是完全一样的规则,仅仅多定义出10的幂如何表达:百、千、万、亿,这样一来基本就已经完成我们当代社会生产生活所需的技术需求了。我们在100以上的计数表达中,有个很有特点的“零”占位符,即数值1024的百位是无数值,这时候需要增加一个“零”来占据这个空位。这是汉语特有的结构,它的存在允许我们在口语中省略末尾十的幂的表达,比如:一千二百和一千二、一百二和一百二十的含义是一样的。

零占位符确实一定程度上复杂了汉语数字100以上的表达,但瑕不掩瑜,我相信它仍然是当今现存语言的数字表达法中最符合逻辑、最高效的一个。传说中中国人高超的运算水平也从另一个侧面印证了这个事实。纵观世界广为应用的语言中使用的数字表达法,中国人总能找到或多或少的蹊跷。比如英语中11到19序列中的eleven和twelve明显不遵从剩下8个的打包规则(即NUMBER+teen),我比较熟悉的意大利语中这个分歧出现在17、18、19(从11至16使用NUMBER+dici,之后三个使用dicia+NUMBER)。法语拥有最“臭名昭著”的数字表达系统,因为它在100以内计数混合了两套不同的系统,一个是10基底的,另一个则是20基底的。它们分别代表了罗曼语的和高卢凯尔特语的影响。在法语中,数字7、8、9是被尽量避免的(R. Hurford, 1975),但也许并不是出于任何文化原因,而可能仅仅只是一个计数偏好。避免使用7、8、9,导致soixante-dix终于排除了“正确”形式*septante。

但我并不是想讨论汉语计数上比其他语言有多有优势。更何况这种可能的优势实则来自于汉语语音、语法、词汇形态各个方面的综合:我们在形态上得到的便捷其实是牺牲了一些语音优势的。正所谓此消彼长,到最后大家都能算清数学题,这点上没必要抓住说个没完,否则和一直讥讽中国人不会齿龈颤音的意大利人没有太多区别了。

这篇文章的初衷在于从一个更偏向人类学和语言类型学的角度,为大家简单地介绍一下世界中自然语言的数字表达可以有哪些可能性。自然语言是一个重要前提,这意味着它们和人类认知外部世界的方式紧密相关(马上我们会更详细地解释这一点)。

但首先我们还是得不涉及任何语言,仅从数学的角度来回忆一下计数系统是怎么运作的。我在文章一开始就使用了“/”来表达数值1,在这里我们来重新定义一下它:这道竖杠,无所谓粗细长短,也无所谓倾斜角度,而重要的是它的重复性。我们真正在意的是它重复了多少次。我们要计多大的数,竖杠/就重复出现多少次。但很显然这个数字越大,我们要划的横杠越多,很不方便表达。因此我们可以引入新的符号,比如“M”,可以规定当出现两条竖杠时,我们用一个“X”来代替,那么原本需要划三条杠///的数值3,现在只需要/X,需要划//////////的10,现在可以写作XXXXX。当然,X也可以代表四条杠,那么XXXXX这时就不再代表数值10而是20。人类语言大量使用这个“X”的概念来扩大其语言的计数能力。在这篇文章我们称之为“基底”(base)。

基底这个概念很类似于我们所说的“进制”,但不完全是。同时,它也不是所有人类语言都会使用的概念。世界上存在完全没有数字系统的语言,比如巴西的土著语言皮拉罕语(Pirahã)似乎连表示1和2的词汇都没有,只能表达“多”“少”的相对概念(Frank et al., 2008)。这一定是他们的生活中缺乏贸易行为,也不进行系统的存储、不记录历史不使用历法所致。一些语言会使用叠词(reduplication)来表达数量,即有多少个就重复多少次该事物。叠词显然是非常低效的,我们也可以将这个数值概念提炼出来,为每个数值命名,这样就有了one、two、three、four…这些难以进行形态分析的数词(即它们除表达数字之外难以有别的含义)。我们自然可以无限命名下去,比如数值11我们可以命名为bex,12为lothy,13为torpet等等,不过请想象一下一种100一下数字完全毫无规律的语言,它的存在是严重违背语言学经济性的。在命名数字的过程中,数词积累到一定程度就会催生出基底。而这第一个基底是多少,这第一个数量集合的概念到底是多大,就因语言而异了。我们已经接触到了10基底,也看到了法语残存的20基底,(英语中也有score和gross,感兴趣可以查一下分别有什么含义)。还有别的基底存在吗?

当然!最让我兴奋的数字表达系统就是在多年前被引入奥林匹克语言学竞赛的Umbu-ungu①语,来自语言学藏宝阁巴布亚新几内亚。这个语言使用4和24的混合基底,每4个数值一命名,48及以上使用24的倍数。即便这个系统非常古怪,但它作为一个可运算的系统,其基底仍然有很丰富的数学特征:24的约数非常多,有1、2、3、4、6、8、12、24共8个。所以在4的倍数中,12太小,16、20、28不能被3整除,选出24作为第二基底实属“出人意料中的理所当然”。接下来我会按照基底大小来依次介绍这些不同的系统。

4基底

4是自然界中比较容易观察到的数字:人有四肢,而每只手上除了拇指外有4根手指。这个概念其实并不是很显而易见,我们习惯了每只手有5根手指,因为在我们的语言中拇指也被划分在“手指”的概念下,但此类概念划分其实是有一定程度的任意性的,毕竟,拇指孤立在另一边,大小长度都有很明显的差异,而且因为骨骼构造它只能弯一折。这足以将它和其它四指区分开来。人的五指之间有4个缝隙。自然界中大部分哺乳动物也都是四条腿。一些巴布亚新几内亚的语言甚至直接使用“aso”或”asu”的词素来表达数值4,它的本意是“狗”(Ryan, 1972)。虽然“3狗人”表达的含义是“12个人”的想法令人发笑,但这其实是一个很朴实实用的表达方式。因为4是一个比较小的数,4基底常常和别的基底一起使用,两者之间的关系类似于“十”和“百”之间的关联。

5基底

在文章开头我们提到,人类的手部结构极大程度上决定了人类语言使用的计数系统。将数值5直接称为“手”,也是可以预见的策略。5基底常常和别的基底一起出现,因为既然观察到了一只手上的数学特征,很明显能够观察到双手以及双脚都有潜在的计数能力。阿兹特克语②和日本北海道的阿伊努语③一定程度上体现了这个特征,前者虽然拥有数字6至9的说法,却在16至19使用“15+NUMBER”的打包方式;后者则是从1数到5后,6至9的单词形态呈现出了“10-NUMBER”的特征(不是很明显,应该是经过了音变导致原有的结构丢失)。

反而,排除了人类手指有5根这个因素,5这个数量在自然界中就不是那么好观察到了。它跟天象也难以产生联系。所以可以认为5以及约数中有5的基底都是受到手指数量的影响。

6基底

使用6基底的语言在全世界目前独苗,是根据1996年的统计,使用者还有340人的Kanum④语(Ethnologue, 2015),位置还是在神奇的新几内亚。没有任何身体部分显示出6的数值,Hammarström (2009)认为可能跟当地数地瓜的活动有关。我也同意很有可能6基底是因为当地居民习惯于将什么东西6个做成一捆。值得一提的是这种语言中表达数字3的词素yempoka和Umbu-ungu语中的2yepoko非常相似,但我怀疑是转写方式导致的巧合——两种语言使用地区距离不是很近(但也不太远),且2和3在语义上区别比较明显。

7基底

这个基底是个质数,除了根据天象的星期周期有关,但是在缺乏实用性。事实上也没有哪种语言被证实有7基底,只有一种巴西土著语言“疑似”。我认为有可能该语言最大只能计到数值7。

8基底

8基底可以认为是数“除拇指外4指”或数“五指间4个缝隙”的技术方法的延申。一种墨西哥的土著语言Pame⑤语使用一种残缺的8基底计数法:他们将数值8计为“双手”,因此9被成为“双手1”。但看上去他们在这之后又放弃了这个基底,在11至19之间采取了非常标准的”10+NUMBER”结构,接着他们在20引入了一个新的20基底,最后令人匪夷所思的是在数到100的时候Pame语用和8完全相同的词表示100 (Avelino, 2008)。

值得一提的是印欧语中的4和8。前者的拟构是*kʷetwṓr。这个拟构被认为“过于复杂”,根手指”,进而在阿维斯陀语里指“四根手指的长度”(Henning, 1948)。就连印欧语中的9*h₁néwn也有理论认为它有“新的”(意即“新的序列”)或“缺少”(即相比10来说少1)之意(Blažek, 1999)。结合这几点,也许我们可以猜测印欧语在早期阶段有使用过以4和8作为参照的原始数字系统,它可能不能计超过10。

9基底

被认为在乌拉尔语系下的涅涅茨⑥语(Nenets)中使用(Parkvall, 2008)。但实际上根据我查阅的资料来看,两种涅涅茨语方言中都没有使用9基底的迹象。其中森地涅涅茨语⑥a使用完好的10基底系统,苔原涅涅茨语⑥b只有在数值8与9使用了4乘2和10减1的策略,剩下仍是10基底。

10基底

不讲了。

12基底

12基底的出现不仅仅因为12的约数众多。你是可以通过你的手数出12这个数的:现在伸出右手,将拇指搭在食指的第一个骨节上,是为1。之后移动拇指到食指第二个骨节上,是为2。之后顺次移动拇指,从食指点到小指,你正好可以得到12。这里拇指显然起到了和其他四指完全不同的功能:它是一个指针。这种计数方法据说在东南亚地区有所应用,同时也会延申出60基底,即一只手进行上述操作,另一只手在完成12循环后伸出一只手指表示进位,这样便是12乘5得60。尼泊尔的车旁语⑦(Chepang)使用的是几乎完美的12基底。从13起,车旁语使用“一十二一加”的表达,直到23“一十二十一加”,然后使用“二十二”24。这门语言属于汉藏语系,在前几个数字上还能和汉语找到些许联系:yāt.joʔ、nis.joʔ、sum.joʔ分别是123。

12在英语中的特殊性则应该与基底的使用无关,因为即便eleven、twelve在构词上与之后的序列有出入,它们本质上还是在与“10”的概念做加法,并不是忽略10基底重新制造两个新词。此处的不连贯性应该是由早期语言发展有关,是日耳曼语的特点。我认为可以理解为日耳曼语在拥有11、12这两个词之前就已经和其他印欧语分离了。这一点似乎也可以和之前提到的印欧语中4和8的独特之处相互映照。

16基底

虽然并没有资料显示任何用16作为基底的语言,我认为它可能在人类历史上是存在过的。因为存在受到手指间4个缝隙启发的数字系统,它也扩展到了双手,那么它就也有理由扩展到双脚。只不过可能使用缝隙计数本身就不够符合人类的直觉(人类理应是先注意存在的实体,再去注意到实体间形成的“无”),它启发的数字系统基数不够大,最终没能发展到16基底。而对于将“除拇指外的四指”当作一个基底的语言来说,它也有理由止步于“双手”,而不去考虑双脚。因为在我看来既然这些人把拇指和其他四指区别对待,他们很难把脚趾和这总计八根手指算在一个范畴之内——它们太短了。

20基底

20基底显然是双手双脚指头的总和。这个显而易见的特征使得20基底在全世界都有分布。使用20基底或者20和其他基底混合的系统的语言在世界语言中占比第二,数量仅次于10基底的语言。

24、32、60、80基底

24基底我们在之前已经有所描述,它不仅仅有数学属性上的优势,还有可能受到双手除拇指外8个手指的骨节总数启发,即我们将12基底中介绍的手指计数法应用到两只手上。而且显然我们的脚趾不能胜任这个工作,24基底没能像5基底、10基底一样继续因为脚趾翻倍。32基底只有非洲的Ngiti⑧语使用过(K. Lojenga, 1994),但它其实也不是真正意义上的32基底,因为看起来这种语言的传统计数法只能数到32,而并没有使用32做计算。在班图语的影响下,Ngiti语已经吸收了一套10基底的数字系统,而之前的传统计数法只有很少一部分人有所了解。这种新旧两套计数法的情况在语言发展过程中经常出现,我们比较熟悉的日语也存在类似的情况,它只保留了一些旧的数字形式,并且可能只用来指某一类事物的数量。

苏美尔语确实使用了59个不同的楔形文字来代表数值1至59,之后便进位。但这并不代表苏美尔语使用60基底,它应当至少是10-60基底混合的,因为这59个字符中也位数值10设计了一个特有的符号。考虑到数到60时楔形文字会进位,那么我认为苏美尔语应当会使用60+NUMBER的形式,也会对60做乘法。但我现在没有找到更多的资料求证。

*注意10的倍数其实是在重复表示10的字符

同时资料还显示另外两种新几内亚的语言有使用60基底的可能,分别是Ekari⑨和Auye⑩语。两种语言同属Paniai湖语族,数字1到19的表达非常相似。但差异出现在之后的20、30、40、50及60的表达。见下表:

总之一眼望去这两种语言在处理十的倍数时采用了非常混乱的表达方法,这里我不再展开讨论。但无论如何,当60被成为“一只脚”(虽说一只脚如何对应这么大的数字我们暂时无法得知)时,它就有潜力成为一个,基底。我们仍缺乏更多的语料来证实(很可能当地的居民仍不需要使用超过60的数字)。

使用80基底的语言Supyire语属尼日尔-刚果语系,拥有一个非常混乱的计数系统。它同时使用了5、10、20、80四种基底,还有专门的词汇表达数值400(还使用了和别的数字都不相同大的语法性)。混乱的原因是与周边语言的接触。数字80“ŋ`kùù”,在形式上和词源上都与“鸡”相同,而该语使用者却不能解释其原因。有学者则表示在历史上这曾是一只鸡的价格(Carlson, 1994)。这个命名法不由得让我想到大锤80。当然,这其实和将“狗”赋予数值4的含义的做法是如出一辙的。只不过4与狗之间的联系是依靠物理属性,而鸡与80的联系是通过其抽象的价值。而且显然在出现使用“鸡”作为数值80的表达之前,Supyire语已经具备表达数值80的能力,否则将无法完成该数额的交易。只不过鸡这个单词在该语中应该具有形式上的优势。

在最后我要隆重介绍另一门新巴布亚几内亚的语言,它不适用任何基底,因为它还停留在单纯的为数值命名的阶段,不使用任何进位、运算的机制,很可能无法表达超过最大数值的数字。它是Telefol⑾语。Telefol语从左手小拇指开始数起数到左手拇指是5,然后左手手腕6,左小臂7,手肘8,左大臂9,左侧肩10,左侧脖颈11,左耳12,左眼13,鼻子14,之后数到右侧眼睛、耳朵、脖颈、肩膀等等一直到右手小指。因此它的数字系统的最大值就是27,并不是说它使用27基底。但这种使用身体部分计数的方法在世界范围仍不算罕见。在世界语言结构地图中就特别指出了extended body-part这种类型。使用这种方法计数其实就是将信息和符号一一对应,需要表达什么数值就去指身体的部位。

因为篇幅原因,我仅仅将文章内容限定在对于“基底”的探讨上。语言的数字表达系统还涉及到一些别的因素,比如运算法则(比如加、减、乘、平方),进位规则,是否省略数值1等等,这些内容,我希望能在之后的小文章中和大家一起分享。语言的数字系统是个非常有意义的话题,从历史语言学的角度,它一直是语言中最根深蒂固的构成部分,在构建语系模型的时候起到非常关键的作用;而从类型学的角度来讲,它反映了人类认知自然世界、尝试表达自然属性时使用的最朴素的策略,很可能在帮助我们了解人类语言机能上有重要的影响。

因为不是论文所以格式混乱的引用:

Michael C. Frank, Daniel L. Everett, Evelina Fedorenko and Edward Gibson (2008), Number as a cognitive technology: Evidence from Pirahã language and cognition. Cognition, Volume 108, Issue 3, September 2008, pp. 819–824.

Ryan, Peter. Encyclopaedia of Papua and New Guinea. Melbourne University Press & University of Papua and New Guinea,:1972 ISBN 0-522-84025-6.: 3 pages p 219.

Hammarström, H. (2009). Whence the Kanum base-6 numeral system?. Linguistic Typology, 13(2), pp. 305-319. Retrieved 10 Mar. 2019, from doi:10.1515/LITY.2009.014

Heriberto Avelino, Department of Linguistics. University of California at Berkeley, USA, November 5, 2008.

Parkvall, M. Limits of Language, 1st edn. 2008. p.291. ISBN 978-1-59028-210-6

K. Lojenga, Constance , Summer Institute of Linguistics, SIL Eastern Zaire Group, March 2, 1994, December 30, 2007.

Carlson, R. (1994). A Grammar of Supyire. Berlin: Walter de Gruyter & Co.

文中涉及的部分语言数字表达系统(特别感谢网站Numeral Systems of the World's Languages):

https://mpi-lingweb.shh.mpg.de/numeral/Umbu-Ungu.htmhttps://mpi-lingweb.shh.mpg.de/numeral/Nahuatl-Guerrero.htm (阿兹特克语方言之一)Ainuhttps://en.wikipedia.org/wiki/Kanum_language#Numeralshttps://mpi-lingweb.shh.mpg.de/numeral/Pame-Central.htma. https://mpi-lingweb.shh.mpg.de/numeral/Forest-Nenets.htm b.https://mpi-lingweb.shh.mpg.de/numeral/Tundra%20Nenets.htmhttps://mpi-lingweb.shh.mpg.de/numeral/Chepang.htm https://mpi-lingweb.shh.mpg.de/numeral/Ngiti.htm这是已经十进制化后的系统,无法作为参考。https://mpi-lingweb.shh.mpg.de/numeral/Ekari.htmhttps://mpi-lingweb.shh.mpg.de/numeral/Auye.htmhttps://mpi-lingweb.shh.mpg.de/numeral/Telefol.htm

← JMeter 压力测试入门指南 Mockplus摩客和墨刀相比,谁才是产品经理的真爱 →

相关推荐