陈舍被盯了足足十几秒之后才反应过来,对方这是期待自己激动一下呢。他僵硬的笑了笑:“那……是挺有趣……能说说这种语言吗?你们怎么判定的?”
“判定一种语言最好的方法,就是看词汇的复杂程度,”乔伊说,“在严格的机器语言里,其实只有两个字,0和1,所有的信息,都是这两个字的组合。”
“但两个字肯定是不足以表达足够复杂的概念的,想象一下英文里,如果只有A和B两个字母,那结果肯定会相当的有趣。目前的英语总词汇量已经接近一百多万,也是说,仅仅是词汇本身,就需要一百多万种排列——在二进制里,这个排列会需要长达20个词组。”
“当然,这个长度对于机器来说不算什么。通常来说,词汇本身越复杂,说明语言的精确性很高,但通用性差——以这个角度来评判,严格意义上的二进制语言,也就是现在我们所使用的机器语言,已经在精确性上达到了最高。”
第262章比谷歌酷多了
“你可以想象一下,每一个软件,其实就可以被看成是一整段语言,所有的语句,最后翻译成01的时候,其实对电脑来说,就是一个特别长的单词。”
乔伊双手尽力拉伸:“在语言学上,语言的基本组成部分其实不是字,字是语言的硬件基础,每一种语言的字,其实都是使用者为了方便而设定的。”
“英文的字母,其实就是简单的约定符号,中国的汉字,最早是从模拟某种特定的事物而来,以象形为基础。语言的基础是词——词代表了一个确切的含义。”
“比如中文里的春天,和英文的spring——在春天这个概念上,它们可以被认为是大概相等的,但两者并不能完全取代。因为春天只是两者在语言学上的交集,除了交集含义之外,两个词都还分别各自有其他的意思。
“在英文里,spring还代表着泉水,以及弹簧,这两个概念都是在中文里没有的。同样,中文的春天,还可以指代某种好的情境,单独来说,某人的春天到了,还有性暗示的味道——但这种用法在英文里也是不存在的。”
“这种一个词代表着多重含义的现象,我们这里被称之为语言学上的复杂程度。没有具体的指标,是一个感性的标尺。”
“这样说吧,还是spring,在英文里,他的复杂程度就比中文稍微高一些,但大致都是差不多。”
“两者都是常用词汇,复杂程度本身,代表着语言使用过程中的演绎和文明本身的复杂程度——如果回到石器时代,也许古代的字母文字中,可能存在类似spring的词,也许字的符号完全不一样,但它表示的意思,肯定跟中文的春天,英文的spring是大概相等的。”
“但,即使存在这样一个词,我们也完全可以断定这个词的复杂程度不会高于现在的spring和春天,为什么,因为词的更多含义,并不是语言创立之初被赋予的,而是在漫长的使用过程中自己演化出来的。”
--