可以清心也,也可以清心

HH
無法歸類(Chinese: unclassified)
3 min readSep 9, 2017

最近有關文言文與白話的爭議,引發了許多跟語言有關的討論。有一篇支持文言文的文章,論點非常的荒謬,不談也罷,不過文中舉的一個例子滿有趣的。作者說有些茶壺蓋上寫著 “可以清心也”。這五個字厲害的地方是把它重組,變成 “也可以清心”、“心也可以清”、“清心也可以”、“以清心可也”,居然也都有意義,實在是滿巧妙的。別的語言因為文法的限制,似乎不太可能有這種效果。例如說 I like to play,如果把它重組為 play to like I,就不是句子了。如果有人講話這樣講,那只能出現在喜劇裡了(King illegal forest to pig wild kill in it a is! = It is illegal to kill a wild pig in King’s forest)

問題是這種文字遊戲,真的是證明了中文有某些神奇的特色嗎?還是說這只是一個極端的特例,並不是常態。英文也有許多非常巧妙的迴文與字謎,愛英文的人也可以用這些特殊設計出來的文字遊戲,來證明英文才是神奇的語言,所以這種思路我覺得不是很有意義。

不過,這個中文的例子,令我想到一個研究,它搜集了許多不同語言寫的文字,然後計算這些語言的資訊熵(entropy),也就是混亂度。語言的亂度高,意思不是說它寫出來的東西毫無章法,它的意思是這種語言比較精簡,寫出來的文章比較沒有重複的資訊。例如說我用英文寫 ifrmtion teory,儘管我遺漏了幾個字元,但你還是可以猜出來我寫的是 information theory,那是因為英文造字的規則造成了重複的資訊,有些字母刪去了無妨。有些語言比較精簡,刪了幾個字母就猜不出來了。這種語言的熵就比較高。

這個研究有趣的地方,是它把文章的字重組後,又算了一次資訊熵。例如說在計算英文的資訊熵時,只會碰到 I like to play 但不會碰到 play to like I。但如果把 play to like I 這種重組過後句子也算進去的話,亂度就增高了,因此會得到比較高的資訊熵。如果中文真的是那麼神奇,像是把 “可以清心也” 重組後的句子也能讀,那麼重組後資訊熵,增高的量就應該比別的語言少才對。

結果是作者比較了幾個世界主要語系的語言,發現不同的語言的確是有不同的資訊熵,不過如果把文字重組後再算一次資訊熵,這個增加的量,在不同的語言之中居然是相差無幾。作者認為這個資訊熵差異的常數,是所有人類語言的共通性質。也就是說在 “可以清心也” 這一件事上,中文其實一點也不特殊。

我得強調計算語言的資訊熵有許多技術上的困難,這個研究的結論是不是可信,我有點不確定,不過至少在理論上, “可以清心也” 是不是那麼的特殊,是可以算出來的。這篇文章用的不是文言文,如果文言文有白話沒有的神奇性質,那在理論上也是可以算的。

講到巧妙的語言遊戲,我有一個美國的朋友跟我提起這首璇璣圖,從不同的方向、正的反的都能讀,實在是令人讚嘆⋯⋯無聊沒正事幹的人怎麼這麼多啊。

參考資料:

--

--