HNC理論以自然語言理解為其核心探索目標(biāo),試圖為語言理解的探索開啟一條新的途徑,以語言概念空間的符號化、形式化為手段,實(shí)現(xiàn)人類語言腦的純物理模擬。
《HNC理論全書:論語言概念空間的總體結(jié)構(gòu)》圍繞“概念無限而概念基元有限、語句無限而句類有限、語境無限而語境單元有限、顯記憶無限而隱記憶有限”這4項(xiàng)HNC理論的基本定理,集中論述語言概念空間的概念基元、句類、語境單元和記憶四層級結(jié),并對語言信息處理中的具體問題作了深入剖析。
更多科學(xué)出版社服務(wù),請掃碼獲取。
《HNC理論全書:論語言概念空間的總體結(jié)構(gòu)》:
第一章 概念基元總論
引言
第1節(jié) 概念基元有限性的形而上思考
(語言概念空間基本景象的描述)
本節(jié)標(biāo)題后面的括號里有一個不尋常的短語—語言概念空間基本景象的描述,這個短語可簡化成“語言概念空間的基本景象”,還可進(jìn)一步簡化成“彼山基本景象”。這些短語都更適合作本章首節(jié)的標(biāo)題,但考慮再三,還是選用了現(xiàn)在的標(biāo)題。這不是為了保持撰寫風(fēng)格的一致性,而是為了凸顯科學(xué)探索的要害所在,對于揭秘語言腦這一極為特殊的探索,這一點(diǎn)乃是攸關(guān)成敗的第一大事,因?yàn),如果沒有形而上思考的足夠功力,是很難看清彼山的基本景象的。當(dāng)然,彼山景象本身的描述非常重要,前文已經(jīng)用了不少篇幅,后文還會繼續(xù)這么做,本《全書》以著重描述彼山景象為己任,也有成就一部彼山專著的夢想,但畢竟孤掌難鳴,筆者將僅以披荊斬棘為滿足。描述此山景象的專著早已浩如煙海,通俗讀物也不乏精彩之作,如果將來能出現(xiàn)兼述兩山景象的專著或通俗讀物,那將是一件功德無量的事。
“概念無限而概念基元有限”是HNC 探索起步時的一個基本假定。該假定的提出受到兩件事的啟發(fā)或激勵:一是黑格爾的名言—哲學(xué)的開端就是一個假定;二是漢字的“減而不增”現(xiàn)象,《理論》里對此有符合世界知識闡釋標(biāo)準(zhǔn)的論述[*01] 。
基于“概念無限而概念基元有限”假設(shè)而得到的第一批探索成果既包括本章后續(xù)3 節(jié)所描述的內(nèi)容,也包括本編第二、第三章的內(nèi)容,那是20 世紀(jì)90 年代初期的事。當(dāng)時,一些研究HNC 的朋友曾把這一初步成果比作“元素周期表”的發(fā)現(xiàn)。這個比喻一直使筆者深感不安,因?yàn)椤案拍顭o限”或許有點(diǎn)類似于物質(zhì)結(jié)構(gòu)和形態(tài)的無限,但“概念基元”不能等同于元素,而“概念基元有限性”更不能等同于“元素周期表”。
“概念基元”是什么?它是所謂的語義基元或概念節(jié)點(diǎn)么?這是本節(jié)必須回答的第一個問題!案拍罨比绾味x?“概念基元”與“基元概念”是什么關(guān)系?這是本節(jié)必須回答的第二個問題!案拍罨邢蕖笔羌僭O(shè)還是公理?公理之說的依據(jù)何在?這是本節(jié)必須回答的第三個問題。以下用3 個小節(jié)進(jìn)行論述,每小節(jié)的標(biāo)號方式與前兩卷相同,以達(dá)到《全書》的統(tǒng)一。
1.1.1 概念基元不是語義基元或概念節(jié)點(diǎn)
“語義”是當(dāng)下中國的熱門詞語,國家級科技項(xiàng)目都高舉著“語義”的大旗。這一景象非常奇特,筆者也不明白其究竟,但有一點(diǎn)是清楚的,多年來主宰著計(jì)算語言學(xué)的語法派(理性主義)和語料庫派(經(jīng)驗(yàn)主義)都遇到了巨大的危機(jī),傳統(tǒng)的詞法和句法分析已經(jīng)難以有所作為了,基于語料庫的各種統(tǒng)計(jì)算法(語料庫語言學(xué))已開始顯露出“黔驢”的本相。雙方都要尋求出路,不約而同地都求救于語義學(xué),以為語義是一根靠得住的救命稻草。
英語詞典里并沒有“語義”這個詞語,只有“語義學(xué)”這個詞語,《現(xiàn)漢》也如法炮制,《現(xiàn)范》則反其道而行之,收錄了“語義”而未收錄“語義學(xué)”,因?yàn)椤冬F(xiàn)范》原則上不收錄帶后綴“學(xué)”的三字詞!冬F(xiàn)范》對“語義”的解釋十分寬泛,大大超出了《現(xiàn)漢》對“語義學(xué)”的解釋范圍。
《現(xiàn)范》對“語義”的解釋[*02] 需要大力依靠“意義”這個通用詞語,還要依靠“詞匯”、“句子”、“語法”、“語用”、“語境”等專業(yè)詞語,以及其他一系列通用詞語(如“概念”、“交際”、“適應(yīng)”等)。《現(xiàn)范》對“語義”的解釋在形式和內(nèi)容兩方面似乎都十分到位,但語言腦對“語義”的理解依靠這樣的解釋么?這里的“依靠”既有“能不能”的問題,又有“需要不需要”的問題。不追問這兩個問題是形而下思維或“一根筋”思維的習(xí)慣或表現(xiàn),追問下去才是形而上思維或靈巧思維的習(xí)慣或表現(xiàn),這將在下一小節(jié)細(xì)說。
下面回到本小節(jié)的主題:概念基元不是語義基元或概念節(jié)點(diǎn)。先說“概念基元是什么”,然后再說為什么“概念基元不是語義基元或概念節(jié)點(diǎn)”。
概念基元是指456 株概念樹所對應(yīng)的各級延伸概念,不包括概念樹本身,更不包括居其上位的概念林(群)和概念范疇。延伸概念這個術(shù)語的提出較晚,筆者在使用這個術(shù)語之初也沒有特意強(qiáng)調(diào)它的極端重要性,這是HNC 探索歷程中最為遺憾的一件事;谝环N彌補(bǔ)最大遺憾的心情,這里特意寫下對應(yīng)的英語符號:extended concept ,簡記為EC。
各級延伸概念的總和是有限的,本《全書》的前兩卷已充分揭示了這一點(diǎn)。所謂“概念基元的有限性”就是指“各級延伸概念總和的有限性”。理解了這一點(diǎn),才算是真正理解了HNC 理論的精髓。
但真正理解這一點(diǎn)并非易事,這既需要向上思考,把握“概念樹-概念林-概念范疇”的有限性;又需要向下思考,把握延伸級別(縱向延伸)的有限性和同級延伸數(shù)量(橫向延伸)的有限性。上行思考和下行思考都要力行齊備性和透徹性的原則(簡稱“透齊原則”,前兩卷經(jīng)常使用這個簡稱),這確實(shí)是“一根筋”思維習(xí)慣難以適應(yīng)的。
這里的“上行思考”和“下行思考”是以概念樹為參照來說的,如果以概念范疇為參照,則上述“上行思考”也變成了“下行思考”,HNC 之“概念范疇-概念林-概念樹”的最終確定是上行思考與下行思考多番交織的結(jié)果,“1200 個漢字”雖然曾是此項(xiàng)交織思考的基本依托,但該思考的主心骨還是康德先生所強(qiáng)調(diào)的理性法官[*03] ,這就是說,上行思考與下行思考要在不斷改變參照層級的過程中交織進(jìn)行,而關(guān)鍵是:要善于中間切入,先上后下。一味“上而不下”者叫空想家,專注“下而不上”者叫專家,善于“中間切入,先上后下”者才是思想家。上行思考的通俗名稱叫“仰望星空”,下行思考的通俗名稱叫“俯瞰大地”。語言的“星空”叫作語言概念空間,簡稱“彼山”,描述彼山景象的東西叫原則或公理;語言的“大地”叫作自然語言空間,簡稱“此山”,描述此山景象的東西叫規(guī)則或定理。喬姆斯基先生雖然自視甚高,但并不明白這個關(guān)于原則與規(guī)則的區(qū)分依據(jù)或區(qū)別法則。“一根筋”思維的基本特征是:既不仰望,更不俯瞰,而是隨波逐流。一個世紀(jì)以來,語言和大腦的探索是否處于隨波逐流的可悲狀態(tài)呢?是提出這個問題的時候了。
當(dāng)然,隨波逐流是一股巨大的慣性力量,是文明主體之現(xiàn)代化歷程的心理引擎之一,也是一把雙刃劍,其積極意義的一面不能抹殺。但是,許多重大的科學(xué)探索活動要力求避免隨波逐流的消極面,而這項(xiàng)特定的“力避”非常困難,在HNC 探索的《理論》階段,這種消極影響可謂歷歷在目,最典型的印跡就是“語義網(wǎng)絡(luò)”、“語義塊”、“語義距離”等術(shù)語的提出或使用。其中,“語義塊”這一術(shù)語最令筆者痛心疾首,因?yàn)槟莻“義”字不僅是多余的,而且為害極大。
語形、語義、語用之“三語”說[*04] 是符號學(xué)對20 世紀(jì)人文社會學(xué)的一項(xiàng)重要貢獻(xiàn),但“三語”說乃是貌似體說而實(shí)為線說的典型學(xué)說,并未發(fā)展成為適用于彼山景象描述的指導(dǎo)理論。語形、語義、語用不過是僅供分析與歸納之用的三條線而已,不能構(gòu)成符合“綜合與分析+演繹與歸納”要求的三維度思考空間,因而也必然不能勝任對彼山景象的描述。語言學(xué)界曾應(yīng)用“三語”說進(jìn)行此山景象的描述,但收效不大。表面上似乎形成了語形學(xué)、語義學(xué)和語用學(xué)之間的分工與合作,實(shí)際上是形成了一幅獨(dú)特的“推卸責(zé)任”景象,把困難(矛盾)逐級上交,語形學(xué)解決不了的問題上交給語義學(xué),語義學(xué)解決不了的問題再上交給語用學(xué)。其結(jié)果是出現(xiàn)了許多有趣的責(zé)任紛爭,這主要發(fā)生在語義學(xué)與語用學(xué)之間。但是,自然語言處理的基本責(zé)任究竟是什么?該項(xiàng)處理所面對的“勁敵”(根本問題或戰(zhàn)略性問題)和“流寇”(枝節(jié)問題或戰(zhàn)術(shù)性問題)[*05] 有哪些?紛爭的參與者們并不明確,甚至都沒有認(rèn)真思考過。
語形學(xué)實(shí)際上是語法學(xué)的“老地盤”,千年老店,品牌價值無與倫比;語義學(xué)也有許多不俗的成績,語用學(xué)更是曾風(fēng)光無限,促成了20 世紀(jì)哲學(xué)研究的著名語用學(xué)轉(zhuǎn)向。但品牌價值、不俗成績和無限風(fēng)光幾乎絲毫無助于機(jī)器翻譯遭遇的半世紀(jì)尷尬[*06] 。這是一個嚴(yán)酷的現(xiàn)實(shí),但被一些傳統(tǒng)的光環(huán)掩蓋了。當(dāng)然,不能說學(xué)界有人在刻意隱瞞什么,但實(shí)際上在起著一種掩蓋作用,中國計(jì)算語言學(xué)界的表現(xiàn)尤為突出,林杏光先生的重慶遭遇[*aaa]就是一個非常值得反思的事件或證據(jù)。
這里應(yīng)該明確告知讀者:HNC 探索就是從對這一嚴(yán)酷現(xiàn)實(shí)的反思起步的,其理論目標(biāo)就是試圖建立一個符合“語形、語義、語用”體說要求的理論體系。當(dāng)時對語義學(xué)的認(rèn)識還是比較清醒的,知道它絕對沒有能力獨(dú)立承擔(dān)起降服“勁敵”和掃蕩“流寇”的重任,可是為什么《理論》竟然還是提出了“語義塊”的術(shù)語呢?現(xiàn)在回想起來,未免感到不可理喻,因?yàn)楫?dāng)時已非常清楚:“語義塊”不僅是語義的基元,也是語形和語用的基元,是三者的綜合基元。這個“義”字添加的失誤造成了巨大的貽害,現(xiàn)在不理解此話的讀者將來會逐步明白的。
……