系統功能語言學的知識表示方法研究-北京科技大學學報(社會科學版)(2015年3期)_第1頁
系統功能語言學的知識表示方法研究-北京科技大學學報(社會科學版)(2015年3期)_第2頁
系統功能語言學的知識表示方法研究-北京科技大學學報(社會科學版)(2015年3期)_第3頁
免費預覽已結束,剩余22頁可下載查看

下載本文檔

文檔簡介

龍源版權所有系統功能語言學的知識表示方法研究

作者:李學寧范新瑩

來源:《北京科技大學學報(社會科學版)》2015年第03期項目基金〕教育部人文社科青年基金項目“韓禮德的計算語言學思想研究”(編號為11YJC740056)的階段性成果?!沧髡吆喗椤撤秾W寧(1971-),男,湖南湘潭人,江南大學外國語學院副教授,博士,博士后。范新瑩(1989-),女,山東德州人,江南大學外國語學院碩士研究生。①在計算語言學、自然語言處理和人工智能的研究中,“系統功能語言學”和“系統功能語法”這兩個術語往往不加以區分。嚴格地說,前者指的是整個語言學理論,而后者只是其中的詞匯-語法系統。本文采用“系統功能語言學”這一術語,但是在涉及PENMAM的時候沿用了“Nigel語法”及其“系統語法”的提法?!舱诚到y功能語言學應用于語篇生成系統中需要進行知識表示。通過考察PENMAM,發現其一種主要的表示方法是系統網絡。然而,這種方法不能充分表示語言的交際性以及三元功能,在進行計算機實現時也存在一些缺陷?;诖?,文章進一步提出改進系統網絡表示法的兩種基本途徑:基于復雜性科學的理論途徑和基于人工智能的技術途徑。此研究能夠促進系統功能語言學與其他學科之間的交叉、融合,從而更好地開展面向自然語言處理用途的語言研究?!碴P鍵詞〕系統功能語言學;語篇生成系統;知識表示方法;系統網絡〔中圖分類號〕H319〔文獻標識碼〕A〔文章編號〕1008-2689(2015)03-0026-05引言“自然語言生成”又稱為語篇生成,指計算機通過自然語言文本來表達給定的意圖和思想。而“語篇生成系統”是相應的計算機軟件系統,它能夠自動地生成可以理解的自然語言文本。從20世紀60年代開始,系統功能語言學就開始應用于自然語言生成的研究。進入70、80年代之后,它在一大批語篇生成系統中得以實際采用,比較著名的有PROTEUS、PENMAM、SLANG、COMMUNAL等等。[1](39-42)90年代之后,它的影響力開始波及國內自然語言生成界,例如中科院研制的漢語句法實現系統[2][3]。直至今天,它對于一些新系統的建構也具有很強的借鑒作用。然而,系統功能語言學并不能直接應用于語篇生成系統。它需要進行“知識表示”或形式化表示,即采用一定的符號把語言學知識編碼成一組數據結構,才能為計算機接收并便于軟件系統使用。[5]本文將考察一個具有里程碑意義的語篇生成系統—PENMAM:結合它的基本框架,重點研究系統功能語言學在應用過程中所采用的系統網絡表示法。根據復雜性科學和人工智能的最新發展,進一步提出改進系統網絡表示法的理論和技術途徑。一、PENMAM系統的基本框架PENMAM是Mann、Matthiessen等人在20世紀80~90年代開發的一個大型英語生成系統。它在應用系統功能語言學的過程中提出了著名的Nigel語法,并進一步應用到了德語、日語、法語、西班牙語、荷蘭語、土耳其語等不同語種的自然語言生成。[6]目前,許多新建的語篇生成系統也往往與PENMAM/Nigel進行對比,以證明自己的先進性。①(一)PENMAM的設計框架在PENMAM的設計框架中,“資源”與“過程”被明確地區分開來。其中,“詞匯-語法資源”應用的是系統功能語言學中的詞匯語法知識。圖示如下:圖1PENMAN的設計框架下面,通過一段范文來演示PENMAM的工作流程:Youshouldreplace(setqx1)with(setfx1).Setfcanbeusedtoassignavaluetoanygeneralized-variable.Setqcanonlybeusedtoassignavaluetoasimple-variable.Ageneralized-variableisastoragelocationthatcanbenamedbyanyaccessorfunction.這個文本的目標是向讀者建議用(setfx1)取代(setqx1)。首先,PENMAM從知識庫中進行檢索,選擇兩種Lisp形式差別方面的知識。然后,從修辭資源中選擇合適的修辭結構,用以表示兩種Lisp形式之間的對比關系。在這兩個過程中都需要參考讀者模型,目的是判斷哪些信息與當前文本目標相關、但又不為讀者所已知。最后,采用系統功能語言學進行詞匯-語法表達,并編輯為上述文本。[1](9)(二)Nigel語法和環境Matthiessen等人進一步將PENMAM的設計框架概括為兩個主要的組成部分:“Nigel語法”和“環境”。[1](10)圖2Nigel語法和環境環境主要由“知識庫”和“文本規劃”兩個部分組成。它們包含了許多語法信息,例如事物的性、數、格等。Nigel語法是一個以系統功能語言學為基礎的模塊,它包括“系統語法”和“選擇與詢問界面”。前者由“系統”、“實現規則”和“詞庫”三個基本要素組成。后者是系統語法與環境之間的交互界面。它的作用是向環境不斷提出詢問,并根據回答對系統進行有目的的選擇。以名詞詞組的生成為例,界面會向環境詢問有關事物的語法范

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論