能详细介绍下计算语言学究竟是研究什么

1. 计算语言学的研究内容



    社会的需求和技术的进步推动历史悠久的语言学和新兴的计算机科学相结合,产生了
一门交叉学科---计算语言学(computational linguistics)。计算语言学为利用计算机处
理语言信息(包括语言中信息成分的发现和提取,语言数据的存储、加工和传输,语言的
翻译和理解)提供理论模型、计算方法和实现技术,因此考虑问题都是站在计算机的立场
上的,这同过去以人为对象的语言研究有着明显的不同。稍微学过一点英语的中国人都不
难把第一次见到的下面两句英语正确地翻译成汉语。

          I bought a table with three legs.(我买了一张有三条腿的桌子。)

          I bought a table with three dollars.(我花三美元买了一张桌子。)   


计算机要翻译这两句话,却碰到了不易处理的歧义结构问题。尽管当代计算机的存储容量
极大,但也不可能一一记住所有英语句子的汉语译文。计算机不难记住数量有限的英语句
子结构及其对应的汉语句子结构。一般地说,计算机系统里有了这样的知识,就可以通过 数据挖掘交友
句法分析和查词典实现自动翻译了。这一步算是句法理论(syntax)的成就。

    上述两个句子的结构都是

          名词短语+动词+名词短语+介词短语

最后的介词短语既可以修饰句中的动词,也可以修饰后一个名词短语。要计算机针对具体
的句子决定取舍,可就犯难了。因此要以某种形式给计算机灌输诸如“桌子有腿,用美元
可以购物”之类的知识,并要教会计算机如何运用这些知识,这属于语义学(semantics)和
语义分析的研究范围。在很多情况下,计算机死记住一些静态的知识还不能消解这种结构
的歧义,还要学会分析上下文和谈话的环境,从语境中获取并活用动态的知识,这又要靠
语用学(pragmatics)和语境分析(context analysis) 发挥作用了。除了要分析语言,文章
生成(text generation)也是一门学问。

    以上理论都是建立在基于规则的语言模型上的。基于规则的理论模型用于指导语言信
息处理实践历史虽久,却常常捉襟见肘。与此同时,计算机技术飞跃进步,这又推动了基
于统计模型的语料库语言学(corpus linguistics)的发展。同样,基于统计的理论模型也 数据挖掘研究院
有其自身的局限性。 有机结合两种模型,不断地实践,并吸收相关学科(如脑科学,认知
科学等)的成果,人类理解语言的奥秘总会被逐步揭开,模拟这个过程的自然语言处理系
统也会逐渐接近真正理解的目标。语言信息处理是数字计算机在非数值领域的最早应用,
50年来,虽历经坎坷,终究取得了长足的进步,并在社会生活中发挥作用。计算语言学从
定名起,也有了30多年的历史,已成为一个稳定而且活跃的学科。
[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:信息时代对汉字编码的要求及汉字编码的发展方向
下一篇:中文信息处理重大成果汇报展
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • 统计语言模型能做什么?
  • 经典论文Magerman (95) Decision Tree Pars
  • Personal Information Management: PIM 200
  • 自然语言理解技术及其应用探讨(上)
  • Invitation to attend second workshop on
  • 能详细介绍下计算语言学究竟是研究什么
  • 自然语言理解技术及其应用探讨(下)
  • 自然语言理解相关书籍资料推荐
  • 请教关于中文自然语言处理的问题
  • 2006末各大行业垂直搜索引擎横向测评
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • Personal Information Management: PIM 200
  • 能详细介绍下计算语言学究竟是研究什么
  • 信息时代对汉字编码的要求及汉字编码的发展
  • 统计语言模型能做什么?
  • Statistical Language Modeling Toolkit
  • 经典论文Magerman (95) Decision Tree Pars
  • 语义及概念体系在NLP中的作用
  • HNC理论的语言学基础
  • 自然语言理解技术及其应用探讨(上)
  • HNC的发展和未来
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静