简介:语言本是人与人交际凭籍的符号系统。仍随着电子计算机技术的提高和应用领域的扩展,语言又成为电子计算机用来传递信息和实施控制的符号系统。为了使电子计算机更好地凭籍这一符号系统工作,同时也为了人们对语言有更深刻的认识,一门新兴的交叉科学——计算语言学便应运而生。1987年,中国中文信息学会增设了计算语言学专业委员会。今年6月15日至16日,由该专业委员会主办的首届全国计算语言学学术讨论会在清华大学举行。来自全国各地的140多位代表参加了会议。在大会和分组会上,共宣读了57篇涉及句法分析算法、语义学研究、机器翻译、自然语言理解与基础研究以及机器词典编纂等方面的论文。其中黄昌宁、张弘的《一个用确定性算法实现的汉语句法分析系统DCSAS》、冯志伟的《德汉机器翻译系统
简介:<正>汉语量词可以大别为两类:一类是单位词,表示度量衡单位、集体、部分等;一类是个体量词,又被称作“天然单位词”“类别词”等。前一类为各语言所共有,后一类则是汉语区别于印欧语等的一大特点,受到汉语学界的重视,论文时见,专著迭出,描写研究得十分详尽。下文的“量词”专指这后一类。从信息论的角度看,“三本书”中的“本”纯属无用信息,象英语的threebooks那样说成“三书”似乎也传达了同样多的信息,那么量词在汉语中的存在价值何在?为什么会从无到有、以少到多、直至蔚为大观?多数量词研究的论著似乎都没有从宏观上提供汉语量词这“所以然”,虽然对“其然”的微观描写已经十分完备。本文只想尝试一下这种宏观分析,不少地方尚属推测,希望引起讨论。我们重点想从现代汉语的共时角度来谈一下量词的存在价值。存在价值之一,凑足音节。汉语词从先秦以来愈益双音节化,而且,在句法结构中,倾向于单音节词配单音节词,实为凑成一个双音节单位(鲜鱼、赛球)、双音节词配双音节词(新鲜蔬菜、篮球比赛)。这中间,名词走在双音化的最前列,数词从零到十却都没有双音化,于是,当数词和名词组合时,就会出现大量的单、双相配这种不合汉语趋势的配合(一石头、三钢笔),而量词正好跟数词凑成一个双音节单位,于是,“一