简介:汉语分词是中文信息处理的一项基础性工作。为避免人工阅读或机器处理时的分词歧义和未登录词难以识别的问题,有专家建议写作时在汉语词之间添加空格。文章从语言学本体研究、语言使用以及语言工程等不同角度对传统观念下的汉语分词存在的困难进行探讨,指出汉语分词在词的定义、群众语感以及分词规范、词表确定及工程应用等方面都存在不确定及不一致等因素。近年汉语自动分词处理不纠缠于词的确切定义,以字组词,针对标注语料和网络上带有丰富结构信息的海量文本,利用机器学习方法对汉语“切分单位”的标注取得了较好的进展。针对基础性的汉语分词规范,从语言规划的政策性、科学性及引导性角度提出建议,最后指出结合语言学指导和数据驱动的机器学习策略,可望为实现汉语自动分词的准确性和适应性提升服务。
简介:好莱坞电影习惯讲述白人英雄在华夏大地上行侠救难的故事。作为叙事结构中被抑制的客体和被讲述的对象,蒙昧的中国角色迎合了西方观众深入蛮邦征服救赎的幻想。这套经典模板在1999年华裔导演胡安的影片《西洋镜》(ShadowMagic)里出现了有趣的调整。在这部全球发行的华裔制作影片中,北京照相馆的伙计小刘和赴华淘金的英国人雷门之间的摩擦、争执和友谊既挑战了好莱坞传统的族裔文化等级话语,又肯定了西方文明的优越性,向世界讲述了一个新颖的中西文化交流的故事。本文认为,《西洋镜》对好莱坞的经典叙事重构体现了全球化语境下中国逐渐介入西方主流话语、建构新型国家民族形象的趋势。