中文版 | ENGLISH

   个人简介
浙江理工大学虚拟现实实验室简介
杨文珍
    杨文珍,男,博士,教授,机械设计及理论专业硕导,控制工程专业硕导,计算机应用技术专业硕导。浙江大学机械设计及理论专业硕士,浙江大学CAD&CG国家重点实验室计算机科学与技术专业博士,浙江大学控制科学与工程流动站博士后出站,美国乔治梅森大学访问学者。
长期致力于人机交互、机器人和虚拟现实领域的研究,在盲文点显器、计算机触觉、计算机嗅觉、灵巧机械手、运动健康等方面,形成了研究特色。
研究方向:
    
学历情况:
    
留学经历:
    
查看详细>>
  当前位置:首页{urlsectionname}

2019 期刊论文 中文分词算法研究综述
时间:2019-07-24 14:06:54    浏览次数:235        

中文分词算法研究综述
《成组技术与生产现代化》2018年第35卷第3期 

摘 要: 针对制约中文分词算法效能的歧义消除和未登录词识别两大瓶颈,归纳和总结近年来基于词典、基于统计以及基于语义理解中文分词算法的研究内容.基于词典的分词算法以提高时间和空间效率为目标,通过改进词典结构来提高分词效率.双字哈希结构是目前查词性能较好的词典机制,但对于歧义消除和未登录词识别的贡献度有限.基于统计的分词算法通过改进统计语言概率模型,在一定程度上可消除中文分词的歧义,较好地识别出未登录词.条件随机场模型(CRF)综合了隐马尔科夫模型(HMM)和最大熵模型(ME)的特征,是目前基于统计分词算法的主流训练模型.随着神经网络的研究应用,基于语义理解的分词算法对歧义消除和未登录词识别表现出较好的性能,能够提高中文分词的正确率.未来中文分词算法将更多地围绕上下文语义开展研究,运用深度学习技术进一步提升歧义消除和未登录词识别的能力,从而提高中文分词的正确率.

版权所有©虚拟现实   地址:浙江省杭州市下沙高教园区浙江理工大学机械与自动控制学院15-348  邮编:310018
E-mail:ywz@zstu.edu.cn  QQ:点击这里给我发消息  浙ICP备05151518号  技术支持:燎扬网络

您是第 位访问者