命名实体识别

命名实体识别的定义与方法。

命名实体识别 named entity recognition

在文本中找到相关实体并标注其位置、类型等信息。

传统机器学习使用隐马尔可夫hidden markov model,最大熵 maximum entropy, 条件随机场 condition random fields等。

传统方法

命名实体词典、设定识别规则、对规则赋权

深度学习

BiSLTM-CRF、Stack-LSTM。 LSTM-CRF(条件随机场)获得了更好的效果,主流模型,如果有高质量辞典、特征,会更好。 目前NER(命名实体识别)主要在两方面:词语句子对表达强化、少量标注的训练学习。

The large amount of word makes it difficult for model to store a sparse matrix. therefore, embedding is a great choice to improve the accuracy.

Built with Hugo
Theme Stack designed by Jimmy