命名实体识别 named entity recognition
在文本中找到相关实体并标注其位置、类型等信息。
传统机器学习使用隐马尔可夫hidden markov model,最大熵 maximum entropy, 条件随机场 condition random fields等。
传统方法
命名实体词典、设定识别规则、对规则赋权
深度学习
BiSLTM-CRF、Stack-LSTM。 LSTM-CRF(条件随机场)获得了更好的效果,主流模型,如果有高质量辞典、特征,会更好。 目前NER(命名实体识别)主要在两方面:词语句子对表达强化、少量标注的训练学习。
The large amount of word makes it difficult for model to store a sparse matrix. therefore, embedding is a great choice to improve the accuracy.