文献综述
文 献 综 述1 引言命名实体识别(Named Entity Recognition,NER)技术可用于识别文本中的特定实体信息,如人名、地名、机构名等,在信息抽取、信息检索、智能问答、机器翻译等方面都有广泛应用,是自然语言处理的基础方法之一。
一般将命名实体识别任务形式化为序列标注任务,通过预测每个字或者词的标签,联合预测实体边界和实体类型。
随着神经网络的迅速发展,不依赖人工特征的端到端方案逐渐占据主流。
文献[1]基于单向长短期记忆(Long-Short Term Memory,LSTM)模型和神经网络进行命名实体识别,提出LSTM-CRF模型。
基于LSTM良好的序列建模能力,LSTM-CRF成为命名实体识别的基础架构之一,很多方法都是以LSTM-CRF为主体框架,在其基础上融入各种相关特征。
例如文献[2]加入手工拼写特征,文献[3,4]使用一个字符CNN来抽取字符特征,文献[5]采用的是字符级LSTM。
也有基于CNN的命名实体识别方案,例如文献[6]提出的CNN-CRF结构,文献[7]在CNN-CRF基础上提出使用字符CNN来增强的模型。
此后,文献[8]采用空洞卷积网络(IDCNN-CRF)进行命名实体识别,在提取序列信息的同时加快了训练速度,文献[9]在BiLSTM-CRF模型的基础上利用注意力机制获得词在全文范围内的上下文表示,并将该模型应用于化学药物实体识别任务,通过在生物文本上预训练词向量以及使用字符级LSTM,获得了90.77%的F1值。
文献[10]采用GRU计算单元,提出了基于双向GRU的命名实体识别方法,并将其应用于会议名称识别任务。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。