使用bert/gpt2/albert/xlm/roberta等预训练语言模型在ace2005上进行事件抽取任务。 代码在nlpcl-lab / bert-event-extraction框架上修改,使用pytorch 的transformer和crf模型替换了原项目的模型构建部分。 模型整体采用序列标注的方式,未使用任何辅助信息。 先用crf做触发词识别,再根据触发词识别结果再用crf进行论元识别,预训练模型选用xlm-roberta-large时,trigger-f1=0.72; argument-f1=0.45。argument提升了0.05。
A concept and obvious expression pattern collection of Chinese compound event extraction which then be evolved into ComplexEventGraph,本项目提出了中文复合事件的概念与显式模式,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。
本文提出了DyGIE++模型,通过对捕获了局部信息(句内)和全局信息(跨句)的text spans进行枚举、精炼、打分,可以处理命名实体识别(NER)、关系抽取(RE)和事件抽取(EE)共3种信息抽取(IE)任务。 在4个数据集上进行实验,本文的模型在3种信息抽取任务上均实现了state-of-the-art。 作者进行了实验对比了不同的构建span表示的方法,和上下文相关的方法例如BERT,捕获了同一句子或相邻句子中的实体关系,表现较好。
CCKS2019面向金融领域的事件主体抽取
科大讯飞2020事件抽取挑战赛第一名解决方案&完整事件抽取系统
中文复合事件抽取,能识别文本的模式,包括条件事件、顺承事件、反转事件等,可以用于文本逻辑性分析。
双bert(金融+通用bert)用于事件检测和事件要素抽取
此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务,所有代码都经过测试,可以正常运行。
近年来事件抽取方法总结,包括中文事件抽取、开放域事件抽取、事件数据生成、跨语言事件抽取、小样本事件抽取、零样本事件抽取等类型,DMCNN、FramNet、DLRNN、DBRNN、GCN、DAG-GRU、JMEE、PLMEE等方法
基于Pytorch和torchtext的自然语言处理深度学习框架,包含序列标注、文本分类、句子关系、文本生成、结构分析、五大功能模块,已实现了命名实体识别、中文分词、词性标注、语义角色标注、情感分析、关系抽取、语言模型、文本相似度、文本蕴含、依存句法分析、词向量训练、聊天机器人、机器翻译、文本摘要等功能。框架功能丰富,开箱可用,极易上手!基本都是学习他人实现然后自己修改融合到框架中,没有细致调参,且有不少Bug~
Entity and Relation Extraction Based on TensorFlow and BERT. 基于TensorFlow和BERT的管道式实体及关系抽取,2019语言与智能技术竞赛信息抽取任务解决方案。Schema based Knowledge Extraction, SKE 2019