中科院自动化所张家俊访问我院并做学术报告

作者:sds_poster 发布时间:2019-04-18

2019年4月12日,中科院自动化所模式识别国家重点实验室张家俊副研究员应邀访问我院,并在子彬院北205会议室开展了“文本序列生成中的同步双向推断模型”的学术报告。此次报告由我院魏忠钰副教授主持,大数据学院的多位教师和学生们聆听了此次精彩的报告。

pic123

张家俊老师将自然语言处理任务形式化为四类:输入和输出对称的序列映射;输入是序列输出是类别的分类任务;输入是两个序列输出是相似度的相似度判别任务;输入和输出非对称的序列映射,其中前三者皆属于自然语言理解任务,第四个是自然语言生成。

张老师首先介绍了BERT(Bidirectional Encoder Representations from Transformers)模型,这一模型自2018年Google提出以来,在自然语言理解任务中取得了突破性进展,并指出采用Transformer框架的双向编码模型是其成功的关键因素之一。相比自然语言理解,生成任务中的大多数工作仍采用自左向右的单向解码模型,限制了对未来信息的利用。

随后,张老师介绍了他们提出的面向文本序列生成的同步双向推断模型(BIFT),该工作提出并行处理自左向右(L2R)和自右向左(R2L)的推断解码模型并使之进行交互,即L2R与R2L每一个方向的推断都依赖于双向的生成结果,从而可以有效利用到未来信息,并提出同步双向注意力模型,实现同步双向推断。该工作在机器翻译和自动摘要上都取得良好效果。

最后,张家俊老师同在场师生进行了热情交流,本次报告会圆满结束。

作者:王思远