0 前言 前几篇博文主要是介绍传统机器学习方法在问答系统或其主要分支:机器阅读理解上的研究与应用,在之前介绍的大规模机器阅读理解数据集的基础上,我们来分析下深度学习方法在机器阅读理解领域的研究...
0 前言 Attention-over-Attention模型(AOA Reader模型)是科大讯飞和哈工大在2017ACL会议上的《Attention-over-Attention Neur...
0 前言 Stanford Attentive Reader是斯坦福在2016年的ACL会议上的《A Thorough Examination of the CNN/Daily Mail Re...
0 前言 Stanford Attentive Reader是斯坦福在2016年的ACL会议上的《A Thorough Examination of the CNN/Daily Mail Re...
0 前言 前面的博文我们更多关注的是机器阅读理解的数据集介绍以及基于传统机器学习方法的问答模型的建模,随着2015年前后大量的大规模机器阅读理解数据集的发布(主要的机器阅读理解数据集前面博文有...
0 前言 前面两篇博文基本是使用自然语言处理方法分析问题与答案的依存关系或潜在语义关系,然后使用统计学方法或数学方法计算问题与答案的相似度来找出最可能的答案句子。基于这两篇博文,我们将其应用到...
0 前言 在上一篇博文《一种基于模糊依存关系匹配的问答模型构建方法》我们分析了基于模糊依存关系匹配的问答模型构建,其基本思想是通过模糊匹配问题(question)和包含候选答案的句子(Sent...
0 前言 基于传统机器学习方法构建问答模型的主要工作是构建适合当前任务的特征工程,在《中文自然语言处理建模过程中的特征工程》一文中,我们介绍了很多可提取的特征以及提取方法,主要的特征集中在句法...
近来在尝试用传统机器学习方法来做一个中文问答系统,传统机器学习方法建模其实主要的工作在于模型的特征工程,本文主要受哈工大的《中文语义角色标注的特征工程》及其参考文献的启发,分析及总结了在中文的自...
1、Stanford CoreNLP Stanford CoreNLP是斯坦福大学自然语言处理小组开发的自然语言分析工具集,包含分句,分词,词性标注,命名实体识别,句法分析,指代消解,情感分析...
0 HFL-RC数据集 语料主要来源于人民日报和儿童童话,论文地址。数据集下载地址。图1展示了从人民日报提取的样本案例。 图 1 从人民日报提取的样本案例 从图1中可以看出,文档包含了...
0 数据集 本模型使用了山西大学构建的中文阅读理解语料库CRCC(Chinese Reading Comprehension Corpus)V1.1。该语料库包含121篇文章,其中80篇来自对...
0 介绍 上篇博文我们通过介绍机器阅读理解的奠基之作《Teaching Machines to Read and Comprehend》对CNN&DailyMail语料库进行了分析,但...
0 CNN&Dailymail语料库 0.0 背景 教会机器能够阅读并理解人类文章是人工智能的一个前沿方向,也是机器更好地为人类服务必须具备的一个能力。传统机器阅读理解方法大多为无监...
0 基于SQuAD数据集的通用模型架构 由于 SQuAD 的答案限定于来自原文,模型只需要判断原文中哪些词是答案即可,因此是一种抽取式的 QA 任务而不是生成式任务。几乎所有做 SQuAD 的...
0 什么是机器阅读理解 目前,深度学习在图像识别、语音识别等领域取得丰硕成果,机器阅读理解(Machine Reading Comprehension,MRC)成为了人工智能研究与应用领域的新...
一、2013,MCTest 论文:《MCTest:A Challenge Dataset for the Open-Domain Machine Comprehension of Test》 ...
1.1 竹篮打水一场空-过拟合 如果你发现在训练集上你的模型无比的完美,请晚一点再开心,因为很有可能你的模型已经过拟合了,那么这个模型就算废了。过拟合的直观解释是模型在训练集上性能完美,但在验...
1.1 为什么有了全连接神经网络和CNN还需要RNN? 我们通过前两篇博文知道了全连接神经网络和卷积神经网络的基本工作原理,这两种网络结构的层与层之间是全连接或部分连接的,但在每层之间的节点是...
1.1 为什么有了全连接网络模型还要CNN? 全连接网络模型是指在神经网络中每两层之间的所有结点都是相连接的,但在处理图像数据时,全连接网络所需要的参数个数太多,比如处理一张单通道图片,图片大...
深度学习在一定程度上等同于深层神经网络,维基百科对深度学习的概念为:一类通过多层非线性变换对高复杂性数据建模算法的合集。从该定义中可以看出两个深度学习的特征:多层和非线性。 1.1 非线性与线...
现在所说的深度学习基本是深层神经网络的代名词,神经网络技术不是最近新发明的,其最早可以追溯到1943年。1943,神经网络早期的神经网络模型类似于仿生机器学习,受大脑的学习机理启发,模仿大脑神经...
一、 什么是N-gram语言模型(Language Model) N-gram是自然语言处理(NLP)中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-gram来做以下几...
现在看这种类型的英文论文开始有点感觉了,大部分术语积累的差不多之后看论文确实相对刚开始看要快一些,一遍过下来也掌握的信息也比较多,如果你和我一样都在看英文论文的道路上挣扎,建议你看下这篇帖子的内...
找技术路线很头大啊,明天还要做一个技术分享(压力山大)…这篇论文《Discourse Element Identification in Student Essays based on Glob...
最近在研究基于自然语言处理的作文自动评分系统,现在对其中一篇与篇章结构分析相关的论文:《Finding the WRITE stuff: Automatic identification of ...