栏目:居转户落户上海咨询    人气:0    日期:2023-07-15

免费提供最新落户政策及一对一落户上海方案

留学生/应届生/非婚子女 落户上海咨询

落户上海咨询二维码  

  

左边公众号右边关注“ML_NLP”

  

设为“星标”,重磅干货,第一时间送达!

  

  

转载自|机器之心

  

如何解释深度神经网络对于人工智能的发展具有重要的作用,也吸引了越来越多学界和业界人士的注意。在这篇长达134页的博士论文中,一位来自牛津大学的计算机科学博士生对这一课题进行了深入的探讨,带我们走进深度神经网络的世界。

  

近年来,深度神经网络正在计算机视觉、自然语言处理和语音识别等多种领域发挥着重要作用,推动了人工智能的发展。但是,深度神经网络仍存在一些局限性,例如这些模型的决策过程通常无法向用户解释。

  

但同时,在医疗、金融、左边法律右边等各个领域,了解人工智能系统决策制定背后的原因至关重要。因此,研究人员已经探索出了解释神经模型的一些方向。

  

10月6日,牛津大学计算机科学博士生、且继续攻读XAI博士后的OanaCamburu在推特上公开了自己的博士论文《解释深度神经网络》(ExplainingDeepNeuralNetworks),详尽全面地介绍了不同类型的深度神经网络解释方法,并表示「社区中该领域的研究正在增长,非常高兴自己进行了相对深入的挖掘。」

  

  

在这篇博士论文中,作者深入探究了解释深度神经网络的两个主要方向。第一个方向包括基于特征的事后(post-hoc)解释方法,即旨在解释已经训练和固定模型的方法,并提供输入特征方面的解释,如文本token和图像超像素。第二个方向包括生成自然语言解释的自解释(self-explanatory)神经模型,即具有内置模块且能够生成模型预测解释的模型。

  

  

这篇博士论文具有以下几方面的贡献:

  

作者揭示了仅使用输入特征来解释模型具有一定的难度。她指出,对于某些模型和实例而言,存在着不止一种ground-truth特征解释,所以一种解释(或解释器)的真实性取决于实践中偏好的ground-truth解释类型;

  

作者提出了一种自动验证真实性的框架,借助于这个框架,基于特征的post-hoc解释方法可以描述它们想要解释的模型的决策制定过程。这种框架是通用的,并可以在不同任务和域上实例化,以提供用于测试基于特征事后解释方法的完整性测试;

  

为了探索生成为自身生成自然语言解释的自解释神经模型方向,作者在斯坦福自然语言理解推理(StanfordNaturalLanguageInference,SNLI)数据集的基础上创建了一个包含约570K个人类书面自然语言解释的大型数据集,并将这种解释增强的数据集称为e-SNLI;

  

作者证明了当前自解释模型在为预测生成自然语言解释时,会产生不一致的解释。为此,她提出了一种简单却有效的对抗框架,从而防止产生不一致的自然语言解释。

  

机器之心对该论文的核心内容进行了简要介绍,感兴趣的读者可以阅读原论文。

  

论文地址:

  

解释深度神经网络的重要性

  

研究表明,神经网络成功的关键因素是其具备深度这一能力,即成功的神经网络可以由大量的非线性函数组成。直观地讲,多层非线性函数使网络可以学习原始数据和预测之间各种抽象级别的特征。但是,这些都是以可解释性为代价的。这是因为为大量非线性函数的复杂组成提供人类可理解的解释是一个未能解答的困难问题。

  

因此,在诸如健康诊断、信用额度或刑事司法等对安全至关重要的应用中,人们可能仍然更喜欢采用准确性较低但人类可解释的模型,例如线性回归和决策树。

  

  

在MNIST数据集上训练的4层深度的软决策树可视化图。来源:NicholasFrosst和GeoffreyHinton的2017论文《DistillingaNeuralNetworkIntoaSoftDecisionTree》。

  

对于神经网络决策过程的质疑是有道理的,因为已经有研究表明,看似非常准确的此类系统可以轻松地依靠数据集中的伪相关性(也称为统计偏差或伪影)来提供正确答案。研究表明,在实践中使用这种依赖伪相关性的模型非常危险。

  

黑盒系统中不可信的另一个原因是这些系统自身可能存在着一些主观偏见,例如种族主义、性别歧视或者其他类型的歧视或主观性。

  

此外,大量的对抗攻击表明,这些看似高度准确的神经网络具有脆弱性。神经网络中的对抗性攻击在自然语言处理和语音识别等其他领域也具有相当高的成功率。对抗性攻击揭示的深度神经网络的脆弱性使人们对这些方法的潜在学习决策过程产生了怀疑。

  

因此,为了使神经网络系统赢得广泛的公众信任,并确保这些系统确实是公平的,必须为这些模型的决策给出人类可理解的解释。

  

事后解释(Post-hoc)VS自解释(Self-explanatory)方法

  

越来越多的多样化研究不遗余力地解释深度神经网络,这些方法在很多方面都存在着很大差异。事后解释和自解释时当前最主要的两种神经网络解释方法。

  

事后解释是旨在解释已经训练和固定的目标模型的独立方法。例如LIME(Ribeiro等人于2016年提出)就是一种事后解释方法,它通过在模型预测的邻域上学习可解释的模型(如线性回归)来解释目标模型的预测。如前文所述,这种解释方法针对的是文本token和图像超像素,即所谓的基于特征。

  

  

Shapley解释器和最小充分子集(minimalsufficientsubset)解释器分别提供了至少两种ground-truth基于特征的解释。

  

目前,基于特征的事后解释方法比较流行,也不容易出现解释偏见,但是真实性需要验证。这就引出了第二种方法:自解释。

  

自解释模型是目标模型,这些模型将解释生成模块集成到自身架构中,以便它们为自己的预测提供解释。从较高的层面而言,自解释模型具有两个相互关联的模块:预测器模块,即模型中专门用于预测手头任务的部分;解释生成器模块,作为模型的一部分,它为预测器所做的预测提供解释。此外,自解释模型不是必须对解释做出监督。

  

作者使用一个解释生成器(explanationgenerator)增强了BiLSTM-Max模型。具体而言,作者将特征向量f连接到单层LSTM解码器,既作为一种初始状态,又在每个时间步上级联到词嵌入输入。由此创建了一个新的模型BiLSTM-Max-PredExpl,具体结构如下图5.2所示:

  

  

两种解释方法各有利弊

  

研究人员在实践中需要根据具体情况来选择适当的解释方法。通常而言,自解释模型的预测器和解释生成器是一起训练的,解释生成器的存在会影响预测器的训练。而事后解释方法则不同,它对已训练和固定目标模型做出的所有预测都不会造成影响。因此,当带有额外解释生成器的增强型神经网络的任务性能显著低于仅训练用于执行任务的神经网络时,研究人员可能更倾向于使用事后解释方法的模型。

  

另一方面可能出现如下情况,利用解释生成器增强神经网络并联合训练它们,可能会促使手头任务的性能更好。这可能是由于模型架构中存在额外指导,或者存在对解释的额外监督。

  

举例而言,在情感分析任务中,Lei等人(2016年)获得的结果是,在不对解释进行任何监督的情况下,添加中间解释生成器模块不会削弱性能。又如,在常识问题解答的任务上,Rajani等人(2019年)通过带有监督的自解释模型,实现了比仅训练用于执行任务的神经网络更好的性能。

  

因此,事后解释和自解释这两类方法各有利弊。

  

作者简介

  

  

这篇论文的作者是牛津大学计算机科学博士生Oana-MariaCamburu,她来自罗马尼亚。Oana-MariaCamburu曾获国际数学奥林匹克竞赛(IMO)银牌,目前的主要研究方向是机器学习。此外,她的论文曾被ACL、EMNLP等人工智能顶会收录。

  

以下是这篇博士论文的章节目录:

  

  

  

  

  

下载1:动手学深度学习

  

在机器学习算法与自然语言处理左边公众号右边后台回复“动手学”,

  

即可获取547页《动手学深度学习》电子书和源码。

  

本书同时覆盖深度学习的方法和实践,

  

不仅从数学的角度阐述深度学习的技术和应用,

  

还包含可运行的代码,

  

为读者展示如何在实际中解决问题。

  

在这里插入图片描述

  

下载2:仓库地址共享

  

在机器学习算法与自然语言处理左边公众号右边后台回复“代码”,

  

即可获取195篇NAACL+295篇ACL2019有代码开源的论文。开源地址如下:

  

仓库地址共享:

  

在机器学习算法与自然语言处理左边公众号右边后台回复“代码”,

  

即可获取195篇NAACL+295篇ACL2019有代码开源的论文。

  

开源地址如下:

  

  

重磅!机器学习算法与自然语言处理交流群已正式成立

  

群内有大量资源,欢迎大家进群学习!

  

额外赠送福利资源!邱锡鹏深度学习与神经网络,pytorch官方中文教程,利用Python进行数据分析,机器学习学习笔记,pandas官方文档中文版,effectivejava(中文版)等20项福利资源

  

Alt

  

注意:请大家添加时修改备注为[学校/公司+姓名+方向]

  

例如——哈工大+张三+对话系统。

  

号主,微商请自觉绕道。谢谢!

  

在这里插入图片描述

  

Alt

  

推荐阅读:

  

Longformer:超越RoBERTa,为长文档而生的预训练模型

  

一文直观理解KL散度

  

机器学习必读TOP100论文清单:高引用、分类全、覆盖面广丨GitHub21.4k星

  

在这里插入图片描述

常见问题解答/ Problem solution

「分享重大消息」买全日制本科学历是真的吗(今日/知乎)EY
「分享重大消息」买全日制本科学历是真的吗(今日/知乎)EY【添加微信:】据国家卫健委网站消息,1月30日0-24时,31个(自治区、直辖市)和新疆生产建设兵团报告新增确诊病例58例.其中境外输入病例18例(上海10例,广东7例,福建1例),含3例由无症状感染者转为确诊病例(均在......
公租房能不能落户上海?租了上海的公租房是否影响限购?
最近有同学问了局长一个比较有意思的问题:公租房能不能落户上海,办理户口本?租了公租房会不会影响限购,对打新房积分有没有影响?这个问题初听起来觉得有点无厘头,于是局长问这位同学,为什么会担心租房会影响限购?原来这位同学是看到有自媒体说,打新房时承租的......
海归回国在上海创业可以落户上海吗?
? 海归回国在上海创业可以落户上海吗? 第一条 目标跟依据 为贯彻落实人才强市策略,加大海外人才引进力度,标准留学回国人员申办上海常住户口工作,依据《公安部、人力资源跟社会保障......
近期留学生成功落户【案例】大分享
2021年转眼已经过去四分之一了,不少小伙伴赶在了新社保基数前成功落户,陈老师也给将近期成功落户的案例分享给大家,大家有类似问题的也可以进行参考~学历情况:国内本科+境外意大利艺术回国时间:2020年1月工资和社保基数......
上海办居转户提交材料后多久 才能审核通过
上海办居转户提交材料后多久才能审核通过持有《上海市居住证》人员申办居转户为了深化本市户籍管理改革,完善居住证制度,吸引人才来沪,持有《上海市居住证》满7年、持居住证期间,缴社保累计满7年、依法纳税、符合计划生育政策、无违法或不良记录的境内人员可以申办居转户。问:居住证满7年后,是否还有激励......
非全日制研究生也能获双证吗?
很多考生只知道在职研究生可以获得双证,但不知道通过哪种方式,所以大家会问到一个问题,非全日制研究生也能获双证吗?非全日制研究生的方式毕业之后是双证,考生在毕业之后可以拿到学位证书与学历证书,只是这种方式的考试难度比较大,大家必须要好好准备。从2017年开始,对在职研究生做了新的调整,一些专业纳入到统考中......