Chrome Extension

WeChat Mini Program

Use on ChatGLM

Log in

Academic Profile User Profile

My Following Paper Collections Browse History

From Anecdotal Evidence to Quantitative Evaluation Methods: A Systematic Review on Evaluating Explainable AI

Meike Nauta,Jan Trienes,Shreyasi Pathak,Elisa Nguyen, Michelle Peters, Yasmin Schmitt,Joerg Schloetterer,Maurice Van Keulen,Christin Seifert

arXiv · Artificial Intelligence（2023）

Univ Twente | Univ Duisburg Essen

Cited 100|Views19

Abstract

The rising popularity of explainable artificial intelligence (XAI) to understand high-performing black boxes raised the question of how to evaluate explanations of machine learning (ML) models. While interpretability and explainability are often presented as a subjectively validated binary property, we consider it a multifaceted concept. We identify 12 conceptual properties, such as Compactness and Correctness, that should be evaluated for comprehensively assessing the quality of an explanation. Our so-called Co-12 properties serve as categorization scheme for systematically reviewing the evaluation practices of more than 300 papers published in the past 7 years at major AI and ML conferences that introduce an XAI method. We find that one in three papers evaluate exclusively with anecdotal evidence, and one in five papers evaluate with users. This survey also contributes to the call for objective, quantifiable evaluation methods by presenting an extensive overview of quantitative XAI evaluation methods. Our systematic collection of evaluation methods provides researchers and practitioners with concrete tools to thoroughly validate, benchmark, and compare new and existing XAImethods. The Co-12 categorization scheme and our identified evaluation methods open up opportunities to include quantitative metrics as optimization criteria during model training to optimize for accuracy and interpretability simultaneously.

More

Translated text

Key words

Explainable artificial intelligence,interpretable machine learning,evaluation,explainability,interpretability,quantitative evaluation methods,explainable AI,XAI

Bibtex

AI Read Science

Must-Reading Tree

Example

Generate MRT to find the research sequence of this paper

Related Papers

Reference papers

Cited Papers

Greedy Function Approximation: A Gradient Boosting Machine

Jerome H. Friedman

2001

被引用30602 | 浏览

Too Much, Too Little, or Just Right? Ways Explanations Impact End Users' Mental Models

Todd Kulesza,Simone Stumpf,Margaret M. Burnett,Sherry Yang,Irwin Kwan,Weng-Keen Wong

2013

被引用273 | 浏览

Peeking Inside the Black Box: Visualizing Statistical Learning with Plots of Individual Conditional Expectation

Alex Goldstein,Adam Kapelner,Justin Bleich,Emil Pitkin

2014

被引用974 | 浏览

Explanation in Artificial Intelligence: Insights from the Social Sciences.

2018

被引用5744 | 浏览

Growing Interpretable Part Graphs on ConvNets Via Multi-Shot Learning

Quanshi Zhang,Ruiming Cao,Ying Nian Wu,Song-Chun Zhu

2017

被引用80 | 浏览

Interpretable Convolutional Neural Networks

Quanshi Zhang,Ying Nian Wu,Song-Chun Zhu

2018

被引用976 | 浏览

Interpretation of Neural Networks is Fragile.

Amirata Ghorbani,Abubakar Abid,James Zou

2018

被引用828 | 浏览

Unsupervised Discrete Sentence Representation Learning for Interpretable Neural Dialog Generation

Tiancheng Zhao,Kyusong Lee,Maxine Eskenazi

2018

被引用155 | 浏览

Perturbation-Based Explanations Of Prediction Models

Marko Robnik-Sikonja,Marko Bohanec

2018

被引用111 | 浏览

A Reinforcement Learning Framework for Explainable Recommendation

Xiting Wang,Yiru Chen,Jie Yang,Le Wu,Zhengtao Wu,Xing Xie

2018

被引用184 | 浏览

Improving the Quality of Explanations with Local Embedding Perturbations

Yunzhe Jia,James Bailey,Kotagiri Ramamohanarao,Christopher Leckie,Michael E. Houle

2019

被引用35 | 浏览

Co-Attentive Multi-Task Learning for Explainable Recommendation.

Zhongxia Chen,Xiting Wang,Xing Xie,Tong Wu,Guoqing Bu,Yining Wang,Enhong Chen

2019

被引用155 | 浏览

RecoNet: an Interpretable Neural Architecture for Recommender Systems.

Francesco Fusco,Michalis Vlachos,Vasileios Vasileiadis,Kathrin Wardatzky,Johannes Schneider

2019

被引用21 | 浏览

Make Up Your Mind! Adversarial Generation of Inconsistent Natural Language Explanations

Oana-Maria Camburu,Brendan Shillingford,Pasquale Minervini,Thomas Lukasiewicz,Phil Blunsom

2020

被引用28 | 浏览

Explainability Methods for Graph Convolutional Neural Networks.

Phillip E. Pope,Soheil Kolouri,Mohammad Rostami,Charles E. Martin,Heiko Hoffmann

2019

被引用607 | 浏览

A Multidisciplinary Survey and Framework for Design and Evaluation of Explainable AI Systems

Sina Mohseni,Niloofar Zarei,Eric D. Ragan

2021

被引用336 | 浏览

Taking a HINT: Leveraging Explanations to Make Vision and Language Models More Grounded

Ramprasaath R. Selvaraju,Stefan Lee,Yilin Shen,Hongxia Jin,Shalini Ghosh,Larry Heck,Dhruv Batra,Devi Parikh

2019

被引用236 | 浏览

Adaptive Activation Thresholding: Dynamic Routing Type Behavior for Interpretability in Convolutional Neural Networks

Yiyou Sun,Sathya N. Ravi,Vikas Singh

2019

被引用18 | 浏览

EDiT: Interpreting Ensemble Models Via Compact Soft Decision Trees

Jaemin Yoo,Lee Sael

2019

被引用6 | 浏览

A Model-Agnostic Approach for Explaining the Predictions on Clustered Data.

Zihan Zhou,Mingxuan Sun,Jianhua Chen

2019

被引用5 | 浏览

Embedding Deep Networks into Visual Explanations

Zhongang Qi,Saeed Khorram,Li Fuxin

2020

被引用31 | 浏览

Obtaining Faithful Interpretations from Compositional Neural Networks.

Sanjay Subramanian,Ben Bogin,Nitish Gupta,Tomer Wolfson,Sameer Singh,Jonathan Berant,Matt Gardner

2020

被引用57 | 浏览

Explainable Reasoning over Knowledge Graph Paths for Recommendation

Xiang Wang,Dingxian Wang,Canran Xu,Xiangnan He,Yixin Cao,Tat-Seng Chua

2019

被引用522 | 浏览

DACE: Distribution-Aware Counterfactual Explanation by Mixed-Integer Linear Optimization.

Kentaro Kanamori,Takuya Takagi,Ken Kobayashi,Hiroki Arimura

2020

被引用150 | 浏览

Synthesizing Aspect-Driven Recommendation Explanations from Reviews

Trung-Hoang Le,Hady W. Lauw

2020

被引用18 | 浏览

Towards Explainable Conversational Recommendation.

Zhongxia Chen,Xiting Wang,Xing Xie,Mehul Parsana,Akshay Soni,Xiang Ao,Enhong Chen

2020

被引用77 | 浏览

Xgail: Explainable Generative Adversarial Imitation Learning for Explainable Human Decision Analysis

Menghai Pan,Weixiao Huang,Yanhua Li,Xun Zhou,Jun Luo

2020

被引用37 | 浏览

A Diagnostic Study of Explainability Techniques for Text Classification.

Pepa Atanasova,Jakob Grue Simonsen,Christina Lioma,Isabelle Augenstein

2020

被引用237 | 浏览

A Survey of Contrastive and Counterfactual Explanation Generation Methods for Explainable Artificial Intelligence

Ilia Stepin,Jose M. Alonso,Alejandro Catala,Martin Pereira-Farina

2021

被引用189 | 浏览

"Why Should I Trust You?"

Marco Tulio Ribeiro,Sameer Singh,Carlos Guestrin

2016

被引用6939 | 浏览

Data Disclaimer

The page data are from open Internet sources, cooperative publishers and automatic analysis results through AI technology. We do not make any commitments and guarantees for the validity, accuracy, correctness, reliability, completeness and timeliness of the page data. If you have any questions, please contact us by email: report@aminer.cn

Chat Paper

GPU is busy, summary generation fails

Rerequest