7. 专业README中文文档
1. 项目简介
AudioMNIST是一个用于音频分类任务的可解释人工智能(XAI)研究基准,包含高质量语音数据集和预训练模型,支持特征选择和决策过程的可视化分析。
2. 数据集说明
数据内容
- 30,000个数字0-9的语音音频样本
- 60位不同说话者(包含性别、年龄等元信息)
- WAV格式原始音频文件
3. 模型架构
项目提供两种基于CAFFE框架的深度学习模型:
包含训练脚本和预训练权重。
4. 可解释性分析
支持层相关传播(LRP)方法,可分析模型依赖的特征:
# 示例分析代码
from LRP import explain
explanation = explain(model, audio_sample)
visualize(explanation)
5. 使用说明
数据预处理
python preprocessing_data.py --input_dir data/ --output_dir processed/
模型训练
bash models/train_model.sh
6. 引用要求
使用本数据集请引用原始论文:
@article{audiomnist2023,
title = {AudioMNIST: Exploring Explainable Artificial Intelligence...},
journal = {Journal of the Franklin Institute},
year = {2023},
author = {Sören Becker et al.}
}