GitHub - ChongbinZhao/multiple-instance-learning

论文链接： https://arxiv.org/abs/1802.04712

数据集说明：

论文作者用来训练Attention MIL模型用到了两个数据集，分别是MNIST手写数字数据集COLON CANCER数据集，论文作者在他的Github项目没有提供，大家可以从我的网盘这里获取，提取码是6666。
其中COLON CANCER数据集包含处理过和未处理过的样本：
- 原COLON CANCER数据集包含100张500×500像素的slide。
- 按论文的要求处理后，每张500×500像素的slide被切割成若干张27×27的patches（论文要求白像素点超过75%的patch要丢弃），训练模型的时候直接用处理过的样本进行训练即可。
数据集下载后，将两个数据集分别放到对应的文件目录下，在相应的main.py文件里修改一下路径，然后运行即可。

代码说明:

论文作者在Github上只提供了训练MNIST数据集的代码，而没有提供训练COLON CANCER数据集的代码。
论文中对于不同的数据集，网络结构不同、超参数不同以及训练方式不同，所以不能将MNIST数据集的代码直接套用在COLON CANCER数据集上。
于是我根据论文提供的思路以及神经网络的参数，自己重头写了一遍训练COLON CANCER数据集的代码，最后训练出来的指标与论文结果保持一致，所以我的代码应该是没有错的。

原理讲解：

我将自己对论文的理解以及实现过程通过word笔记的方式记录下来了（我都贴在下面了），我的笔记可能讲得不是很清楚，强烈建议先去看几遍原论文。

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
MIL_Histo		MIL_Histo
MIL_MNIST		MIL_MNIST
pictures		pictures
README.md		README.md

Provide feedback