Multimodal Advanced, Generative, and Intelligent Creation (MMagic [em'mædʒɪk])

OpenMMLab 官网 ^HOT OpenMMLab 开放平台 ^{TRY IT OUT}

English | 简体中文

🚀 最新进展

📄 目录

📖 介绍
🙌 参与贡献
🛠️ 安装
📊 模型库
🤝 致谢
🖊️ 引用
🎫 许可证
🏗️ ️OpenMMLab 的其他项目

📖 介绍

MMagic 是基于 PyTorch 的图像&视频编辑和生成开源工具箱。是 OpenMMLab 项目的成员之一。

目前 MMagic 支持多种图像和视频的生成/编辑任务。

mmagic_introduction.mp4

✨ 主要特性

SOTA 算法

MMagic 提供了处理、编辑、生成图像和视频的 SOTA 算法。
强有力且流行的应用

MMagic 支持了流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用，例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插值，投影，编辑和其他流行的应用。请立即开始你的 AIGC 探索之旅！
高效的框架

通过 OpenMMLab 2.0 框架的 MMEngine 和 MMCV， MMagic 将编辑框架分解为不同的组件，并且可以通过组合不同的模块轻松地构建自定义的编辑器模型。我们可以像搭建“乐高”一样定义训练流程，提供丰富的组件和策略。在 MMagic 中，你可以使用不同的 APIs 完全控制训练流程。得益于 MMSeparateDistributedDataParallel, 动态模型结构的分布式训练可以轻松实现。

✨ 最佳实践

主分支代码的最佳实践基于 Python 3.9+ 和 PyTorch 2.0+ 。

🔝返回目录

🙌 参与贡献

越来越多社区贡献者的加入使我们的算法库日益发展。最近由社区贡献的项目包括：

SDXL 来自 @okotaku.
AnimateDiff 来自 @ElliotQi.
ViCo 来自 @FerryHuang.
DragGan 来自 @qsun1.
FastComposer 来自 @xiaomile.

为使向 MMagic 中添加项目更加容易，我们开启了 Projects 。

感谢您为改善 MMagic 所做的所有贡献。请参阅 MMCV 中的 CONTRIBUTING.md 和 MMEngine 中的 CONTRIBUTING.md 以获取贡献指南。

🔝返回目录

🛠️ 安装

MMagic 依赖 PyTorch，MMEngine 和 MMCV，以下是安装的简要步骤。

步骤 1. 依照官方教程安装 PyTorch 。

步骤 2. 使用 MIM 安装 MMCV，MMEngine 和 MMagic 。

pip3 install openmim
mim install 'mmcv>=2.0.0'
mim install 'mmengine'
mim install 'mmagic'

步骤 3. 验证 MMagic 安装成功。

cd ~
python -c "import mmagic; print(mmagic.__version__)"
# Example output: 1.0.0

开始使用

成功安装 MMagic 后，你可以很容易地上手使用 MMagic！仅需几行代码，你就可以使用 MMagic 完成文本生成图像！

from mmagic.apis import MMagicInferencer
sd_inferencer = MMagicInferencer(model_name='stable_diffusion')
text_prompts = 'A panda is having dinner at KFC'
result_out_dir = 'output/sd_res.png'
sd_inferencer.infer(text=text_prompts, result_out_dir=result_out_dir)

请参考快速运行和推理演示获取 MMagic 的基本用法。

从源码安装 MMagic

使用以下命令从源码安装 MMagic，你可以选择不使用已发布的稳定版本，而在最新开发的版本上进行实验。

git clone https://github.com/open-mmlab/mmagic.git
cd mmagic
pip3 install -e .

更详细的安装指南请参考安装指南。

🔝Back to top

📊 模型库

支持的算法

Conditional GANs	Unconditional GANs	Image Restoration	Image Super-Resolution
SNGAN/Projection GAN (ICLR'2018) SAGAN (ICML'2019) BIGGAN/BIGGAN-DEEP (ICLR'2018)	DCGAN (ICLR'2016) WGAN-GP (NeurIPS'2017) LSGAN (ICCV'2017) GGAN (ArXiv'2017) PGGAN (ICLR'2018) SinGAN (ICCV'2019) StyleGANV1 (CVPR'2019) StyleGANV2 (CVPR'2019) StyleGANV3 (NeurIPS'2021) DragGan (2023)	SwinIR (ICCVW'2021) NAFNet (ECCV'2022) Restormer (CVPR'2022)	SRCNN (TPAMI'2015) SRResNet&SRGAN (CVPR'2016) EDSR (CVPR'2017) ESRGAN (ECCV'2018) RDN (CVPR'2018) DIC (CVPR'2020) TTSR (CVPR'2020) GLEAN (CVPR'2021) LIIF (CVPR'2021) Real-ESRGAN (ICCVW'2021)
Video Super-Resolution	Video Interpolation	Image Colorization	Image Translation
EDVR (CVPR'2018) TOF (IJCV'2019) TDAN (CVPR'2020) BasicVSR (CVPR'2021) IconVSR (CVPR'2021) BasicVSR++ (CVPR'2022) RealBasicVSR (CVPR'2022)	TOFlow (IJCV'2019) CAIN (AAAI'2020) FLAVR (CVPR'2021)	InstColorization (CVPR'2020)	Pix2Pix (CVPR'2017) CycleGAN (ICCV'2017)
Inpainting	Matting	Text-to-Image(Video)	3D-aware Generation
Global&Local (ToG'2017) DeepFillv1 (CVPR'2018) PConv (ECCV'2018) DeepFillv2 (CVPR'2019) AOT-GAN (TVCG'2019) Stable Diffusion Inpainting (CVPR'2022)	DIM (CVPR'2017) IndexNet (ICCV'2019) GCA (AAAI'2020)	GLIDE (NeurIPS'2021) Guided Diffusion (NeurIPS'2021) Disco-Diffusion (2022) Stable-Diffusion (2022) DreamBooth (2022) Textual Inversion (2022) Prompt-to-Prompt (2022) Null-text Inversion (2022) ControlNet (2023) Stable Diffusion XL (2023) AnimateDiff (2023) ViCo (2023) FastComposer (2023) PowerPaint (2023)	EG3D (CVPR'2022)

请参考模型库了解详情。

🔝返回目录

🤝 致谢

MMagic 是一款由不同学校和公司共同贡献的开源项目。我们感谢所有为项目提供算法复现和新功能支持的贡献者，以及提供宝贵反馈的用户。我们希望该工具箱和基准测试可以为社区提供灵活的代码工具，供用户复现现有算法并开发自己的新模型，从而不断为开源社区提供贡献。

🔝返回目录

🖊️ 引用

如果 MMagic 对您的研究有所帮助，请按照如下 bibtex 引用它。

@misc{mmagic2023,
    title = {{MMagic}: {OpenMMLab} Multimodal Advanced, Generative, and Intelligent Creation Toolbox},
    author = {{MMagic Contributors}},
    howpublished = {\url{https://github.com/open-mmlab/mmagic}},
    year = {2023}
}

@misc{mmediting2022,
    title = {{MMEditing}: {OpenMMLab} Image and Video Editing Toolbox},
    author = {{MMEditing Contributors}},
    howpublished = {\url{https://github.com/open-mmlab/mmediting}},
    year = {2022}
}

🔝返回目录

🎫 许可证

本项目开源自 Apache 2.0 license。

🔝返回目录

🏗️ ️OpenMMLab 的其他项目

MMEngine: OpenMMLab MMEngine.
MMCV: OpenMMLab 计算机视觉基础库
MIM: MIM 是 OpenMMlab 项目、算法、模型的统一入口
MMPreTrain: OpenMMLab 预训练工具箱
MMDetection: OpenMMLab 目标检测工具箱
MMDetection3D: OpenMMLab 新一代通用 3D 目标检测平台
MMRotate: OpenMMLab 旋转框检测工具箱与测试基准
MMSegmentation: OpenMMLab 语义分割工具箱
MMOCR: OpenMMLab 全流程文字检测识别理解工具箱
MMPose: OpenMMLab 姿态估计工具箱
MMHuman3D: OpenMMLab 人体参数化模型工具箱与测试基准
MMSelfSup: OpenMMLab 自监督学习工具箱与测试基准
MMRazor: OpenMMLab 模型压缩工具箱与测试基准
MMFewShot: OpenMMLab 少样本学习工具箱与测试基准
MMAction2: OpenMMLab 新一代视频理解工具箱
MMTracking: OpenMMLab 一体化视频目标感知平台
MMFlow: OpenMMLab 光流估计工具箱与测试基准
MMagic: OpenMMLab 新一代人工智能内容生成（AIGC）工具箱
MMDeploy: OpenMMLab 模型部署框架

🔝返回目录

欢迎加入 OpenMMLab 社区

扫描下方的二维码可关注 OpenMMLab 团队的知乎官方账号，扫描下方微信二维码添加喵喵好友，进入 MMagic 微信交流社群。【加好友申请格式：研究方向+地区+学校/公司+姓名】

我们会在 OpenMMLab 社区为大家

📢 分享 AI 框架的前沿核心技术
💻 解读 PyTorch 常用模块源码
📰 发布 OpenMMLab 的相关新闻
🚀 介绍 OpenMMLab 开发的前沿算法
🏃 获取更高效的问题答疑和意见反馈
🔥 提供与各行各业开发者充分交流的平台

干货满满 📘，等你来撩 💗，OpenMMLab 社区期待您的加入 👬

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_zh-CN.md

README_zh-CN.md

🚀 最新进展

最新的 MMagic v1.2.0 版本已经在 [18/12/2023] 发布:

📄 目录

📖 介绍

✨ 主要特性

✨ 最佳实践

🙌 参与贡献

🛠️ 安装

📊 模型库

🤝 致谢

🖊️ 引用

🎫 许可证

🏗️ ️OpenMMLab 的其他项目

欢迎加入 OpenMMLab 社区

Files

README_zh-CN.md

Latest commit

History

README_zh-CN.md

File metadata and controls

🚀 最新进展

最新的 MMagic v1.2.0 版本已经在 [18/12/2023] 发布:

📄 目录

📖 介绍

✨ 主要特性

✨ 最佳实践

🙌 参与贡献

🛠️ 安装

📊 模型库

🤝 致谢

🖊️ 引用

🎫 许可证

🏗️ ️OpenMMLab 的其他项目

欢迎加入 OpenMMLab 社区