We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Have you ever encountered this issue? This is a answer from ChatGPT : 具体问题分析 关键报错位置 错误出现在 swin.py 的 image_lang_att 方法中:
python 复制代码 key = key.reshape(B, self.num_heads, self.key_channels//self.num_heads, n_l) 这行代码试图对 key 张量进行变形。
张量大小计算错误 报错中的形状为 [24, 1, 96, 40],这表示目标张量需要具有 24196*40=92160 个元素。但实际的张量大小为 368640,两者不匹配。
数据流向 报错发生时,key 是由 x(图像特征)、l(语言特征)以及 l_mask(语言掩码)处理后得到的。可能的问题包括:
x 或 l 的形状未按照预期对齐。 num_heads 或 key_channels 的值配置不正确。
The text was updated successfully, but these errors were encountered:
您好,我们已尝试解决该问题。 这就是我们所做的: 调整SpatialImageLanguageAttention类的forward方法中关键张量的重塑,以确保尺寸正确。 您可以查看此提交中的更改: mark-addams001881@ e754548 。 警告 免责声明:解决方案的概念是由人工智能创建的,在检查生成的代码的正确性之前,切勿复制粘贴此代码。解决方案可能并不完整,您应该仅使用此代码作为灵感。 Latta AI 致力于解决开源项目中的问题,作为其支持世界各地开发人员的使命的一部分。了解有关我们使命的更多信息,请访问https://latta.ai/ourmission 。如果您不再希望 Latta AI 尝试解决存储库上的问题,您可以阻止此帐户。
您好,我们已尝试解决该问题。
这就是我们所做的:
调整SpatialImageLanguageAttention类的forward方法中关键张量的重塑,以确保尺寸正确。
您可以查看此提交中的更改: mark-addams001881@ e754548 。
警告
免责声明:解决方案的概念是由人工智能创建的,在检查生成的代码的正确性之前,切勿复制粘贴此代码。解决方案可能并不完整,您应该仅使用此代码作为灵感。
Latta AI 致力于解决开源项目中的问题,作为其支持世界各地开发人员的使命的一部分。了解有关我们使命的更多信息,请访问https://latta.ai/ourmission 。如果您不再希望 Latta AI 尝试解决存储库上的问题,您可以阻止此帐户。
Thank you very much! I'll give it a try now, and I'll get back to you promptly if I encounter any issues!
Sorry, something went wrong.
RuntimeError: shape '[12, 1, 96, 40]' is invalid for input of size 92160 same problem
No branches or pull requests
Have you ever encountered this issue?
This is a answer from ChatGPT :
具体问题分析
关键报错位置
错误出现在 swin.py 的 image_lang_att 方法中:
python
复制代码
key = key.reshape(B, self.num_heads, self.key_channels//self.num_heads, n_l)
这行代码试图对 key 张量进行变形。
张量大小计算错误
报错中的形状为 [24, 1, 96, 40],这表示目标张量需要具有 24196*40=92160 个元素。但实际的张量大小为 368640,两者不匹配。
数据流向
报错发生时,key 是由 x(图像特征)、l(语言特征)以及 l_mask(语言掩码)处理后得到的。可能的问题包括:
x 或 l 的形状未按照预期对齐。
num_heads 或 key_channels 的值配置不正确。
The text was updated successfully, but these errors were encountered: