gpt_big_code: make flash attention impl quantization friendly #5117

Job	Run time
Run tests for optimum.habana.transformers	5m 28s
Run tests for optimum.habana.transformers	5m 28s
Run tests for optimum.habana.diffusers	28m 42s
Run tests for optimum.habana.diffusers	25m 4s
	1h 4m 42s

Provide feedback