这个题目很大,而且不同的BE可能差别比较大。但是我还想听听大家的想法,比如从open64里边借鉴一些东西 1 在中端,有什么好的办法吗?我发现fmodulo-sched的功能并不明显,在ARM上,性能会下降,不知道别的port是什么样子的。这个地方能做些什么吗?或者熟悉modulo-sched的来说说它的大概思路 2 寄存器分配方面有什么可以改进的吗? 3 还有别的什么可能提高性能? p.s. 我们下周要在Linaro@UDS上,讨论一些这样的问题,我需要列出几个topic,上边就是我想的。如果大家还有,就说说。我回来可以在我们的workshop后,给大家说说我们在Linaro@UDS上的一些讨论结果。 -- Yao Qi <qiyaoltc AT gmail DOT com> http://sites.google.com/site/duewayqi/