一个很简单的代码,C66x核,却要3ms。有什么好的办法把时间降下去呢?求各位大佬们给点意见,是已经开了O3,cache的。
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
一个最简单的优化方法,temp=255/temp,尽量不做除法,固定值的话用乘法代替,会有很大的优化成果。
用RCPSP指令求倒数后,再用牛顿差值,可获得最大优化,具体细节参考指令手册 RCPSP指令