Revision 80ba1ddb libavcodec/arm/dsputil_neon.S

View differences:

libavcodec/arm/dsputil_neon.S
777 777
endfunc
778 778

  
779 779
function ff_vector_fmul_window_neon, export=1
780
VFP     vdup.32         q8,  d0[0]
781
NOVFP   vld1.32         {d16[],d17[]}, [sp,:32]
782 780
        push            {r4,r5,lr}
783
VFP     ldr             lr,  [sp, #12]
784
NOVFP   ldr             lr,  [sp, #16]
781
        ldr             lr,  [sp, #12]
785 782
        sub             r2,  r2,  #8
786 783
        sub             r5,  lr,  #2
787 784
        add             r2,  r2,  r5, lsl #2
......
793 790
        vld1.64         {d4,d5},  [r3,:128]!
794 791
        vld1.64         {d6,d7},  [r4,:128], r5
795 792
1:      subs            lr,  lr,  #4
796
        vmov            q11, q8
797
        vmla.f32        d22, d0,  d4
798
        vmov            q10, q8
799
        vmla.f32        d23, d1,  d5
793
        vmul.f32        d22, d0,  d4
800 794
        vrev64.32       q3,  q3
801
        vmla.f32        d20, d0,  d7
795
        vmul.f32        d23, d1,  d5
802 796
        vrev64.32       q1,  q1
803
        vmla.f32        d21, d1,  d6
797
        vmul.f32        d20, d0,  d7
798
        vmul.f32        d21, d1,  d6
804 799
        beq             2f
805 800
        vmla.f32        d22, d3,  d7
806 801
        vld1.64         {d0,d1},  [r1,:128]!

Also available in: Unified diff