/* { dg-do compile } */
/* { dg-options "-march=rv32gcv -mabi=ilp32 -mpreferred-stack-boundary=3 -O3 -fno-schedule-insns -fno-schedule-insns2" } */
/* { dg-final { check-function-bodies "**" "" } } */

#include "riscv_vector.h"
#include "macro.h"

/*
** spill:
**  csrr\t[a-x0-9]+,vlenb
**  slli\t[a-x0-9]+,[a-x0-9]+,4
**  sub\tsp,[a-x0-9]+,[a-x0-9]+
**  vsetvli\t[a-x0-9]+,zero,e8,mf8,ta,ma
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  srli\t[a-x0-9]+,[a-x0-9]+,3
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,1
**  vsetvli\t[a-x0-9]+,zero,e8,mf4,ta,ma
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  srli\t[a-x0-9]+,[a-x0-9]+,2
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,2
**  vsetvli\t[a-x0-9]+,zero,e8,mf2,ta,ma
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  srli\t[a-x0-9]+,[a-x0-9]+,1
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,3
**  vl1re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vs1r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,4
**  vl2re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  slli\t[a-x0-9]+,[a-x0-9]+,1
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vs2r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,5
**  vl4re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  mv\t[a-x0-9]+,[a-x0-9]+
**  slli\t[a-x0-9]+,[a-x0-9]+,2
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vs4r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,6
**  vl8re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  ...
**  slli\t[a-x0-9]+,[a-x0-9]+,3
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vs8r.v\tv[0-9]+,0\([a-x0-9]+\)
**  ...
**  srli\t[a-x0-9]+,[a-x0-9]+,3
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  ...
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,1
**  srli\t[a-x0-9]+,[a-x0-9]+,2
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  ...
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,2
**  srli\t[a-x0-9]+,[a-x0-9]+,1
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  ...
**  vle8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vse8.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,3
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vl1re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vs1r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,4
**  slli\t[a-x0-9]+,[a-x0-9]+,1
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vl2re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vs2r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,5
**  slli\t[a-x0-9]+,[a-x0-9]+,2
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vl4re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vs4r.v\tv[0-9]+,0\([a-x0-9]+\)
**  addi\t[a-x0-9]+,[a-x0-9]+,6
**  slli\t[a-x0-9]+,[a-x0-9]+,3
**  add\t[a-x0-9]+,[a-x0-9]+,[a-x0-9]+
**  vl8re8.v\tv[0-9]+,0\([a-x0-9]+\)
**  vs8r.v\tv[0-9]+,0\([a-x0-9]+\)
**  csrr\t[a-x0-9]+,vlenb
**  slli\t[a-x0-9]+,[a-x0-9]+,4
**  add\tsp,[a-x0-9]+,[a-x0-9]+
**  ...
**  jr\tra
*/
void
spill (int8_t *in, int8_t *out)
{
  vint8mf8_t v0 = *(vint8mf8_t*)in;
  vint8mf4_t v1 = *(vint8mf4_t*)(in + 1);
  vint8mf2_t v2 = *(vint8mf2_t*)(in + 2);
  vint8m1_t v3 = *(vint8m1_t*)(in + 3);
  vint8m2_t v4 = *(vint8m2_t*)(in + 4);
  vint8m4_t v8 = *(vint8m4_t*)(in + 5);
  vint8m8_t v16 = *(vint8m8_t*)(in + 6);
  exhaust_vector_regs (); 
  *(vint8mf8_t*)out = v0;
  *(vint8mf4_t*)(out + 1) = v1; 
  *(vint8mf2_t*)(out + 2) = v2;
  *(vint8m1_t*)(out + 3) = v3;
  *(vint8m2_t*)(out + 4) = v4;
  *(vint8m4_t*)(out + 5) = v8;
  *(vint8m8_t*)(out + 6) = v16;
}