From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <SRS0=PG1v=AR=gmail.com=npickito@sourceware.org>
Received: from mail-vk1-xa33.google.com (mail-vk1-xa33.google.com [IPv6:2607:f8b0:4864:20::a33])
	by sourceware.org (Postfix) with ESMTPS id C20673857725
	for <gcc-patches@gcc.gnu.org>; Wed, 26 Apr 2023 04:23:03 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org C20673857725
Authentication-Results: sourceware.org; dmarc=pass (p=none dis=none) header.from=gmail.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=gmail.com
Received: by mail-vk1-xa33.google.com with SMTP id 71dfb90a1353d-44087536177so4461076e0c.2
        for <gcc-patches@gcc.gnu.org>; Tue, 25 Apr 2023 21:23:03 -0700 (PDT)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=gmail.com; s=20221208; t=1682482983; x=1685074983;
        h=content-transfer-encoding:cc:to:subject:message-id:date:from
         :in-reply-to:references:mime-version:from:to:cc:subject:date
         :message-id:reply-to;
        bh=DXpQGh8P4lRzghTIAAVYhYmSCW8t8osb+3EsXR++VI0=;
        b=gObqgxuUG0guLQCxT0ubK+VNSMROULes1F5eoA9MSbItiEB0SIO1X+SGFlC7FoF/JO
         +7P9pPlyqz86ZqgRQJR2Hnau9VTKUSBTky6tgyfAmsdPyE/H9OgSqBkaFFZIHiukX0a5
         C50ma2zmVZT6XFKb4PqtjovDJBc9IL+I/gNhVXARF1s0pAkq+nLunFOyhq4vbYs+wFa4
         hdEAg8zDgNNFZIf4fbjrBGoGBq74LEKxNLFtMdYwwx5W8AvtnkSMJgHXNsbCSMGDRubJ
         lU0i0qdNsen2QXCTlBRQYcH+F5LtPKSqvnqufM3XXEVZax8Hu3Nh/ZIqMAFb6X5w7w3W
         efuA==
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20221208; t=1682482983; x=1685074983;
        h=content-transfer-encoding:cc:to:subject:message-id:date:from
         :in-reply-to:references:mime-version:x-gm-message-state:from:to:cc
         :subject:date:message-id:reply-to;
        bh=DXpQGh8P4lRzghTIAAVYhYmSCW8t8osb+3EsXR++VI0=;
        b=dvUFKH8N+LkMrK6y3Cbn0AgmXGUDc5sm/hUcpj0VA18qYLFbwjpeJ+fN6ZZ1clPKlP
         XoqVksDPX1gPSEE9zRxc2psQmmlFu3s6MH8JbYUxzwxbNd6Zp8QUL6r57d21ef5nZnLT
         QkqAYcsSiKPhuUd9iZIn5lCuA8ptg9n8JG9Z7nFe1yL+eFt2pjlv4jgqwQhCu8iOuy8c
         Q71/7/9zdCJNGKFAdwUrWzaC++DvyBtGOmLvUnaxA7tvdxlIqbL7ioJrPnT4eR57VLs5
         qZhZsodpNma5BBr+qKg4WRBLMp7XCAmlZjXF1v5rVwCdfifDXvET0arlBs1ADvCw3lom
         dWLA==
X-Gm-Message-State: AAQBX9cGeoAOH+H11ULrCz9RJaZ/3+jIwHgBJejcV5sddVrDve3Wb7P2
	O/Lqk5AL5ysMns+BInWAjzXiLO0XN2mHoCZtccQoKj8LS7jWHA==
X-Google-Smtp-Source: AKy350YXjq29qWQITvfvxdDx0nhNqXOA28Ol+CuE40XHDP7fUSAiPE2LZ3M0i2xfsn7lOQd1uJTIaCe4CEh7hLWh/mw=
X-Received: by 2002:a1f:c1cc:0:b0:440:1b87:f9eb with SMTP id
 r195-20020a1fc1cc000000b004401b87f9ebmr6231260vkf.12.1682482982127; Tue, 25
 Apr 2023 21:23:02 -0700 (PDT)
MIME-Version: 1.0
References: <20230424035341.96537-1-juzhe.zhong@rivai.ai>
In-Reply-To: <20230424035341.96537-1-juzhe.zhong@rivai.ai>
From: Kito Cheng <kito.cheng@gmail.com>
Date: Wed, 26 Apr 2023 12:22:50 +0800
Message-ID: <CA+yXCZDrvUaxp2h8vh0aQ3wT2Cj-4trsKymVo=kNL0QPD_UiSA@mail.gmail.com>
Subject: Re: [PATCH V2] RISC-V: Optimize comparison patterns for register allocation
To: juzhe.zhong@rivai.ai
Cc: gcc-patches@gcc.gnu.org, palmer@dabbelt.com, jeffreyalaw@gmail.com
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
X-Spam-Status: No, score=-8.6 required=5.0 tests=BAYES_00,DKIM_SIGNED,DKIM_VALID,DKIM_VALID_AU,DKIM_VALID_EF,FREEMAIL_FROM,GIT_PATCH_0,KAM_SHORT,RCVD_IN_DNSWL_NONE,SPF_HELO_NONE,SPF_PASS,TXREP,T_SCC_BODY_TEXT_LINE autolearn=ham autolearn_force=no version=3.4.6
X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org
List-Id: <gcc-patches.gcc.gnu.org>

Committed.

On Mon, Apr 24, 2023 at 11:54=E2=80=AFAM <juzhe.zhong@rivai.ai> wrote:
>
> From: Juzhe-Zhong <juzhe.zhong@rivai.ai>
>
> Current RA constraint for RVV comparison instructions totall does not all=
ow
> registers between dest and source operand have any overlaps.
>
> For example:
>   vmseq.vv vd, vs2, vs1
> If LMUL =3D 8, vs2 =3D v8, vs1 =3D v16:
>
> In current GCC RA constraint, GCC does not allow vd to be any regno in v8=
 ~ v23.
> However, it is too conservative and not true according to RVV ISA.
>
> Since the dest EEW of comparison is always EEW =3D 1, so it always follow=
s the overlap
> rules of Dest EEW < Source EEW. So in this case, we should allow GCC RA h=
ave the chance
> to allocate v8 or v16 for vd, so that we can have better vector registers=
 usage in RA.
>
> gcc/ChangeLog:
>
>         * config/riscv/vector.md (*pred_cmp<mode>_merge_tie_mask): New pa=
ttern.
>         (*pred_ltge<mode>_merge_tie_mask): Ditto.
>         (*pred_cmp<mode>_scalar_merge_tie_mask): Ditto.
>         (*pred_eqne<mode>_scalar_merge_tie_mask): Ditto.
>         (*pred_cmp<mode>_extended_scalar_merge_tie_mask): Ditto.
>         (*pred_eqne<mode>_extended_scalar_merge_tie_mask): Ditto.
>         (*pred_cmp<mode>_narrow_merge_tie_mask): Ditto.
>
> gcc/testsuite/ChangeLog:
>
>         * gcc.target/riscv/rvv/base/binop_vv_constraint-4.c: Adapt testca=
se.
>         * gcc.target/riscv/rvv/base/narrow_constraint-17.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-18.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-19.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-20.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-21.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-22.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-23.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-24.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-25.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-26.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-27.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-28.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-29.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-30.c: New test.
>         * gcc.target/riscv/rvv/base/narrow_constraint-31.c: New test.
>
> ---
>  gcc/config/riscv/vector.md                    | 439 ++++++++++++++----
>  .../riscv/rvv/base/binop_vv_constraint-4.c    |   2 +-
>  .../riscv/rvv/base/narrow_constraint-17.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-18.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-19.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-20.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-21.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-22.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-23.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-24.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-25.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-26.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-27.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-28.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-29.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-30.c     | 231 +++++++++
>  .../riscv/rvv/base/narrow_constraint-31.c     | 231 +++++++++
>  17 files changed, 3817 insertions(+), 89 deletions(-)
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-17.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-18.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-19.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-20.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-21.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-22.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-23.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-24.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-25.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-26.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-27.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-28.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-29.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-30.c
>  create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constr=
aint-31.c
>
> diff --git a/gcc/config/riscv/vector.md b/gcc/config/riscv/vector.md
> index 959afac2283..cbfc8913aec 100644
> --- a/gcc/config/riscv/vector.md
> +++ b/gcc/config/riscv/vector.md
> @@ -3647,6 +3647,29 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_cmp<mode>_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"              "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"        "   0")
> +            (match_operand 5 "vector_length_operand"        "  rK")
> +            (match_operand 6 "const_int_operand"            "   i")
> +            (match_operand 7 "const_int_operand"            "   i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "comparison_except_ltge_operator"
> +            [(match_operand:VI 3 "register_operand"         "  vr")
> +             (match_operand:VI 4 "vector_arith_operand"     "vrvi")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.v%o4\t%0,%3,%v4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_cmp<mode>"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr,   vr,   vr")
> @@ -3669,19 +3692,19 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_cmp<mode>_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"              "=3D&vr,  =
 &vr,  &vr,  &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,   vr,   vr,   vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1,vmWc1,vmWc1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK,   rK,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "comparison_except_ltge_operator"
> -            [(match_operand:VI 4 "register_operand"          "   vr,   v=
r,   vr,   vr")
> -             (match_operand:VI 5 "vector_arith_operand"      "   vr,   v=
r,   vi,   vi")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0,   vu,    0")))]
> +            [(match_operand:VI 4 "register_operand"          "   vr,    =
0,   vr,    0,    0,   vr,    0,   vr,   vr")
> +             (match_operand:VI 5 "vector_arith_operand"      " vrvi, vrv=
i,    0,    0, vrvi,    0,    0, vrvi, vrvi")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,   vu,   vu,    0,    0,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.v%o5\t%0,%4,%v5%p1"
>    [(set_attr "type" "vicmp")
> @@ -3704,6 +3727,29 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_ltge<mode>_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"              "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"        "   0")
> +            (match_operand 5 "vector_length_operand"        "  rK")
> +            (match_operand 6 "const_int_operand"            "   i")
> +            (match_operand 7 "const_int_operand"            "   i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "ltge_operator"
> +            [(match_operand:VI 3 "register_operand"         "  vr")
> +             (match_operand:VI 4 "vector_neg_arith_operand" "vrvj")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.v%o4\t%0,%3,%v4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_ltge<mode>"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr,   vr,   vr")
> @@ -3726,19 +3772,19 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_ltge<mode>_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"              "=3D&vr,  =
 &vr,  &vr,  &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,   vr,   vr,   vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1,vmWc1,vmWc1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK,   rK,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "ltge_operator"
> -            [(match_operand:VI 4 "register_operand"          "   vr,   v=
r,   vr,   vr")
> -             (match_operand:VI 5 "vector_neg_arith_operand"  "   vr,   v=
r,   vj,   vj")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0,   vu,    0")))]
> +            [(match_operand:VI 4 "register_operand"          "   vr,    =
0,   vr,    0,    0,   vr,    0,   vr,   vr")
> +             (match_operand:VI 5 "vector_neg_arith_operand"  " vrvj, vrv=
j,    0,    0, vrvj,    0,    0, vrvj, vrvj")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,   vu,   vu,    0,    0,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.v%o5\t%0,%4,%v5%p1"
>    [(set_attr "type" "vicmp")
> @@ -3762,6 +3808,30 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_cmp<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"               "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"          "  0")
> +            (match_operand 5 "vector_length_operand"          " rK")
> +            (match_operand 6 "const_int_operand"              "  i")
> +            (match_operand 7 "const_int_operand"              "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "comparison_except_eqge_operator"
> +            [(match_operand:VI_QHS 3 "register_operand"       " vr")
> +             (vec_duplicate:VI_QHS
> +               (match_operand:<VEL> 4 "register_operand"      "  r"))])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_cmp<mode>_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr")
> @@ -3785,20 +3855,20 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_cmp<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"             "=3Dvm,   v=
r,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"   "    0,vmWc1,v=
mWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"      "   rK,   rK, =
  rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"          "    i,    i, =
   i,    i,    i")
> +            (match_operand 8 "const_int_operand"          "    i,    i, =
   i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "comparison_except_eqge_operator"
> -            [(match_operand:VI_QHS 4 "register_operand"      "   vr,   v=
r")
> +            [(match_operand:VI_QHS 4 "register_operand"   "   vr,    0, =
   0,   vr,   vr")
>               (vec_duplicate:VI_QHS
> -               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r"))])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"  "    r,    r, =
   r,    r,    r"))])
> +         (match_operand:<VM> 2 "vector_merge_operand"     "   vu,   vu, =
   0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
> @@ -3822,6 +3892,30 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_eqne<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"           "  0")
> +            (match_operand 5 "vector_length_operand"           " rK")
> +            (match_operand 6 "const_int_operand"               "  i")
> +            (match_operand 7 "const_int_operand"               "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "equality_operator"
> +            [(vec_duplicate:VI_QHS
> +               (match_operand:<VEL> 4 "register_operand"       "  r"))
> +             (match_operand:VI_QHS 3 "register_operand"        " vr")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_eqne<mode>_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr")
> @@ -3845,20 +3939,20 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_eqne<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "equality_operator"
>              [(vec_duplicate:VI_QHS
> -               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r"))
> -             (match_operand:VI_QHS 4 "register_operand"      "   vr,   v=
r")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r,    r,    r,    r"))
> +             (match_operand:VI_QHS 4 "register_operand"      "   vr,    =
0,    0,   vr,   vr")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
> @@ -3939,6 +4033,54 @@
>      DONE;
>  })
>
> +(define_insn "*pred_cmp<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"           "  0")
> +            (match_operand 5 "vector_length_operand"           " rK")
> +            (match_operand 6 "const_int_operand"               "  i")
> +            (match_operand 7 "const_int_operand"               "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "comparison_except_eqge_operator"
> +            [(match_operand:VI_D 3 "register_operand"          " vr")
> +             (vec_duplicate:VI_D
> +               (match_operand:<VEL> 4 "register_operand"       "  r"))])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
> +(define_insn "*pred_eqne<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"           "  0")
> +            (match_operand 5 "vector_length_operand"           " rK")
> +            (match_operand 6 "const_int_operand"               "  i")
> +            (match_operand 7 "const_int_operand"               "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "equality_operator"
> +            [(vec_duplicate:VI_D
> +               (match_operand:<VEL> 4 "register_operand"       "  r"))
> +             (match_operand:VI_D 3 "register_operand"          " vr")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_cmp<mode>_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr")
> @@ -3962,20 +4104,20 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_cmp<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"             "=3Dvm,   v=
r,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"   "    0,vmWc1,v=
mWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"      "   rK,   rK, =
  rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"          "    i,    i, =
   i,    i,    i")
> +            (match_operand 8 "const_int_operand"          "    i,    i, =
   i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "comparison_except_eqge_operator"
> -            [(match_operand:VI_D 4 "register_operand"        "   vr,   v=
r")
> +            [(match_operand:VI_D 4 "register_operand"     "   vr,    0, =
   0,   vr,   vr")
>               (vec_duplicate:VI_D
> -               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r"))])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"  "    r,    r, =
   r,    r,    r"))])
> +         (match_operand:<VM> 2 "vector_merge_operand"     "   vu,   vu, =
   0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
> @@ -4004,25 +4146,50 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_eqne<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "equality_operator"
>              [(vec_duplicate:VI_D
> -               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r"))
> -             (match_operand:VI_D 4 "register_operand"        "   vr,   v=
r")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"     "    r,    =
r,    r,    r,    r"))
> +             (match_operand:VI_D 4 "register_operand"        "   vr,    =
0,    0,   vr,   vr")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
>     (set_attr "mode" "<MODE>")])
>
> +(define_insn "*pred_cmp<mode>_extended_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"               "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"          "  0")
> +            (match_operand 5 "vector_length_operand"          " rK")
> +            (match_operand 6 "const_int_operand"              "  i")
> +            (match_operand 7 "const_int_operand"              "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "comparison_except_eqge_operator"
> +            [(match_operand:VI_D 3 "register_operand"         " vr")
> +             (vec_duplicate:VI_D
> +               (sign_extend:<VEL>
> +                 (match_operand:<VSUBEL> 4 "register_operand" "  r")))])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_cmp<mode>_extended_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                 "=3Dvr,=
   vr")
> @@ -4046,26 +4213,51 @@
>     (set_attr "mode" "<MODE>")])
>
>  (define_insn "*pred_cmp<mode>_extended_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"                "=3D&vr,=
  &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                 "=3Dvm,=
   vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"       "vmWc1,vmW=
c1")
> -            (match_operand 6 "vector_length_operand"          "   rK,   =
rK")
> -            (match_operand 7 "const_int_operand"              "    i,   =
 i")
> -            (match_operand 8 "const_int_operand"              "    i,   =
 i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"       "    0,vmW=
c1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"          "   rK,   =
rK,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"              "    i,   =
 i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"              "    i,   =
 i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "comparison_except_eqge_operator"
> -            [(match_operand:VI_D 4 "register_operand"         "   vr,   =
vr")
> +            [(match_operand:VI_D 4 "register_operand"         "   vr,   =
 0,    0,   vr,   vr")
>               (vec_duplicate:VI_D
>                 (sign_extend:<VEL>
> -                 (match_operand:<VSUBEL> 5 "register_operand" "    r,   =
 r")))])
> -         (match_operand:<VM> 2 "vector_merge_operand"         "   vu,   =
 0")))]
> +                 (match_operand:<VSUBEL> 5 "register_operand" "    r,   =
 r,    r,    r,    r")))])
> +         (match_operand:<VM> 2 "vector_merge_operand"         "   vu,   =
vu,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
>     (set_attr "mode" "<MODE>")])
>
> +(define_insn "*pred_eqne<mode>_extended_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"                 "=3Dvm"=
)
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"            "  0")
> +            (match_operand 5 "vector_length_operand"            " rK")
> +            (match_operand 6 "const_int_operand"                "  i")
> +            (match_operand 7 "const_int_operand"                "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "equality_operator"
> +            [(vec_duplicate:VI_D
> +               (sign_extend:<VEL>
> +                 (match_operand:<VSUBEL> 4 "register_operand"   "  r")))
> +             (match_operand:VI_D 3 "register_operand"           " vr")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vms%B2.vx\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vicmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_eqne<mode>_extended_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                 "=3Dvr,=
   vr")
> @@ -4089,21 +4281,21 @@
>     (set_attr "mode" "<MODE>")])
>
>  (define_insn "*pred_eqne<mode>_extended_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"                "=3D&vr,=
  &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"       "vmWc1,vmW=
c1")
> -            (match_operand 6 "vector_length_operand"          "   rK,   =
rK")
> -            (match_operand 7 "const_int_operand"              "    i,   =
 i")
> -            (match_operand 8 "const_int_operand"              "    i,   =
 i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"       "    0,vmW=
c1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"          "   rK,   =
rK,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"              "    i,   =
 i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"              "    i,   =
 i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "equality_operator"
>              [(vec_duplicate:VI_D
>                 (sign_extend:<VEL>
> -                 (match_operand:<VSUBEL> 5 "register_operand" "    r,   =
 r")))
> -             (match_operand:VI_D 4 "register_operand"         "   vr,   =
vr")])
> -         (match_operand:<VM> 2 "vector_merge_operand"         "   vu,   =
 0")))]
> +                 (match_operand:<VSUBEL> 5 "register_operand" "    r,   =
 r,    r,    r,    r")))
> +             (match_operand:VI_D 4 "register_operand"         "   vr,   =
 0,    0,   vr,   vr")])
> +         (match_operand:<VM> 2 "vector_merge_operand"         "   vu,   =
vu,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vms%B3.vx\t%0,%4,%5%p1"
>    [(set_attr "type" "vicmp")
> @@ -6346,21 +6538,44 @@
>    [(set_attr "type" "vfcmp")
>     (set_attr "mode" "<MODE>")])
>
> +(define_insn "*pred_cmp<mode>_narrow_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"               "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"          "  0")
> +            (match_operand 5 "vector_length_operand"          " rK")
> +            (match_operand 6 "const_int_operand"              "  i")
> +            (match_operand 7 "const_int_operand"              "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "signed_order_operator"
> +            [(match_operand:VF 3 "register_operand"           " vr")
> +             (match_operand:VF 4 "register_operand"           " vr")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vmf%B2.vv\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vfcmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_cmp<mode>_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,   vr,   vr,   vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK,   rK,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i,    i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "signed_order_operator"
> -            [(match_operand:VF 4 "register_operand"          "   vr,   v=
r")
> -             (match_operand:VF 5 "register_operand"          "   vr,   v=
r")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +            [(match_operand:VF 4 "register_operand"          "   vr,    =
0,   vr,    0,    0,   vr,    0,   vr,   vr")
> +             (match_operand:VF 5 "register_operand"          "   vr,   v=
r,    0,    0,   vr,    0,    0,   vr,   vr")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,   vu,   vu,    0,    0,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vmf%B3.vv\t%0,%4,%5%p1"
>    [(set_attr "type" "vfcmp")
> @@ -6384,6 +6599,30 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_cmp<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"              "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"         "  0")
> +            (match_operand 5 "vector_length_operand"         " rK")
> +            (match_operand 6 "const_int_operand"             "  i")
> +            (match_operand 7 "const_int_operand"             "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "signed_order_operator"
> +            [(match_operand:VF 3 "register_operand"          " vr")
> +             (vec_duplicate:VF
> +               (match_operand:<VEL> 4 "register_operand"     "  f"))])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vmf%B2.vf\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vfcmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_cmp<mode>_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr")
> @@ -6407,20 +6646,20 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_cmp<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "signed_order_operator"
> -            [(match_operand:VF 4 "register_operand"          "   vr,   v=
r")
> +            [(match_operand:VF 4 "register_operand"          "   vr,    =
0,    0,   vr,   vr")
>               (vec_duplicate:VF
> -               (match_operand:<VEL> 5 "register_operand"     "    f,    =
f"))])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"     "    f,    =
f,    f,    f,    f"))])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vmf%B3.vf\t%0,%4,%5%p1"
>    [(set_attr "type" "vfcmp")
> @@ -6444,6 +6683,30 @@
>    "TARGET_VECTOR"
>    {})
>
> +(define_insn "*pred_eqne<mode>_scalar_merge_tie_mask"
> +  [(set (match_operand:<VM> 0 "register_operand"              "=3Dvm")
> +       (if_then_else:<VM>
> +         (unspec:<VM>
> +           [(match_operand:<VM> 1 "register_operand"         "  0")
> +            (match_operand 5 "vector_length_operand"         " rK")
> +            (match_operand 6 "const_int_operand"             "  i")
> +            (match_operand 7 "const_int_operand"             "  i")
> +            (reg:SI VL_REGNUM)
> +            (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
> +         (match_operator:<VM> 2 "equality_operator"
> +            [(vec_duplicate:VF
> +               (match_operand:<VEL> 4 "register_operand"     "  f"))
> +             (match_operand:VF 3 "register_operand"          " vr")])
> +         (match_dup 1)))]
> +  "TARGET_VECTOR"
> +  "vmf%B2.vf\t%0,%3,%4,v0.t"
> +  [(set_attr "type" "vfcmp")
> +   (set_attr "mode" "<MODE>")
> +   (set_attr "merge_op_idx" "1")
> +   (set_attr "vl_op_idx" "5")
> +   (set (attr "ma") (symbol_ref "riscv_vector::get_ma(operands[6])"))
> +   (set (attr "avl_type") (symbol_ref "INTVAL (operands[7])"))])
> +
>  ;; We don't use early-clobber for LMUL <=3D 1 to get better codegen.
>  (define_insn "*pred_eqne<mode>_scalar"
>    [(set (match_operand:<VM> 0 "register_operand"                "=3Dvr, =
  vr")
> @@ -6467,20 +6730,20 @@
>
>  ;; We use early-clobber for source LMUL > dest LMUL.
>  (define_insn "*pred_eqne<mode>_scalar_narrow"
> -  [(set (match_operand:<VM> 0 "register_operand"               "=3D&vr, =
 &vr")
> +  [(set (match_operand:<VM> 0 "register_operand"                "=3Dvm, =
  vr,   vr,  &vr,  &vr")
>         (if_then_else:<VM>
>           (unspec:<VM>
> -           [(match_operand:<VM> 1 "vector_mask_operand"      "vmWc1,vmWc=
1")
> -            (match_operand 6 "vector_length_operand"         "   rK,   r=
K")
> -            (match_operand 7 "const_int_operand"             "    i,    =
i")
> -            (match_operand 8 "const_int_operand"             "    i,    =
i")
> +           [(match_operand:<VM> 1 "vector_mask_operand"      "    0,vmWc=
1,vmWc1,vmWc1,vmWc1")
> +            (match_operand 6 "vector_length_operand"         "   rK,   r=
K,   rK,   rK,   rK")
> +            (match_operand 7 "const_int_operand"             "    i,    =
i,    i,    i,    i")
> +            (match_operand 8 "const_int_operand"             "    i,    =
i,    i,    i,    i")
>              (reg:SI VL_REGNUM)
>              (reg:SI VTYPE_REGNUM)] UNSPEC_VPREDICATE)
>           (match_operator:<VM> 3 "equality_operator"
>              [(vec_duplicate:VF
> -               (match_operand:<VEL> 5 "register_operand"     "    f,    =
f"))
> -             (match_operand:VF 4 "register_operand"          "   vr,   v=
r")])
> -         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,    =
0")))]
> +               (match_operand:<VEL> 5 "register_operand"     "    f,    =
f,    f,    f,    f"))
> +             (match_operand:VF 4 "register_operand"          "   vr,    =
0,    0,   vr,   vr")])
> +         (match_operand:<VM> 2 "vector_merge_operand"        "   vu,   v=
u,    0,   vu,    0")))]
>    "TARGET_VECTOR && known_gt (GET_MODE_SIZE (<MODE>mode), BYTES_PER_RISC=
V_VECTOR)"
>    "vmf%B3.vf\t%0,%4,%5%p1"
>    [(set_attr "type" "vfcmp")
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/binop_vv_constraint-=
4.c b/gcc/testsuite/gcc.target/riscv/rvv/base/binop_vv_constraint-4.c
> index 552c264d895..e16db932f15 100644
> --- a/gcc/testsuite/gcc.target/riscv/rvv/base/binop_vv_constraint-4.c
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/binop_vv_constraint-4.c
> @@ -24,4 +24,4 @@ void f2 (void * in, void *out, int32_t x)
>      __riscv_vsm_v_b32 (out, m4, 4);
>  }
>
> -/* { dg-final { scan-assembler-times {vmv} 2 } } */
> +/* { dg-final { scan-assembler-not {vmv} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-17=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-17.c
> new file mode 100644
> index 00000000000..97df21dd743
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-17.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_mu(m1,m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_m(m1,v1,v1,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vv_u16m8_b2_mu(m1,m2,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vv_i32m8_b4_mu (m3, m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vv_i32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vv_i32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmseq_vv_i32m8_b4_mu (m3, m4, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vv_i32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vv_i32m8_b4_mu (m3, m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vv_i32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vv_i32m8_b4_m (m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vv_i32m8_b4 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vv_i32m8_b4_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmseq_vv_i32m8_b4_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vv_i32m1_b32 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vv_i32m1_b32_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmseq_vv_i32m1_b32_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-18=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-18.c
> new file mode 100644
> index 00000000000..56c95d9c884
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-18.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_mu(m1,m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_m(m1,v1,v1,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vuint16m8_t v2 =3D __riscv_vle16_v_u16m8 (base2, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vv_u16m8_b2_mu(m1,m2,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vv_i32m8_b4_mu (m3, m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vv_i32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vv_i32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vv_i32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmslt_vv_i32m8_b4_mu (m3, m4, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vv_i32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vv_i32m8_b4_mu (m3, m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vv_i32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vv_i32m8_b4_m (m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vv_i32m8_b4 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vv_i32m8_b4_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmslt_vv_i32m8_b4_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vv_i32m1_b32 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vv_i32m1_b32_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmslt_vv_i32m1_b32_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-19=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-19.c
> new file mode 100644
> index 00000000000..d50e497d6c9
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-19.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i32m8_b4 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i32m8_b4_m (mask, v3, x,32);
> +    mask =3D __riscv_vmseq_vx_i32m8_b4_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i32m1_b32 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i32m1_b32_m (mask, v3, x,32);
> +    mask =3D __riscv_vmseq_vx_i32m1_b32_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-20=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-20.c
> new file mode 100644
> index 00000000000..4e77c51d058
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-20.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i32m8_b4 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i32m8_b4_m (mask, v3, x,32);
> +    mask =3D __riscv_vmslt_vx_i32m8_b4_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i32m1_b32 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i32m1_b32_m (mask, v3, x,32);
> +    mask =3D __riscv_vmslt_vx_i32m1_b32_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-21=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-21.c
> new file mode 100644
> index 00000000000..4f7efd508b1
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-21.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_mu(m1,m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_m(m1,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmseq_vx_u16m8_b2_mu(m1,m2,v1, -16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m3, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m4, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_mu (m3, m3, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +    vbool4_t m4 =3D __riscv_vmseq_vx_i32m8_b4_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i32m8_b4 (v, -16, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i32m8_b4_m (mask, v3, -16,32);
> +    mask =3D __riscv_vmseq_vx_i32m8_b4_mu (mask, mask, v4, -16, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i32m1_b32 (v, -16, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i32m1_b32_m (mask, v3, -16,32);
> +    mask =3D __riscv_vmseq_vx_i32m1_b32_mu (mask, mask, v4, -16, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-22=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-22.c
> new file mode 100644
> index 00000000000..92084be99b2
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-22.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_mu(m1,m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_m(m1,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint16m8_t v1 =3D __riscv_vle16_v_u16m8 (base1, vl);
> +    vbool2_t m1 =3D __riscv_vlm_v_b2 (base3, vl);
> +    vbool2_t m2 =3D __riscv_vlm_v_b2 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool2_t v =3D __riscv_vmsltu_vx_u16m8_b2_mu(m1,m2,v1, -15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b2 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m3, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m4, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_mu (m3, m3, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vint32m8_t v =3D __riscv_vle32_v_i32m8 (in, 4);
> +    vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +    vbool4_t m4 =3D __riscv_vmslt_vx_i32m8_b4_m (m3, v2, -15,4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vint32m8_t v =3D __riscv_vle32_v_i32m8 (base1, 4);
> +  vint32m8_t v2 =3D __riscv_vle32_v_i32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i32m8_b4 (v, -15,4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m8_t v3 =3D __riscv_vle32_v_i32m8 (base1 + i, 4);
> +    vint32m8_t v4 =3D __riscv_vle32_v_i32m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i32m8_b4_m (mask, v3, -15,32);
> +    mask =3D __riscv_vmslt_vx_i32m8_b4_mu (mask, mask, v4, -15,32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vint32m1_t v =3D __riscv_vle32_v_i32m1 (base1, 4);
> +  vint32m1_t v2 =3D __riscv_vle32_v_i32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i32m1_b32 (v, -15,4);
> +  for (int i =3D 0; i < n; i++){
> +    vint32m1_t v3 =3D __riscv_vle32_v_i32m1 (base1 + i, 4);
> +    vint32m1_t v4 =3D __riscv_vle32_v_i32m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i32m1_b32_m (mask, v3, -15,32);
> +    mask =3D __riscv_vmslt_vx_i32m1_b32_mu (mask, mask, v4, -15,32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-23=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-23.c
> new file mode 100644
> index 00000000000..f9817caca1e
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-23.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv64gcv -mabi=3Dlp64d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m8_b8 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_m (mask, v3, x,32);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m1_b64 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_m (mask, v3, x,32);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-24=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-24.c
> new file mode 100644
> index 00000000000..62d1f6dddd5
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-24.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv64gcv -mabi=3Dlp64d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, uint16_t x)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m8_b8 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_m (mask, v3, x,32);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, int32_t x)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m1_b64 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_m (mask, v3, x,32);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-25=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-25.c
> new file mode 100644
> index 00000000000..250c3fdb89a
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-25.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv64gcv -mabi=3Dlp64d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m2,v1,-16,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m4, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, -16, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m8_b8 (v, -16, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_m (mask, v3, -16,32);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_mu (mask, mask, v4, -16, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m1_b64 (v, -16, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_m (mask, v3, -16,32);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_mu (mask, mask, v4, -16, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-26=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-26.c
> new file mode 100644
> index 00000000000..72e2d210c05
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-26.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv64gcv -mabi=3Dlp64d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m2,v1,-15,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m4, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, -15, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m8_b8 (v, -15, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_m (mask, v3, -15,32);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_mu (mask, mask, v4, -15, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m1_b64 (v, -15, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_m (mask, v3, -15,32);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_mu (mask, mask, v4, -15, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-27=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-27.c
> new file mode 100644
> index 00000000000..0842700475c
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-27.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmseq_vx_u64m8_b8_mu(m1,m2,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m4, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_mu (m3, m3, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmseq_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m8_b8 (v, 0xAAAA, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_m (mask, v3, 0xAAAA,32);
> +    mask =3D __riscv_vmseq_vx_i64m8_b8_mu (mask, mask, v4, 0xAAAA, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmseq_vx_i64m1_b64 (v, 0xAAAA, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_m (mask, v3, 0xAAAA,32);
> +    mask =3D __riscv_vmseq_vx_i64m1_b64_mu (mask, mask, v4, 0xAAAA, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-28=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-28.c
> new file mode 100644
> index 00000000000..9c1eddfac7e
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-28.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_m(m1,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl)
> +{
> +    vuint64m8_t v1 =3D __riscv_vle64_v_u64m8 (base1, vl);
> +    vbool8_t m1 =3D __riscv_vlm_v_b8 (base3, vl);
> +    vbool8_t m2 =3D __riscv_vlm_v_b8 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool8_t v =3D __riscv_vmsltu_vx_u64m8_b8_mu(m1,m2,v1,0xAAAA,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b8 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +    vbool8_t m5 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m4, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_mu (m3, m3, v2, 0xAAAA, 4)=
;
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out)
> +{
> +    vbool8_t mask =3D *(vbool8_t*)in;
> +    asm volatile ("":::"memory");
> +    vint64m8_t v =3D __riscv_vle64_v_i64m8 (in, 4);
> +    vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, in, 4);
> +    vbool8_t m3 =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +    vbool8_t m4 =3D __riscv_vmslt_vx_i64m8_b8_m (m3, v2, 0xAAAA, 4);
> +    __riscv_vsm_v_b8 (out, m3, 4);
> +    __riscv_vsm_v_b8 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool8_t mask =3D *(vbool8_t*)base1;
> +  vint64m8_t v =3D __riscv_vle64_v_i64m8 (base1, 4);
> +  vint64m8_t v2 =3D __riscv_vle64_v_i64m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m8_b8 (v, 0xAAAA, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m8_t v3 =3D __riscv_vle64_v_i64m8 (base1 + i, 4);
> +    vint64m8_t v4 =3D __riscv_vle64_v_i64m8_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_m (mask, v3, 0xAAAA,32);
> +    mask =3D __riscv_vmslt_vx_i64m8_b8_mu (mask, mask, v4, 0xAAAA, 32);
> +  }
> +  __riscv_vsm_v_b8 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool64_t mask =3D *(vbool64_t*)base1;
> +  vint64m1_t v =3D __riscv_vle64_v_i64m1 (base1, 4);
> +  vint64m1_t v2 =3D __riscv_vle64_v_i64m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmslt_vx_i64m1_b64 (v, 0xAAAA, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vint64m1_t v3 =3D __riscv_vle64_v_i64m1 (base1 + i, 4);
> +    vint64m1_t v4 =3D __riscv_vle64_v_i64m1_m (mask, base1 + i * 2, 4);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_m (mask, v3, 0xAAAA,32);
> +    mask =3D __riscv_vmslt_vx_i64m1_b64_mu (mask, mask, v4, 0xAAAA, 32);
> +  }
> +  __riscv_vsm_v_b64 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-29=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-29.c
> new file mode 100644
> index 00000000000..6988c24bd92
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-29.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_mu(m1,m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_m(m1,v1,v1,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_m(m1,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, size_t shift)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8 (base2, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    vbool4_t m2 =3D __riscv_vlm_v_b4 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vv_f32m8_b4_mu(m1,m2,v1,v2,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vv_f32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vv_f32m8_b4_mu (m3, m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vv_f32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vv_f32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vv_f32m8_b4 (v, v, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vv_f32m8_b4_m (m3, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmfeq_vv_f32m8_b4_mu (m3, m4, v2, v2, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vv_f32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vv_f32m8_b4_mu (m3, m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, int32_t x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vv_f32m8_b4 (v, v2, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vv_f32m8_b4_m (m3, v2, v, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (base1, 4);
> +  vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmfeq_vv_f32m8_b4 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m8_t v3 =3D __riscv_vle32_v_f32m8 (base1 + i, 4);
> +    vfloat32m8_t v4 =3D __riscv_vle32_v_f32m8_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmfeq_vv_f32m8_b4_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmfeq_vv_f32m8_b4_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vfloat32m1_t v =3D __riscv_vle32_v_f32m1 (base1, 4);
> +  vfloat32m1_t v2 =3D __riscv_vle32_v_f32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmfeq_vv_f32m1_b32 (v, v2, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m1_t v3 =3D __riscv_vle32_v_f32m1 (base1 + i, 4);
> +    vfloat32m1_t v4 =3D __riscv_vle32_v_f32m1_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmfeq_vv_f32m1_b32_m (mask, v3, v4,32);
> +    mask =3D __riscv_vmfeq_vv_f32m1_b32_mu (mask, mask, v4, v4, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-30=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-30.c
> new file mode 100644
> index 00000000000..fe181de4d56
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-30.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    vbool4_t m2 =3D __riscv_vlm_v_b4 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmfeq_vf_f32m8_b4_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vf_f32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmfeq_vf_f32m8_b4_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vf_f32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmfeq_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, float x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (base1, 4);
> +  vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmfeq_vf_f32m8_b4 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m8_t v3 =3D __riscv_vle32_v_f32m8 (base1 + i, 4);
> +    vfloat32m8_t v4 =3D __riscv_vle32_v_f32m8_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmfeq_vf_f32m8_b4_m (mask, v3, x,32);
> +    mask =3D __riscv_vmfeq_vf_f32m8_b4_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, float x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vfloat32m1_t v =3D __riscv_vle32_v_f32m1 (base1, 4);
> +  vfloat32m1_t v2 =3D __riscv_vle32_v_f32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmfeq_vf_f32m1_b32 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m1_t v3 =3D __riscv_vle32_v_f32m1 (base1 + i, 4);
> +    vfloat32m1_t v4 =3D __riscv_vle32_v_f32m1_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmfeq_vf_f32m1_b32_m (mask, v3, x,32);
> +    mask =3D __riscv_vmfeq_vf_f32m1_b32_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> diff --git a/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-31=
.c b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-31.c
> new file mode 100644
> index 00000000000..ae5b4ed6913
> --- /dev/null
> +++ b/gcc/testsuite/gcc.target/riscv/rvv/base/narrow_constraint-31.c
> @@ -0,0 +1,231 @@
> +/* { dg-do compile } */
> +/* { dg-options "-march=3Drv32gcv -mabi=3Dilp32d -O3" } */
> +
> +#include "riscv_vector.h"
> +
> +void f0 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f1 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_mu(m1,m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f2 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f3 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f4 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", "v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v17",
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f5 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v27", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_m(m1,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f6 (void *base1,void *base2,void *base3,void *base4,void *out,size_=
t vl, float x)
> +{
> +    vfloat32m8_t v1 =3D __riscv_vle32_v_f32m8 (base1, vl);
> +    vbool4_t m1 =3D __riscv_vlm_v_b4 (base3, vl);
> +    vbool4_t m2 =3D __riscv_vlm_v_b4 (base4, vl);
> +    asm volatile("#" ::
> +                : "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23","v24","v25",
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    vbool4_t v =3D __riscv_vmflt_vf_f32m8_b4_mu(m1,m2,v1,x,vl);
> +    asm volatile("#" ::
> +                : "v0", "v1", "v2", "v3", "v4", "v5", "v6", "v7", "v8", =
"v9",
> +                  "v10", "v11", "v12", "v13", "v14", "v15", "v16", "v17"=
,
> +                  "v18", "v19", "v20", "v21", "v22", "v23", "v24", "v25"=
,
> +                  "v26", "v28", "v29", "v30", "v31");
> +
> +    __riscv_vsm_v_b4 (out,v,vl);
> +}
> +
> +void f7 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmflt_vf_f32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f8 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmflt_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f9 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmflt_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +    vbool4_t m5 =3D __riscv_vmflt_vf_f32m8_b4_mu (m3, m4, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m5, 4);
> +}
> +
> +void f10 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmflt_vf_f32m8_b4_mu (m3, m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f11 (void * in, void *out, float x)
> +{
> +    vbool4_t mask =3D *(vbool4_t*)in;
> +    asm volatile ("":::"memory");
> +    vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (in, 4);
> +    vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, in, 4);
> +    vbool4_t m3 =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +    vbool4_t m4 =3D __riscv_vmflt_vf_f32m8_b4_m (m3, v2, x, 4);
> +    __riscv_vsm_v_b4 (out, m3, 4);
> +    __riscv_vsm_v_b4 (out, m4, 4);
> +}
> +
> +void f12 (void* base1,void* base2,void* out,int n, float x)
> +{
> +  vbool4_t mask =3D *(vbool4_t*)base1;
> +  vfloat32m8_t v =3D __riscv_vle32_v_f32m8 (base1, 4);
> +  vfloat32m8_t v2 =3D __riscv_vle32_v_f32m8_m (mask, base1, 4);
> +  mask =3D __riscv_vmflt_vf_f32m8_b4 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m8_t v3 =3D __riscv_vle32_v_f32m8 (base1 + i, 4);
> +    vfloat32m8_t v4 =3D __riscv_vle32_v_f32m8_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmflt_vf_f32m8_b4_m (mask, v3, x,32);
> +    mask =3D __riscv_vmflt_vf_f32m8_b4_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b4 (out, mask, 32);
> +}
> +
> +void f13 (void* base1,void* base2,void* out,int n, float x)
> +{
> +  vbool32_t mask =3D *(vbool32_t*)base1;
> +  vfloat32m1_t v =3D __riscv_vle32_v_f32m1 (base1, 4);
> +  vfloat32m1_t v2 =3D __riscv_vle32_v_f32m1_m (mask, base1, 4);
> +  mask =3D __riscv_vmflt_vf_f32m1_b32 (v, x, 4);
> +  for (int i =3D 0; i < n; i++){
> +    vfloat32m1_t v3 =3D __riscv_vle32_v_f32m1 (base1 + i, 4);
> +    vfloat32m1_t v4 =3D __riscv_vle32_v_f32m1_m (mask, base1 + i * 2, 4)=
;
> +    mask =3D __riscv_vmflt_vf_f32m1_b32_m (mask, v3, x,32);
> +    mask =3D __riscv_vmflt_vf_f32m1_b32_mu (mask, mask, v4, x, 32);
> +  }
> +  __riscv_vsm_v_b32 (out, mask, 32);
> +}
> +
> +/* { dg-final { scan-assembler-not {vmv} } } */
> +/* { dg-final { scan-assembler-not {csrr} } } */
> --
> 2.36.1
>