From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <SRS0=AdMB=EB=gmail.com=rdapp.gcc@sourceware.org>
Received: from mail-lf1-x12c.google.com (mail-lf1-x12c.google.com [IPv6:2a00:1450:4864:20::12c])
	by sourceware.org (Postfix) with ESMTPS id E451D3858C41
	for <gcc-patches@gcc.gnu.org>; Wed, 16 Aug 2023 09:38:00 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org E451D3858C41
Authentication-Results: sourceware.org; dmarc=pass (p=none dis=none) header.from=gmail.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=gmail.com
Received: by mail-lf1-x12c.google.com with SMTP id 2adb3069b0e04-4fe0d5f719dso10444223e87.2
        for <gcc-patches@gcc.gnu.org>; Wed, 16 Aug 2023 02:38:00 -0700 (PDT)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=gmail.com; s=20221208; t=1692178679; x=1692783479;
        h=content-transfer-encoding:in-reply-to:from:content-language
         :references:to:subject:cc:user-agent:mime-version:date:message-id
         :from:to:cc:subject:date:message-id:reply-to;
        bh=sQNv0qPSlB1geA4azTFrgkuXzG+KQzl10RBtFNUOLjo=;
        b=UZFOFS2TfhNCE/0baHrBAc5v6JQBUoPRbUO5II3mgZs8kY6Ww/sHx+RIIkVKu8z4uv
         QM3o4mnbXZcuznokgkwVFFsU/9L50jaiPIuiP3QOE+q3wAFb8mmYF1VcGMaDzZCA1rLB
         1hCmwcfMCFgjxhusi+PMjI6DjG33Ynfp4rsz46rA3aTNG2G7SrYkAZ4Xy/Rz/1iscCsd
         IUQKYndaCYM1jhcNFqyboKVLe7N1B2+23JyIS8VcOdCzN7kOUUWIO/+0rT8LKKnt2Sy+
         eeLgEsCPug/VfHZeq701qCNziPUMcUMAb61Knqewgsy882kAQKcfxUdn+2pn8OE2rvsY
         LLpg==
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20221208; t=1692178679; x=1692783479;
        h=content-transfer-encoding:in-reply-to:from:content-language
         :references:to:subject:cc:user-agent:mime-version:date:message-id
         :x-gm-message-state:from:to:cc:subject:date:message-id:reply-to;
        bh=sQNv0qPSlB1geA4azTFrgkuXzG+KQzl10RBtFNUOLjo=;
        b=eGy4LbnLliBQ4H9ahKEVJCf+kd7o0/LpZhm18Szb8dVRbWkMnLpGel+/aeNgH48IUH
         KnC7IHmsnsoduxZVGuZ7uuHMCQw4jdB86f+8Akt/e492b/JCJHaGoXe6K8WH04b/15Pz
         25qdDszccS+IyD2qtMhj6g8FHWU4HVC6PX4yqHRTseSps53nEc2X+l5MTX78blRgrf+P
         hPLTq0SE5uvnu9PXs1Npmo9uBlbzMbSLgZzY9bUEd2cPsNVtuXVeTCMs4DYpybwf97Lq
         Dn1mIuqsR6CeAnzgBH3vvX6sSukbxAEllWI/CXSD2vefr76ieOHNGZTz2G6wXUYIYmtW
         LXeA==
X-Gm-Message-State: AOJu0YzUc4Kk50Vo9LYldxkrdYt9ZpMWXWFRe7c/gb6mKaAlXoYHu0t8
	PgkGg057oMCaOGCAt0L4vx8=
X-Google-Smtp-Source: AGHT+IH+4G0dsQd0xTUcW9nOkgliCVU0dmZQRq8fwqn9bKG/Ldrp0Q4bPnrh7QTPQhgkrkDF35Sx5Q==
X-Received: by 2002:a05:6512:3b8d:b0:4f9:54f0:b6db with SMTP id g13-20020a0565123b8d00b004f954f0b6dbmr1351933lfv.13.1692178679099;
        Wed, 16 Aug 2023 02:37:59 -0700 (PDT)
Received: from [192.168.1.23] (ip-046-005-130-086.um12.pools.vodafone-ip.de. [46.5.130.86])
        by smtp.gmail.com with ESMTPSA id x6-20020aa7dac6000000b0052241b8fd0bsm8059056eds.29.2023.08.16.02.37.58
        (version=TLS1_3 cipher=TLS_AES_128_GCM_SHA256 bits=128/128);
        Wed, 16 Aug 2023 02:37:58 -0700 (PDT)
Message-ID: <69b94d02-ecd8-dde2-0c12-f21422f92bff@gmail.com>
Date: Wed, 16 Aug 2023 11:37:57 +0200
MIME-Version: 1.0
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:102.0) Gecko/20100101
 Thunderbird/102.13.0
Cc: rdapp.gcc@gmail.com
Subject: Re: [PATCH] IFN: Fix vector extraction into promoted subreg.
To: "juzhe.zhong@rivai.ai" <juzhe.zhong@rivai.ai>,
 gcc-patches <gcc-patches@gcc.gnu.org>, rguenther <rguenther@suse.de>,
 richard.sandiford@arm.com
References: <A5B5119E73867E8D+2023081609314414050517@rivai.ai>
 <mptil9fmqo3.fsf@arm.com>
Content-Language: en-US
From: Robin Dapp <rdapp.gcc@gmail.com>
In-Reply-To: <mptil9fmqo3.fsf@arm.com>
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 7bit
X-Spam-Status: No, score=-10.8 required=5.0 tests=BAYES_00,DKIM_SIGNED,DKIM_VALID,DKIM_VALID_AU,DKIM_VALID_EF,FREEMAIL_FROM,GIT_PATCH_0,KAM_SHORT,NICE_REPLY_A,RCVD_IN_DNSWL_NONE,SPF_HELO_NONE,SPF_PASS,TXREP autolearn=ham autolearn_force=no version=3.4.6
X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org
List-Id: <gcc-patches.gcc.gnu.org>

> However:
> 
> | #define vec_extract_direct { 3, 3, false }
> 
> This looks wrong.  The numbers are argument numbers (or -1 for a return
> value).  vec_extract only takes 2 arguments, so 3 looks to be out-of-range.
> 
> | #define direct_vec_extract_optab_supported_p direct_optab_supported_p
> 
> I would expect this to be convert_optab_supported_p.
> 
> On the promoted subreg thing, I think expand_vec_extract_optab_fn
> should use expand_fn_using_insn.

Thanks, really easier that way.  Attached a new version that's currently
bootstrapping.  Does that look better?

Regards
 Robin

Subject: [PATCH v2] internal-fn: Fix vector extraction into promoted subreg.

This patch fixes the case where vec_extract gets passed a promoted
subreg (e.g. from a return value).  This is achieved by using
expand_convert_optab_fn instead of a separate expander function.

gcc/ChangeLog:

	* internal-fn.cc (vec_extract_direct): Change type argument
	numbers.
	(expand_vec_extract_optab_fn): Call convert_optab_fn.
	(direct_vec_extract_optab_supported_p): Use
	convert_optab_supported_p.

gcc/testsuite/ChangeLog:

	* gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-1u.c: New test.
	* gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-2u.c: New test.
	* gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-3u.c: New test.
	* gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-4u.c: New test.
	* gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-runu.c: New test.
---
 gcc/internal-fn.cc                            |  44 +-----
 .../rvv/autovec/vls-vlmax/vec_extract-1u.c    |  63 ++++++++
 .../rvv/autovec/vls-vlmax/vec_extract-2u.c    |  69 +++++++++
 .../rvv/autovec/vls-vlmax/vec_extract-3u.c    |  69 +++++++++
 .../rvv/autovec/vls-vlmax/vec_extract-4u.c    |  70 +++++++++
 .../rvv/autovec/vls-vlmax/vec_extract-runu.c  | 137 ++++++++++++++++++
 6 files changed, 413 insertions(+), 39 deletions(-)
 create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-1u.c
 create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-2u.c
 create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-3u.c
 create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-4u.c
 create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-runu.c

diff --git a/gcc/internal-fn.cc b/gcc/internal-fn.cc
index 4f2b20a79e5..5cce36a789b 100644
--- a/gcc/internal-fn.cc
+++ b/gcc/internal-fn.cc
@@ -175,7 +175,7 @@ init_internal_fns ()
 #define len_store_direct { 3, 3, false }
 #define mask_len_store_direct { 4, 5, false }
 #define vec_set_direct { 3, 3, false }
-#define vec_extract_direct { 3, 3, false }
+#define vec_extract_direct { 0, -1, false }
 #define unary_direct { 0, 0, true }
 #define unary_convert_direct { -1, 0, true }
 #define binary_direct { 0, 0, true }
@@ -3127,43 +3127,6 @@ expand_vec_set_optab_fn (internal_fn, gcall *stmt, convert_optab optab)
   gcc_unreachable ();
 }
 
-/* Expand VEC_EXTRACT optab internal function.  */
-
-static void
-expand_vec_extract_optab_fn (internal_fn, gcall *stmt, convert_optab optab)
-{
-  tree lhs = gimple_call_lhs (stmt);
-  tree op0 = gimple_call_arg (stmt, 0);
-  tree op1 = gimple_call_arg (stmt, 1);
-
-  rtx target = expand_expr (lhs, NULL_RTX, VOIDmode, EXPAND_WRITE);
-
-  machine_mode outermode = TYPE_MODE (TREE_TYPE (op0));
-  machine_mode extract_mode = TYPE_MODE (TREE_TYPE (lhs));
-
-  rtx src = expand_normal (op0);
-  rtx pos = expand_normal (op1);
-
-  class expand_operand ops[3];
-  enum insn_code icode = convert_optab_handler (optab, outermode,
-						extract_mode);
-
-  if (icode != CODE_FOR_nothing)
-    {
-      create_output_operand (&ops[0], target, extract_mode);
-      create_input_operand (&ops[1], src, outermode);
-      create_convert_operand_from (&ops[2], pos,
-				   TYPE_MODE (TREE_TYPE (op1)), true);
-      if (maybe_expand_insn (icode, 3, ops))
-	{
-	  if (!rtx_equal_p (target, ops[0].value))
-	    emit_move_insn (target, ops[0].value);
-	  return;
-	}
-    }
-  gcc_unreachable ();
-}
-
 static void
 expand_ABNORMAL_DISPATCHER (internal_fn, gcall *)
 {
@@ -3917,6 +3880,9 @@ expand_convert_optab_fn (internal_fn fn, gcall *stmt, convert_optab optab,
 #define expand_unary_convert_optab_fn(FN, STMT, OPTAB) \
   expand_convert_optab_fn (FN, STMT, OPTAB, 1)
 
+#define expand_vec_extract_optab_fn(FN, STMT, OPTAB) \
+  expand_convert_optab_fn (FN, STMT, OPTAB, 2)
+
 /* RETURN_TYPE and ARGS are a return type and argument list that are
    in principle compatible with FN (which satisfies direct_internal_fn_p).
    Return the types that should be used to determine whether the
@@ -4019,7 +3985,7 @@ multi_vector_optab_supported_p (convert_optab optab, tree_pair types,
 #define direct_mask_len_fold_left_optab_supported_p direct_optab_supported_p
 #define direct_check_ptrs_optab_supported_p direct_optab_supported_p
 #define direct_vec_set_optab_supported_p direct_optab_supported_p
-#define direct_vec_extract_optab_supported_p direct_optab_supported_p
+#define direct_vec_extract_optab_supported_p convert_optab_supported_p
 
 /* Return the optab used by internal function FN.  */
 
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-1u.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-1u.c
new file mode 100644
index 00000000000..a35988ff55d
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-1u.c
@@ -0,0 +1,63 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=rv64gcv_zvfh -mabi=lp64d -Wno-pedantic -Wno-psabi" } */
+
+#include <stdint-gcc.h>
+
+typedef uint64_t vnx2di __attribute__((vector_size (16)));
+typedef uint32_t vnx4si __attribute__((vector_size (16)));
+typedef uint16_t vnx8hi __attribute__((vector_size (16)));
+typedef uint8_t vnx16qi __attribute__((vector_size (16)));
+
+#define VEC_EXTRACT(S,V,IDX)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_##V##_##IDX (V v)			\
+  {						\
+    return v[IDX];				\
+  }
+
+#define VEC_EXTRACT_VAR1(S,V)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_var_##V (V v, int8_t idx)		\
+  {						\
+    return v[idx];				\
+  }
+
+#define TEST_ALL1(T)				\
+  T (uint64_t, vnx2di, 0)			\
+  T (uint64_t, vnx2di, 1)			\
+  T (uint32_t, vnx4si, 0)			\
+  T (uint32_t, vnx4si, 1)			\
+  T (uint32_t, vnx4si, 3)			\
+  T (uint16_t, vnx8hi, 0)			\
+  T (uint16_t, vnx8hi, 2)			\
+  T (uint16_t, vnx8hi, 6)			\
+  T (uint8_t, vnx16qi, 0)			\
+  T (uint8_t, vnx16qi, 1)			\
+  T (uint8_t, vnx16qi, 7)			\
+  T (uint8_t, vnx16qi, 11)			\
+  T (uint8_t, vnx16qi, 15)			\
+
+#define TEST_ALL_VAR1(T)			\
+  T (uint64_t, vnx2di)				\
+  T (uint32_t, vnx4si)				\
+  T (uint16_t, vnx8hi)				\
+  T (uint8_t, vnx16qi)				\
+
+TEST_ALL1 (VEC_EXTRACT)
+TEST_ALL_VAR1 (VEC_EXTRACT_VAR1)
+
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e8,\s*m1,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e16,\s*m1,\s*ta,\s*ma} 4 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e32,\s*m1,\s*ta,\s*ma} 4 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e64,\s*m1,\s*ta,\s*ma} 3 } } */
+
+/* { dg-final { scan-assembler-times {\tvslidedown.vi} 9 } } */
+/* { dg-final { scan-assembler-times {\tvslidedown.vx} 4 } } */
+
+/* { dg-final { scan-assembler-times {\tvmv.x.s} 17 } } */
+
+/* { dg-final { scan-assembler-times {\tandi\ta0,a0,0xff} 6 } } */
+/* { dg-final { scan-assembler-times {\tslli\ta0,a0,48} 4 } } */
+/* { dg-final { scan-assembler-times {\tsrli\ta0,a0,48} 4 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-2u.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-2u.c
new file mode 100644
index 00000000000..8c3c16a7047
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-2u.c
@@ -0,0 +1,69 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=rv64gcv_zvfh -mabi=lp64d -Wno-pedantic -Wno-psabi" } */
+
+#include <stdint-gcc.h>
+
+typedef uint64_t vnx4di __attribute__((vector_size (32)));
+typedef uint32_t vnx8si __attribute__((vector_size (32)));
+typedef uint16_t vnx16hi __attribute__((vector_size (32)));
+typedef uint8_t vnx32qi __attribute__((vector_size (32)));
+
+#define VEC_EXTRACT(S,V,IDX)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_##V##_##IDX (V v)			\
+  {						\
+    return v[IDX];				\
+  }
+
+#define VEC_EXTRACT_VAR2(S,V)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_var_##V (V v, int16_t idx)	\
+  {						\
+    return v[idx];				\
+  }
+
+#define TEST_ALL2(T)				\
+  T (uint64_t, vnx4di, 0)			\
+  T (uint64_t, vnx4di, 1)			\
+  T (uint64_t, vnx4di, 2)			\
+  T (uint64_t, vnx4di, 3)			\
+  T (uint32_t, vnx8si, 0)			\
+  T (uint32_t, vnx8si, 1)			\
+  T (uint32_t, vnx8si, 3)			\
+  T (uint32_t, vnx8si, 4)			\
+  T (uint32_t, vnx8si, 7)			\
+  T (uint16_t, vnx16hi, 0)			\
+  T (uint16_t, vnx16hi, 1)			\
+  T (uint16_t, vnx16hi, 7)			\
+  T (uint16_t, vnx16hi, 8)			\
+  T (uint16_t, vnx16hi, 15)			\
+  T (uint8_t, vnx32qi, 0)			\
+  T (uint8_t, vnx32qi, 1)			\
+  T (uint8_t, vnx32qi, 15)			\
+  T (uint8_t, vnx32qi, 16)			\
+  T (uint8_t, vnx32qi, 31)			\
+
+#define TEST_ALL_VAR2(T)			\
+  T (uint64_t, vnx4di)				\
+  T (uint32_t, vnx8si)				\
+  T (uint16_t, vnx16hi)				\
+  T (uint8_t, vnx32qi)				\
+
+TEST_ALL2 (VEC_EXTRACT)
+TEST_ALL_VAR2 (VEC_EXTRACT_VAR2)
+
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e8,\s*m2,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e16,\s*m2,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e32,\s*m2,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e64,\s*m2,\s*ta,\s*ma} 5 } } */
+
+/* { dg-final { scan-assembler-times {\tvslidedown.vi} 15 } } */
+/* { dg-final { scan-assembler-times {\tvslidedown.vx} 4 } } */
+
+/* { dg-final { scan-assembler-times {\tvmv.x.s} 23 } } */
+
+/* { dg-final { scan-assembler-times {\tandi\ta0,a0,0xff} 6 } } */
+/* { dg-final { scan-assembler-times {\tslli\ta0,a0,48} 6 } } */
+/* { dg-final { scan-assembler-times {\tsrli\ta0,a0,48} 6 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-3u.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-3u.c
new file mode 100644
index 00000000000..ab49f29c3f2
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-3u.c
@@ -0,0 +1,69 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=rv64gcv_zvfh -mabi=lp64d -Wno-pedantic -Wno-psabi" } */
+
+#include <stdint-gcc.h>
+
+typedef uint64_t vnx8di __attribute__((vector_size (64)));
+typedef uint32_t vnx16si __attribute__((vector_size (64)));
+typedef uint16_t vnx32hi __attribute__((vector_size (64)));
+typedef uint8_t vnx64qi __attribute__((vector_size (64)));
+
+#define VEC_EXTRACT(S,V,IDX)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_##V##_##IDX (V v)			\
+  {						\
+    return v[IDX];				\
+  }
+
+#define VEC_EXTRACT_VAR3(S,V)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_var_##V (V v, int32_t idx)	\
+  {						\
+    return v[idx];				\
+  }
+
+#define TEST_ALL3(T)				\
+  T (uint64_t, vnx8di, 0)			\
+  T (uint64_t, vnx8di, 2)			\
+  T (uint64_t, vnx8di, 4)			\
+  T (uint64_t, vnx8di, 6)			\
+  T (uint32_t, vnx16si, 0)			\
+  T (uint32_t, vnx16si, 2)			\
+  T (uint32_t, vnx16si, 6)			\
+  T (uint32_t, vnx16si, 8)			\
+  T (uint32_t, vnx16si, 14)			\
+  T (uint16_t, vnx32hi, 0)			\
+  T (uint16_t, vnx32hi, 2)			\
+  T (uint16_t, vnx32hi, 14)			\
+  T (uint16_t, vnx32hi, 16)			\
+  T (uint16_t, vnx32hi, 30)			\
+  T (uint8_t, vnx64qi, 0)			\
+  T (uint8_t, vnx64qi, 2)			\
+  T (uint8_t, vnx64qi, 30)			\
+  T (uint8_t, vnx64qi, 32)			\
+  T (uint8_t, vnx64qi, 63)			\
+
+#define TEST_ALL_VAR3(T)			\
+  T (uint64_t, vnx8di)				\
+  T (uint32_t, vnx16si)				\
+  T (uint16_t, vnx32hi)				\
+  T (uint8_t, vnx64qi)				\
+
+TEST_ALL3 (VEC_EXTRACT)
+TEST_ALL_VAR3 (VEC_EXTRACT_VAR3)
+
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e8,\s*m4,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e16,\s*m4,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e32,\s*m4,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e64,\s*m4,\s*ta,\s*ma} 5 } } */
+
+/* { dg-final { scan-assembler-times {\tvslidedown.vi} 13 } } */
+/* { dg-final { scan-assembler-times {\tvslidedown.vx} 6 } } */
+
+/* { dg-final { scan-assembler-times {\tvmv.x.s} 23 } } */
+
+/* { dg-final { scan-assembler-times {\tandi\ta0,a0,0xff} 6 } } */
+/* { dg-final { scan-assembler-times {\tslli\ta0,a0,48} 6 } } */
+/* { dg-final { scan-assembler-times {\tsrli\ta0,a0,48} 6 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-4u.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-4u.c
new file mode 100644
index 00000000000..328d426e572
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-4u.c
@@ -0,0 +1,70 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=rv64gcv_zvfh -mabi=lp64d -Wno-pedantic -Wno-psabi" } */
+
+#include <stdint-gcc.h>
+
+typedef uint64_t vnx16di __attribute__((vector_size (128)));
+typedef uint32_t vnx32si __attribute__((vector_size (128)));
+typedef uint16_t vnx64hi __attribute__((vector_size (128)));
+typedef uint8_t vnx128qi __attribute__((vector_size (128)));
+
+#define VEC_EXTRACT(S,V,IDX)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_##V##_##IDX (V v)			\
+  {						\
+    return v[IDX];				\
+  }
+
+#define VEC_EXTRACT_VAR4(S,V)			\
+  S						\
+  __attribute__((noipa))			\
+  vec_extract_var_##V (V v, int64_t idx)	\
+  {						\
+    return v[idx];				\
+  }
+
+#define TEST_ALL4(T)				\
+  T (uint64_t, vnx16di, 0)			\
+  T (uint64_t, vnx16di, 4)			\
+  T (uint64_t, vnx16di, 8)			\
+  T (uint64_t, vnx16di, 12)			\
+  T (uint32_t, vnx32si, 0)			\
+  T (uint32_t, vnx32si, 4)			\
+  T (uint32_t, vnx32si, 12)			\
+  T (uint32_t, vnx32si, 16)			\
+  T (uint32_t, vnx32si, 28)			\
+  T (uint16_t, vnx64hi, 0)			\
+  T (uint16_t, vnx64hi, 4)			\
+  T (uint16_t, vnx64hi, 28)			\
+  T (uint16_t, vnx64hi, 32)			\
+  T (uint16_t, vnx64hi, 60)			\
+  T (uint8_t, vnx128qi, 0)			\
+  T (uint8_t, vnx128qi, 4)			\
+  T (uint8_t, vnx128qi, 30)			\
+  T (uint8_t, vnx128qi, 60)			\
+  T (uint8_t, vnx128qi, 64)			\
+  T (uint8_t, vnx128qi, 127)			\
+
+#define TEST_ALL_VAR4(T)			\
+  T (uint64_t, vnx16di)				\
+  T (uint32_t, vnx32si)				\
+  T (uint16_t, vnx64hi)				\
+  T (uint8_t, vnx128qi)				\
+
+TEST_ALL4 (VEC_EXTRACT)
+TEST_ALL_VAR4 (VEC_EXTRACT_VAR4)
+
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e8,\s*m8,\s*ta,\s*ma} 7 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e16,\s*m8,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e32,\s*m8,\s*ta,\s*ma} 6 } } */
+/* { dg-final { scan-assembler-times {vset[i]*vli\s+[a-z0-9,]+,\s*e64,\s*m8,\s*ta,\s*ma} 5 } } */
+
+/* { dg-final { scan-assembler-times {\tvslidedown.vi} 11 } } */
+/* { dg-final { scan-assembler-times {\tvslidedown.vx} 9 } } */
+
+/* { dg-final { scan-assembler-times {\tvmv.x.s} 24 } } */
+
+/* { dg-final { scan-assembler-times {\tandi\ta0,a0,0xff} 7 } } */
+/* { dg-final { scan-assembler-times {\tslli\ta0,a0,48} 6 } } */
+/* { dg-final { scan-assembler-times {\tsrli\ta0,a0,48} 6 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-runu.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-runu.c
new file mode 100644
index 00000000000..924e40c9dbb
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/vec_extract-runu.c
@@ -0,0 +1,137 @@
+/* { dg-do run { target { riscv_vector } } } */
+/* { dg-additional-options "-std=c99 -Wno-pedantic -Wno-psabi" } */
+
+#include <assert.h>
+#include <limits.h>
+
+#include "vec_extract-1u.c"
+#include "vec_extract-2u.c"
+#include "vec_extract-3u.c"
+#include "vec_extract-4u.c"
+
+#define CHECK(S, V, IDX)                                                       \
+  __attribute__ ((noipa, optimize ("0"))) void check_##V##_##IDX ()            \
+  {                                                                            \
+    V v;                                                                       \
+    for (int i = 0; i < sizeof (V) / sizeof (S); i++)                          \
+      v[i] = (S) (INT_MAX - i);                                                \
+    S res = vec_extract_##V##_##IDX (v);                                       \
+    assert (res == (S) (INT_MAX - IDX));                                       \
+  }
+
+#define CHECK_VAR(S, V)                                                        \
+  __attribute__ ((noipa, optimize ("0"))) void check_var_##V (int32_t idx)     \
+  {                                                                            \
+    V v;                                                                       \
+    for (int i = 0; i < sizeof (V) / sizeof (S); i++)                          \
+      v[i] = (S) (INT_MAX - i);                                                \
+    S res = vec_extract_var_##V (v, idx);                                      \
+    assert (res == (S) (INT_MAX - idx));                                       \
+  }
+
+#define RUN(S, V, IDX) check_##V##_##IDX ();
+
+#define RUN_VAR(S, V)                                                          \
+  for (int i = 0; i < sizeof (V) / sizeof (S); i++)                            \
+    check_var_##V (i);
+
+#define RUN_ALL(T)                                                             \
+  T (uint64_t, vnx2di, 0)                                                      \
+  T (uint64_t, vnx2di, 1)                                                      \
+  T (uint32_t, vnx4si, 0)                                                      \
+  T (uint32_t, vnx4si, 1)                                                      \
+  T (uint32_t, vnx4si, 3)                                                      \
+  T (uint16_t, vnx8hi, 0)                                                      \
+  T (uint16_t, vnx8hi, 2)                                                      \
+  T (uint16_t, vnx8hi, 6)                                                      \
+  T (uint8_t, vnx16qi, 0)                                                      \
+  T (uint8_t, vnx16qi, 1)                                                      \
+  T (uint8_t, vnx16qi, 7)                                                      \
+  T (uint8_t, vnx16qi, 11)                                                     \
+  T (uint8_t, vnx16qi, 15)                                                     \
+  T (uint64_t, vnx4di, 0)                                                      \
+  T (uint64_t, vnx4di, 1)                                                      \
+  T (uint64_t, vnx4di, 2)                                                      \
+  T (uint64_t, vnx4di, 3)                                                      \
+  T (uint32_t, vnx8si, 0)                                                      \
+  T (uint32_t, vnx8si, 1)                                                      \
+  T (uint32_t, vnx8si, 3)                                                      \
+  T (uint32_t, vnx8si, 4)                                                      \
+  T (uint32_t, vnx8si, 7)                                                      \
+  T (uint16_t, vnx16hi, 0)                                                     \
+  T (uint16_t, vnx16hi, 1)                                                     \
+  T (uint16_t, vnx16hi, 7)                                                     \
+  T (uint16_t, vnx16hi, 8)                                                     \
+  T (uint16_t, vnx16hi, 15)                                                    \
+  T (uint8_t, vnx32qi, 0)                                                      \
+  T (uint8_t, vnx32qi, 1)                                                      \
+  T (uint8_t, vnx32qi, 15)                                                     \
+  T (uint8_t, vnx32qi, 16)                                                     \
+  T (uint8_t, vnx32qi, 31)                                                     \
+  T (uint64_t, vnx8di, 0)                                                      \
+  T (uint64_t, vnx8di, 2)                                                      \
+  T (uint64_t, vnx8di, 4)                                                      \
+  T (uint64_t, vnx8di, 6)                                                      \
+  T (uint32_t, vnx16si, 0)                                                     \
+  T (uint32_t, vnx16si, 2)                                                     \
+  T (uint32_t, vnx16si, 6)                                                     \
+  T (uint32_t, vnx16si, 8)                                                     \
+  T (uint32_t, vnx16si, 14)                                                    \
+  T (uint16_t, vnx32hi, 0)                                                     \
+  T (uint16_t, vnx32hi, 2)                                                     \
+  T (uint16_t, vnx32hi, 14)                                                    \
+  T (uint16_t, vnx32hi, 16)                                                    \
+  T (uint16_t, vnx32hi, 30)                                                    \
+  T (uint8_t, vnx64qi, 0)                                                      \
+  T (uint8_t, vnx64qi, 2)                                                      \
+  T (uint8_t, vnx64qi, 30)                                                     \
+  T (uint8_t, vnx64qi, 32)                                                     \
+  T (uint8_t, vnx64qi, 63)                                                     \
+  T (uint64_t, vnx16di, 0)                                                     \
+  T (uint64_t, vnx16di, 4)                                                     \
+  T (uint64_t, vnx16di, 8)                                                     \
+  T (uint64_t, vnx16di, 12)                                                    \
+  T (uint32_t, vnx32si, 0)                                                     \
+  T (uint32_t, vnx32si, 4)                                                     \
+  T (uint32_t, vnx32si, 12)                                                    \
+  T (uint32_t, vnx32si, 16)                                                    \
+  T (uint32_t, vnx32si, 28)                                                    \
+  T (uint16_t, vnx64hi, 0)                                                     \
+  T (uint16_t, vnx64hi, 4)                                                     \
+  T (uint16_t, vnx64hi, 28)                                                    \
+  T (uint16_t, vnx64hi, 32)                                                    \
+  T (uint16_t, vnx64hi, 60)                                                    \
+  T (uint8_t, vnx128qi, 0)                                                     \
+  T (uint8_t, vnx128qi, 4)                                                     \
+  T (uint8_t, vnx128qi, 30)                                                    \
+  T (uint8_t, vnx128qi, 60)                                                    \
+  T (uint8_t, vnx128qi, 64)                                                    \
+  T (uint8_t, vnx128qi, 127)
+
+#define RUN_ALL_VAR(T)                                                         \
+  T (uint64_t, vnx2di)                                                         \
+  T (uint32_t, vnx4si)                                                         \
+  T (uint16_t, vnx8hi)                                                         \
+  T (uint8_t, vnx16qi)                                                         \
+  T (uint64_t, vnx4di)                                                         \
+  T (uint32_t, vnx8si)                                                         \
+  T (uint16_t, vnx16hi)                                                        \
+  T (uint8_t, vnx32qi)                                                         \
+  T (uint64_t, vnx8di)                                                         \
+  T (uint32_t, vnx16si)                                                        \
+  T (uint16_t, vnx32hi)                                                        \
+  T (uint8_t, vnx64qi)                                                         \
+  T (uint64_t, vnx16di)                                                        \
+  T (uint32_t, vnx32si)                                                        \
+  T (uint16_t, vnx64hi)                                                        \
+  T (uint8_t, vnx128qi)
+
+RUN_ALL (CHECK)
+RUN_ALL_VAR (CHECK_VAR)
+
+int
+main ()
+{
+  RUN_ALL (RUN);
+  RUN_ALL_VAR (RUN_VAR);
+}
-- 
2.41.0