From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <SRS0=PHk/=BO=intel.com=pan2.li@sourceware.org>
Received: from mga06.intel.com (mga06b.intel.com [134.134.136.31])
	by sourceware.org (Postfix) with ESMTPS id 332DF3858D20
	for <gcc-patches@gcc.gnu.org>; Thu, 25 May 2023 03:16:37 +0000 (GMT)
DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org 332DF3858D20
Authentication-Results: sourceware.org; dmarc=pass (p=none dis=none) header.from=intel.com
Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=intel.com
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/simple;
  d=intel.com; i=@intel.com; q=dns/txt; s=Intel;
  t=1684984597; x=1716520597;
  h=from:to:cc:subject:date:message-id:references:
   in-reply-to:mime-version;
  bh=EynNOb3ox4O4pWxDpNvjr4d4WpJgmG6eyU+3OEcUYU8=;
  b=W8CWBzali6kSTy19lOl/2jlW5UBEaKMmf9alM8nQIrJP6D3JPPtxJnGi
   4It3s5qS71QUzuowdG7nrONaLER0FgetCe/uCTTm7TgiZRjj8Tjrl2wGm
   D37VlVFX9IP/QMUSPUpof/qDtGvWku5Z/0+VAt6Uq4qvlxsoWhXJJO8pT
   HLc/LiXBwGQG+AcTcuKxP6w4WJTu4lBzCif31TRbUv0/0qcDf8ZUCXffm
   q1eJHLhZ2HQGWhGJm14GhsfBG2D9Wj1ZbanEpRJrlPxfBy11fl0dn4vi0
   eC0D9oknKkgbrELlL4+rcNGCx6/46b7UFBhEQnwoH0ftFo02cUhwDtL4o
   g==;
X-IronPort-AV: E=McAfee;i="6600,9927,10720"; a="417231563"
X-IronPort-AV: E=Sophos;i="6.00,190,1681196400"; 
   d="scan'208,217";a="417231563"
Received: from fmsmga008.fm.intel.com ([10.253.24.58])
  by orsmga104.jf.intel.com with ESMTP/TLS/ECDHE-RSA-AES256-GCM-SHA384; 24 May 2023 20:16:35 -0700
X-ExtLoop1: 1
X-IronPort-AV: E=McAfee;i="6600,9927,10720"; a="769699777"
X-IronPort-AV: E=Sophos;i="6.00,190,1681196400"; 
   d="scan'208,217";a="769699777"
Received: from fmsmsx603.amr.corp.intel.com ([10.18.126.83])
  by fmsmga008.fm.intel.com with ESMTP; 24 May 2023 20:16:35 -0700
Received: from fmsmsx610.amr.corp.intel.com (10.18.126.90) by
 fmsmsx603.amr.corp.intel.com (10.18.126.83) with Microsoft SMTP Server
 (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.1.2507.23; Wed, 24 May 2023 20:16:34 -0700
Received: from FMSEDG603.ED.cps.intel.com (10.1.192.133) by
 fmsmsx610.amr.corp.intel.com (10.18.126.90) with Microsoft SMTP Server
 (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id
 15.1.2507.23 via Frontend Transport; Wed, 24 May 2023 20:16:34 -0700
Received: from NAM02-SN1-obe.outbound.protection.outlook.com (104.47.57.48) by
 edgegateway.intel.com (192.55.55.68) with Microsoft SMTP Server
 (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id
 15.1.2507.23; Wed, 24 May 2023 20:16:34 -0700
ARC-Seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none;
 b=Hu+dUd3ikLchSch1ef6sPJf4zvqjBGYTHmB3CA/ekTNioNzwbeDLKspIdiGepvLzreY4UI0aQUMA63WBvP8q8+YGivx5AKRvGOPMt+GJifWrQaa+Zi8nEaDsuWP/bfmrilwxwDWjt/eOPCoekbuMIenVHK4VBrNxEv4ME9VDgu7ofoFVBSOMssp9rPu46AE8W9wIGMbq4HssVlK9GJhGeAL7Y5MnaVizlFaQ4k/o6Kn9w8bYOVrtcWssWSAUNf1+QPAIPaVDBm7pwITffC9/EZbM71T3xhJdgohBjEv1QZumoDaeUQi8kl0NuYPw7/NtT5Ruij6995lOgxMuF8S3CA==
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com;
 s=arcselector9901;
 h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1;
 bh=E1ugz5msAws0cB9q3p1731cCtXLG+gdPFUbPqPlpfrs=;
 b=L+5W40fqVxaMHutX+D1iuTxR1EZdKLVlojL4OMUHWlxTGhew5LcxmPkhAYt9BVhq28kTh89o3OEg/IDtYBPvScDMms2XQcVKRNFy2NaZa5JEcu9zcVywGqcjOes/REmTF7Pq9W8MbXPAJisYOmgVwvRvcErctmkJ8dBvbBbqqP7kKAGHtsqz2F4VUJ+UnS/adaq/sfAHMh8qNk9DlvpUFybyouhFkDuZOgjrVVnWjbEnUEkGxSfqdfSyRUUoB4NZ6pvXDEcHn7tIpiawiYGV2+vbweZQjNrnT4A9LFDdnLJWO+mMmJIJ6xTt+ZFN7z15TVnZDXS/1rmocASJA8sqPw==
ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass
 smtp.mailfrom=intel.com; dmarc=pass action=none header.from=intel.com;
 dkim=pass header.d=intel.com; arc=none
Received: from MW5PR11MB5908.namprd11.prod.outlook.com (2603:10b6:303:194::10)
 by CO6PR11MB5633.namprd11.prod.outlook.com (2603:10b6:303:13c::16) with
 Microsoft SMTP Server (version=TLS1_2,
 cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.6433.15; Thu, 25 May
 2023 03:16:31 +0000
Received: from MW5PR11MB5908.namprd11.prod.outlook.com
 ([fe80::bbc5:f013:1f53:10a9]) by MW5PR11MB5908.namprd11.prod.outlook.com
 ([fe80::bbc5:f013:1f53:10a9%3]) with mapi id 15.20.6411.028; Thu, 25 May 2023
 03:16:31 +0000
From: "Li, Pan2" <pan2.li@intel.com>
To: "juzhe.zhong@rivai.ai" <juzhe.zhong@rivai.ai>, gcc-patches
	<gcc-patches@gcc.gnu.org>
CC: Kito.cheng <kito.cheng@sifive.com>, "Wang, Yanzhang"
	<yanzhang.wang@intel.com>
Subject: RE: [PATCH v6] RISC-V: Using merge approach to optimize repeating
 sequence
Thread-Topic: [PATCH v6] RISC-V: Using merge approach to optimize repeating
 sequence
Thread-Index: AQHZjrZVWyEL+zyKW06vsxYwRYQas69qUK+IgAAAJ7A=
Date: Thu, 25 May 2023 03:16:30 +0000
Message-ID: <MW5PR11MB59081BB834A297D19B0F5207A9469@MW5PR11MB5908.namprd11.prod.outlook.com>
References: <20230525030920.2569553-1-pan2.li@intel.com>
 <AB6C1BAF0F6D2EBF+20230525111401243967241@rivai.ai>
In-Reply-To: <AB6C1BAF0F6D2EBF+20230525111401243967241@rivai.ai>
Accept-Language: en-US
Content-Language: en-US
X-MS-Has-Attach:
X-MS-TNEF-Correlator:
authentication-results: dkim=none (message not signed)
 header.d=none;dmarc=none action=none header.from=intel.com;
x-ms-publictraffictype: Email
x-ms-traffictypediagnostic: MW5PR11MB5908:EE_|CO6PR11MB5633:EE_
x-ms-office365-filtering-correlation-id: e6c5965c-5d7a-44cf-144e-08db5cce6fa0
x-ms-exchange-senderadcheck: 1
x-ms-exchange-antispam-relay: 0
x-microsoft-antispam: BCL:0;
x-microsoft-antispam-message-info: 1CGgKMkaZrbdcNDyiI0iLLRzjusuFbAU8j+TaHY8V44DrPUpOwua7oF9WZUxPqniO6uC2NMb0hNAOyvmoJaC1oRaFyPymlliI+X7weUlra8bOuNwLpqiiEsriwq8mu4Yu10N6KVV2op1iklvGsrKVyFWAd0jMCB8S4p9d/wkD0xDPEc57cvNU0OJKL1KbH9yKGFl4Km253jaQmwg3PAcl58Lu/gPYaTjQ1pFJHTCF52va1Q47pbhIJ6//FgDM5C84U9rYhKLtaVFfAzs99Cqn/daaiw45UTIT8wC3WRPD8nxBnL+sn8SyJbybdWGObMeKo4zMs75884GC7g+aJU2KPruRVKja2VxJqArvP08KeV0kkMXjfOa5b4oqVxsDiDn7oKisIi1fall4/X0QyfQCPMULpeK1/DxyR1sPiv306tMst7SWd5KAUjSwYvLPi2T2xBUTGrsXmWjWbAF6wW/Fod0G8MYiFswUzKcQPtgkY+ukjClIp8RniBFMcgRSMfgIlAofs/B/3yp64MC1EjhcQWcMbu7mfdB9WmXKI7s1PGEmKYG54/Jp/BSuguhmmEhdpJjvKnKc0Zt08Of9lznH8cx0ueYoga4NmDbSbTYCSN8e0PHMcnoZjnVpTxWp7G3
x-forefront-antispam-report: CIP:255.255.255.255;CTRY:;LANG:en;SCL:1;SRV:;IPV:NLI;SFV:NSPM;H:MW5PR11MB5908.namprd11.prod.outlook.com;PTR:;CAT:NONE;SFS:(13230028)(39860400002)(376002)(346002)(136003)(396003)(366004)(451199021)(64756008)(54906003)(52536014)(41300700001)(7696005)(66556008)(66476007)(66446008)(76116006)(66946007)(5660300002)(8936002)(8676002)(110136005)(84970400001)(6506007)(9686003)(53546011)(107886003)(478600001)(4326008)(71200400001)(316002)(26005)(30864003)(186003)(83380400001)(2906002)(82960400001)(122000001)(55016003)(33656002)(86362001)(38070700005)(38100700002)(579004)(559001)(473944003);DIR:OUT;SFP:1102;
x-ms-exchange-antispam-messagedata-chunkcount: 1
x-ms-exchange-antispam-messagedata-0: =?us-ascii?Q?5M3tURjtXn7BCwTWRWZVgv8PGn1Js6U4XpjpaJhvnvYcnmqHYEMHquQAwEOo?=
 =?us-ascii?Q?7FCAjxJ2Alqlx9HcLMh/UUOUImvsdTc6mFaC/5OfGChLat9tv4djvzWcctcM?=
 =?us-ascii?Q?7KYz0WOBnWur6qyUGJxdgeqIkYaNRzXzCOYb0dYfasUjGXuX+X2bBdQTyC9v?=
 =?us-ascii?Q?CsTmTYGFbmCaZnBFSiJ7jVguHpB7D1UVe4nyPNXUZ8xxwHbwD4tTIyaedd12?=
 =?us-ascii?Q?A5sHkjwV/Nvpa7b+ijAtJvl/04PHX1Y7vvzAO+avFZRP5Uj7Ht8sBaTUpFNS?=
 =?us-ascii?Q?7cu8aJYeHFdb/uhpg/v3Neh8Q4iX2AGWjuEcfDVM+ZS08Mo2edAgsbWS5nhe?=
 =?us-ascii?Q?w5po4DMQocO2wUcqxpYOkFcWn3k5EfZCBHqb4XO6H8dxeORhA5GoL+XwVWmX?=
 =?us-ascii?Q?pe1ztjYhNIb6Rlv8hmkBftJCXA2hVe4ismCOfGKYJv+uTwcLS/FkjJNUuXtl?=
 =?us-ascii?Q?JQjxKU/OW9ZL38o58mjL9VUx/6kCNBP0tAeNmq3iOuzaJKQJZzLPPoIJarec?=
 =?us-ascii?Q?qvlvEN3Xpyc25RjeFrgne+j2q5QHW1Q4wL1dz3+zoM/0majaT5SVzfEVobju?=
 =?us-ascii?Q?35JC4lZaog7QGjfpUROvBg51Nhv8HcWeAiYkxRr8PpkFT8opeliXu4RilUo7?=
 =?us-ascii?Q?crpKcQLkXcJcqi/pBzUVGPctJQzTlMViVlSJXuEN6y1hXyvv9awca4hxfz1g?=
 =?us-ascii?Q?LY0B96czCNtTvZmY//Iaxr+nrI+C2MVwnLdH7XSgdjE/2I2vE903+hV/gruc?=
 =?us-ascii?Q?721qN7spCzd2fpeFSZC0oKIsQmZ4Ip+5aM72FhWR9B8njdNMmDZY/1vKvGjD?=
 =?us-ascii?Q?7/oMHqfLbR9MCx5tQsQPBQ8wlpJ+tBnB0Pt4+4wFGoDg8G/PsDGnDcz2OP04?=
 =?us-ascii?Q?DG54XU7MdWxBjlXYH/VNeEa5miD5w64vzGLhd3ycmjXCO2cOjxAka67tnPd0?=
 =?us-ascii?Q?N+6pbxUHWClRmZhIiPSzHJIbUvkXqUtyyjBiOIsLJbxsLesAc2Z9UI9ys2Oc?=
 =?us-ascii?Q?lqlS3xM9VGdGwLsmwDOWVRvWoABMlg+SESuvXMOSlMSlnTxzu5Z+0unjStev?=
 =?us-ascii?Q?gPgj8gyBPziGytOUlr0bxjksj1w4etPnr0LIqgR57K7Iy0W635GDuBD14LXU?=
 =?us-ascii?Q?xlM2NIWtVdg+J/XAKhoT+wtQAfp230adK50OgYxGQZAsfhlBhXrNllYAhG6h?=
 =?us-ascii?Q?YRu/a3DSx5O5LWMhF+O4EIaVEGBWbulVrezvnZFaFyu76at+EXpoN506R0Ap?=
 =?us-ascii?Q?ZrJJguI8w3D0fh/EqdEJz5+KLu5PPOmc3bo5gnc9YFmOjJ5g4VQN+YVU5HF1?=
 =?us-ascii?Q?9QyDzhFFQAZ9cjWImqRXi03XJjlFWQKuMxVC7o4+jArijyVPicaUd3vcOof3?=
 =?us-ascii?Q?GwvMBT4xFuduRW8JsKNlOk2eaSDx+ravPB6qDhiEYnfeAvt5tC6FxAVoEvHp?=
 =?us-ascii?Q?HlJd6WfZDR6QKmqtWjwuFWJjzRUmutVlwbBNDV6dpz/l2Y24+gwu9OteKjmV?=
 =?us-ascii?Q?IB0QIQQX66+PcdiHv374XPDkjHjcPob85spWmnlh4M3zlYj/dLdbOOaJpg71?=
 =?us-ascii?Q?Pxeh4RWkEMvJ92RGj4k=3D?=
Content-Type: multipart/alternative;
	boundary="_000_MW5PR11MB59081BB834A297D19B0F5207A9469MW5PR11MB5908namp_"
MIME-Version: 1.0
X-MS-Exchange-CrossTenant-AuthAs: Internal
X-MS-Exchange-CrossTenant-AuthSource: MW5PR11MB5908.namprd11.prod.outlook.com
X-MS-Exchange-CrossTenant-Network-Message-Id: e6c5965c-5d7a-44cf-144e-08db5cce6fa0
X-MS-Exchange-CrossTenant-originalarrivaltime: 25 May 2023 03:16:30.8434
 (UTC)
X-MS-Exchange-CrossTenant-fromentityheader: Hosted
X-MS-Exchange-CrossTenant-id: 46c98d88-e344-4ed4-8496-4ed7712e255d
X-MS-Exchange-CrossTenant-mailboxtype: HOSTED
X-MS-Exchange-CrossTenant-userprincipalname: Ug/1ARmsGvGhpC/kQ3jJAdEN7Vs4IADllnOltNElnmJNUp62NfgBjhfVXyOqE2IkFkf2R5hnJ4A9HmpaEp+rRg==
X-MS-Exchange-Transport-CrossTenantHeadersStamped: CO6PR11MB5633
X-OriginatorOrg: intel.com
X-Spam-Status: No, score=-10.5 required=5.0 tests=BAYES_00,DKIMWL_WL_HIGH,DKIM_SIGNED,DKIM_VALID,DKIM_VALID_AU,DKIM_VALID_EF,GIT_PATCH_0,HTML_MESSAGE,KAM_SHORT,SCC_10_SHORT_WORD_LINES,SCC_20_SHORT_WORD_LINES,SCC_5_SHORT_WORD_LINES,SPF_HELO_NONE,SPF_NONE,TXREP,T_SCC_BODY_TEXT_LINE autolearn=ham autolearn_force=no version=3.4.6
X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org
List-Id: <gcc-patches.gcc.gnu.org>

--_000_MW5PR11MB59081BB834A297D19B0F5207A9469MW5PR11MB5908namp_
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: quoted-printable

Oops, forget to remove it in previous version, will wait a while and update=
 them together.

Pan

From: juzhe.zhong@rivai.ai <juzhe.zhong@rivai.ai>
Sent: Thursday, May 25, 2023 11:14 AM
To: Li, Pan2 <pan2.li@intel.com>; gcc-patches <gcc-patches@gcc.gnu.org>
Cc: Kito.cheng <kito.cheng@sifive.com>; Li, Pan2 <pan2.li@intel.com>; Wang,=
 Yanzhang <yanzhang.wang@intel.com>
Subject: Re: [PATCH v6] RISC-V: Using merge approach to optimize repeating =
sequence


* machmode.h (VECTOR_BOOL_MODE_P): New macro.

--- a/gcc/machmode.h

+++ b/gcc/machmode.h

@@ -134,6 +134,10 @@ extern const unsigned char mode_class[NUM_MACHINE_MODE=
S];

    || GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_ACCUM    \

    || GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_UACCUM)


+/* Nonzero if MODE is a vector bool mode.  */

+#define VECTOR_BOOL_MODE_P(MODE)                    \

+  (GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_BOOL)               \

+
Why do you add this? But no use. You should drop this.

________________________________
juzhe.zhong@rivai.ai<mailto:juzhe.zhong@rivai.ai>

From: pan2.li<mailto:pan2.li@intel.com>
Date: 2023-05-25 11:09
To: gcc-patches<mailto:gcc-patches@gcc.gnu.org>
CC: juzhe.zhong<mailto:juzhe.zhong@rivai.ai>; kito.cheng<mailto:kito.cheng@=
sifive.com>; pan2.li<mailto:pan2.li@intel.com>; yanzhang.wang<mailto:yanzha=
ng.wang@intel.com>
Subject: [PATCH v6] RISC-V: Using merge approach to optimize repeating sequ=
ence
From: Pan Li <pan2.li@intel.com<mailto:pan2.li@intel.com>>

This patch would like to optimize the VLS vector initialization like
repeating sequence. From the vslide1down to the vmerge with a simple
cost model, aka every instruction only has 1 cost.

Given code with -march=3Drv64gcv_zvl256b --param riscv-autovec-preference=
=3Dfixed-vlmax
typedef int64_t vnx32di __attribute__ ((vector_size (256)));

__attribute__ ((noipa)) void
f_vnx32di (int64_t a, int64_t b, int64_t *out)
{
  vnx32di v =3D {
    a, b, a, b, a, b, a, b,
    a, b, a, b, a, b, a, b,
    a, b, a, b, a, b, a, b,
    a, b, a, b, a, b, a, b,
  };
  *(vnx32di *) out =3D v;
}

Before this patch:
vslide1down.vx (x31 times)

After this patch:
li a5,-1431654400
addi a5,a5,-1365
li a3,-1431654400
addi a3,a3,-1366
slli a5,a5,32
add a5,a5,a3
vsetvli a4,zero,e64,m8,ta,ma
vmv.v.x v8,a0
vmv.s.x v0,a5
vmerge.vxm v8,v8,a1,v0
vs8r.v v8,0(a2)

Since we dont't have SEW =3D 128 in vec_duplicate, we can't combine ab into
SEW =3D 128 element and then broadcast this big element.

Signed-off-by: Pan Li <pan2.li@intel.com<mailto:pan2.li@intel.com>>
Co-Authored by: Juzhe-Zhong <juzhe.zhong@rivai.ai<mailto:juzhe.zhong@rivai.=
ai>>

gcc/ChangeLog:

* config/riscv/riscv-protos.h (enum insn_type): New type.
* config/riscv/riscv-v.cc (RVV_INSN_OPERANDS_MAX): New macro.
(rvv_builder::can_duplicate_repeating_sequence_p): Align the
referenced class member.
(rvv_builder::get_merged_repeating_sequence):
(rvv_builder::repeating_sequence_use_merge_profitable_p): New
function to evaluate the optimization cost.
(rvv_builder::get_merge_scalar_mask): New function to get the
merge mask.
(emit_scalar_move_insn): New function to emit vmv.s.x.
(emit_vlmax_integer_move_insn): New function to emit vlmax vmv.v.x.
(emit_nonvlmax_integer_move_insn): New function to emit nonvlmax
vmv.v.x.
(get_repeating_sequence_dup_machine_mode): New function to get
the dup machine mode.
(expand_vector_init_merge_repeating_sequence): New function to
perform the optimization.
(expand_vec_init): Add this vector init optimization.
* config/riscv/riscv.h (BITS_PER_WORD): New macro.
* machmode.h (VECTOR_BOOL_MODE_P): New macro.

gcc/testsuite/ChangeLog:

* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-1.c: New test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-2.c: New test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-3.c: New test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-4.c: New test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-5.c: New test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-run-1.c: New =
test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-run-2.c: New =
test.
* gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequence-run-3.c: New =
test.

Signed-off-by: Pan Li <pan2.li@intel.com<mailto:pan2.li@intel.com>>
---
gcc/config/riscv/riscv-protos.h               |   1 +
gcc/config/riscv/riscv-v.cc                   | 225 +++++++++++++++++-
gcc/config/riscv/riscv.h                      |   1 +
gcc/machmode.h                                |   4 +
.../vls-vlmax/init-repeat-sequence-1.c        |  21 ++
.../vls-vlmax/init-repeat-sequence-2.c        |  24 ++
.../vls-vlmax/init-repeat-sequence-3.c        |  25 ++
.../vls-vlmax/init-repeat-sequence-4.c        |  15 ++
.../vls-vlmax/init-repeat-sequence-5.c        |  17 ++
.../vls-vlmax/init-repeat-sequence-run-1.c    |  47 ++++
.../vls-vlmax/init-repeat-sequence-run-2.c    |  46 ++++
.../vls-vlmax/init-repeat-sequence-run-3.c    |  41 ++++
12 files changed, 461 insertions(+), 6 deletions(-)
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-1.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-2.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-3.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-4.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-5.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-run-1.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-run-2.c
create mode 100644 gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/ini=
t-repeat-sequence-run-3.c

diff --git a/gcc/config/riscv/riscv-protos.h b/gcc/config/riscv/riscv-proto=
s.h
index 36419c95bbd..768b646fec1 100644
--- a/gcc/config/riscv/riscv-protos.h
+++ b/gcc/config/riscv/riscv-protos.h
@@ -140,6 +140,7 @@ enum insn_type
   RVV_MERGE_OP =3D 4,
   RVV_CMP_OP =3D 4,
   RVV_CMP_MU_OP =3D RVV_CMP_OP + 2, /* +2 means mask and maskoff operand. =
 */
+  RVV_SCALAR_MOV_OP =3D 4,
};
enum vlmul_type
{
diff --git a/gcc/config/riscv/riscv-v.cc b/gcc/config/riscv/riscv-v.cc
index f71ad9e46a1..458020ce0a1 100644
--- a/gcc/config/riscv/riscv-v.cc
+++ b/gcc/config/riscv/riscv-v.cc
@@ -21,6 +21,10 @@
#define IN_TARGET_CODE 1
+/* We have a maximum of 11 operands for RVV instruction patterns according=
 to
+   the vector.md.  */
+#define RVV_INSN_OPERANDS_MAX 11
+
#include "config.h"
#include "system.h"
#include "coretypes.h"
@@ -1250,19 +1254,32 @@ public:
     : rtx_vector_builder (mode, npatterns, nelts_per_pattern)
   {
     m_inner_mode =3D GET_MODE_INNER (mode);
-    m_inner_size =3D GET_MODE_BITSIZE (m_inner_mode).to_constant ();
+    m_inner_bits_size =3D GET_MODE_BITSIZE (m_inner_mode);
+    m_inner_bytes_size =3D GET_MODE_SIZE (m_inner_mode);
+
+    gcc_assert (
+      int_mode_for_size (inner_bits_size (), 0).exists (&m_inner_int_mode)=
);
   }
   bool can_duplicate_repeating_sequence_p ();
   rtx get_merged_repeating_sequence ();
+  bool repeating_sequence_use_merge_profitable_p ();
+  rtx get_merge_scalar_mask (unsigned int) const;
+
   machine_mode new_mode () const { return m_new_mode; }
+  scalar_mode inner_mode () const { return m_inner_mode; }
+  scalar_int_mode inner_int_mode () const { return m_inner_int_mode; }
+  unsigned int inner_bits_size () const { return m_inner_bits_size; }
+  unsigned int inner_bytes_size () const { return m_inner_bytes_size; }
private:
-  machine_mode m_inner_mode;
+  scalar_mode m_inner_mode;
+  scalar_int_mode m_inner_int_mode;
   machine_mode m_new_mode;
   scalar_int_mode m_new_inner_mode;
-  unsigned int m_inner_size;
+  unsigned int m_inner_bits_size;
+  unsigned int m_inner_bytes_size;
};
/* Return true if the vector duplicated by a super element which is the fus=
ion
@@ -1273,7 +1290,7 @@ bool
rvv_builder::can_duplicate_repeating_sequence_p ()
{
   poly_uint64 new_size =3D exact_div (full_nelts (), npatterns ());
-  unsigned int new_inner_size =3D m_inner_size * npatterns ();
+  unsigned int new_inner_size =3D m_inner_bits_size * npatterns ();
   if (!int_mode_for_size (new_inner_size, 0).exists (&m_new_inner_mode)
       || GET_MODE_SIZE (m_new_inner_mode) > UNITS_PER_WORD
       || !get_vector_mode (m_new_inner_mode, new_size).exists (&m_new_mode=
))
@@ -1281,6 +1298,61 @@ rvv_builder::can_duplicate_repeating_sequence_p ()
   return repeating_sequence_p (0, full_nelts ().to_constant (), npatterns =
());
}
+/* Return true if it is a repeating sequence that using
+   merge approach has better codegen than using default
+   approach (slide1down).
+
+   Sequence A:
+     {a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b}
+
+   nelts =3D 16
+   npatterns =3D 2
+
+   for merging a we need mask 101010....
+   for merging b we need mask 010101....
+
+   Foreach element in the npattern, we need to build a mask in scalar regi=
ster.
+   Mostely we need 3 instructions (aka COST =3D 3), which is consist of 2 =
scalar
+   instruction and 1 scalar move to v0 register.  Finally we need vector m=
erge
+   to merge them.
+
+   lui a5, #imm
+   add a5, #imm
+   vmov.s.x v0, a5
+   vmerge.vxm v9, v9, a1, v0
+
+   So the overall (roughly) COST of Sequence A =3D (3 + 1) * npatterns =3D=
 8.
+   If we use slide1down, the COST =3D nelts =3D 16 > 8 (COST of merge).
+   So return true in this case as it is profitable.
+
+   Sequence B:
+     {a, b, c, d, e, f, g, h, a, b, c, d, e, f, g, h}
+
+   nelts =3D 16
+   npatterns =3D 8
+
+   COST of merge approach =3D (3 + 1) * npatterns =3D 24
+   COST of slide1down approach =3D nelts =3D 16
+   Return false in this case as it is NOT profitable in merge approach.
+*/
+bool
+rvv_builder::repeating_sequence_use_merge_profitable_p ()
+{
+  if (inner_bytes_size () > UNITS_PER_WORD)
+    return false;
+
+  unsigned int nelts =3D full_nelts ().to_constant ();
+
+  if (!repeating_sequence_p (0, nelts, npatterns ()))
+    return false;
+
+  unsigned int merge_cost =3D 1;
+  unsigned int build_merge_mask_cost =3D 3;
+  unsigned int slide1down_cost =3D nelts;
+
+  return (build_merge_mask_cost + merge_cost) * npatterns () < slide1down_=
cost;
+}
+
/* Merge the repeating sequence into a single element and return the RTX.  =
*/
rtx
rvv_builder::get_merged_repeating_sequence ()
@@ -1288,11 +1360,11 @@ rvv_builder::get_merged_repeating_sequence ()
   scalar_int_mode mode =3D Pmode;
   rtx target =3D gen_reg_rtx (mode);
   emit_move_insn (target, const0_rtx);
-  rtx imm =3D gen_int_mode ((1ULL << m_inner_size) - 1, mode);
+  rtx imm =3D gen_int_mode ((1ULL << m_inner_bits_size) - 1, mode);
   /* { a, b, a, b }: Generate duplicate element =3D b << bits | a.  */
   for (unsigned int i =3D 0; i < npatterns (); i++)
     {
-      unsigned int loc =3D m_inner_size * i;
+      unsigned int loc =3D m_inner_bits_size * i;
       rtx shift =3D gen_int_mode (loc, mode);
       rtx ele =3D gen_lowpart (mode, elt (i));
       rtx tmp =3D expand_simple_binop (mode, AND, ele, imm, NULL_RTX, fals=
e,
@@ -1308,6 +1380,29 @@ rvv_builder::get_merged_repeating_sequence ()
   return target;
}
+/* Get the mask for merge approach.
+
+   Consider such following case:
+     {a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b}
+   To merge "a", the mask should be 1010....
+   To merge "b", the mask should be 0101....
+*/
+rtx
+rvv_builder::get_merge_scalar_mask (unsigned int index_in_pattern) const
+{
+  unsigned HOST_WIDE_INT mask =3D 0;
+  unsigned HOST_WIDE_INT base_mask =3D (1ULL << index_in_pattern);
+
+  gcc_assert (BITS_PER_WORD % npatterns () =3D=3D 0);
+
+  int limit =3D BITS_PER_WORD / npatterns ();
+
+  for (int i =3D 0; i < limit; i++)
+    mask |=3D base_mask << (i * npatterns ());
+
+  return gen_int_mode (mask, inner_int_mode ());
+}
+
/* Subroutine of riscv_vector_expand_vector_init.
    Works as follows:
    (a) Initialize TARGET by broadcasting element NELTS_REQD - 1 of BUILDER.
@@ -1335,6 +1430,111 @@ expand_vector_init_insert_elems (rtx target, const =
rvv_builder &builder,
     }
}
+/* Emit vmv.s.x instruction.  */
+
+static void
+emit_scalar_move_insn (unsigned icode, rtx *ops)
+{
+  machine_mode data_mode =3D GET_MODE (ops[0]);
+  machine_mode mask_mode =3D get_mask_mode (data_mode).require ();
+  insn_expander<RVV_INSN_OPERANDS_MAX> e (riscv_vector::RVV_SCALAR_MOV_OP,
+   /* HAS_DEST_P */ true,
+   /* FULLY_UNMASKED_P */ false,
+   /* USE_REAL_MERGE_P */ true,
+   /* HAS_AVL_P */ true,
+   /* VLMAX_P */ false,
+   data_mode, mask_mode);
+  e.set_policy (TAIL_ANY);
+  e.set_policy (MASK_ANY);
+  e.set_vl (CONST1_RTX (Pmode));
+  e.emit_insn ((enum insn_code) icode, ops);
+}
+
+/* Emit vmv.v.x instruction with vlmax.  */
+
+static void
+emit_vlmax_integer_move_insn (unsigned icode, rtx *ops, rtx vl)
+{
+  emit_vlmax_insn (icode, riscv_vector::RVV_UNOP, ops, vl);
+}
+
+/* Emit vmv.v.x instruction with nonvlmax.  */
+
+static void
+emit_nonvlmax_integer_move_insn (unsigned icode, rtx *ops, rtx avl)
+{
+  emit_nonvlmax_insn (icode, riscv_vector::RVV_UNOP, ops, avl);
+}
+
+/* Emit merge instruction.  */
+
+static machine_mode
+get_repeating_sequence_dup_machine_mode (const rvv_builder &builder)
+{
+  poly_uint64 dup_nunits =3D GET_MODE_NUNITS (builder.mode ());
+
+  if (known_ge (GET_MODE_SIZE (builder.mode ()), BYTES_PER_RISCV_VECTOR))
+    {
+      dup_nunits =3D exact_div (BYTES_PER_RISCV_VECTOR,
+ builder.inner_bytes_size ());
+    }
+
+  return get_vector_mode (builder.inner_int_mode (), dup_nunits).require (=
);
+}
+
+/* Use merge approach to initialize the vector with repeating sequence.
+   v =3D {a, b, a, b, a, b, a, b}.
+
+   v =3D broadcast (a).
+   mask =3D 0b01010101....
+   v =3D merge (v, b, mask)
+*/
+static void
+expand_vector_init_merge_repeating_sequence (rtx target,
+      const rvv_builder &builder)
+{
+  machine_mode dup_mode =3D get_repeating_sequence_dup_machine_mode (build=
er);
+  machine_mode dup_mask_mode =3D get_mask_mode (dup_mode).require ();
+  machine_mode mask_mode =3D get_mask_mode (builder.mode ()).require ();
+  uint64_t full_nelts =3D builder.full_nelts ().to_constant ();
+
+  /* Step 1: Broadcast the first pattern.  */
+  rtx ops[] =3D {target, force_reg (GET_MODE_INNER (dup_mode), builder.elt=
 (0))};
+  emit_vlmax_integer_move_insn (code_for_pred_broadcast (builder.mode ()),
+ ops, NULL_RTX);
+
+  /* Step 2: Merge the rest iteration of pattern.  */
+  for (unsigned int i =3D 1; i < builder.npatterns (); i++)
+    {
+      /* Step 2-1: Generate mask register v0 for each merge.  */
+      rtx merge_mask =3D builder.get_merge_scalar_mask (i);
+      rtx mask =3D gen_reg_rtx (mask_mode);
+      rtx dup =3D gen_reg_rtx (dup_mode);
+
+      if (full_nelts <=3D BITS_PER_WORD) /* vmv.s.x.  */
+ {
+   rtx ops[] =3D {dup, gen_scalar_move_mask (dup_mask_mode),
+     RVV_VUNDEF (dup_mode), merge_mask};
+   emit_scalar_move_insn (code_for_pred_broadcast (GET_MODE (dup)),
+ ops);
+ }
+      else /* vmv.v.x.  */
+ {
+   rtx ops[] =3D {dup, force_reg (GET_MODE_INNER (dup_mode), merge_mask)};
+   rtx vl =3D gen_int_mode (CEIL (full_nelts, BITS_PER_WORD), Pmode);
+   emit_nonvlmax_integer_move_insn (code_for_pred_broadcast (dup_mode),
+    ops, vl);
+ }
+
+      emit_move_insn (mask, gen_lowpart (mask_mode, dup));
+
+      /* Step 2-2: Merge pattern according to the mask.  */
+      rtx ops[] =3D {target, target, builder.elt (i), mask};
+      emit_vlmax_merge_insn (code_for_pred_merge_scalar (GET_MODE (target)=
),
+      riscv_vector::RVV_MERGE_OP, ops);
+    }
+}
+
/* Initialize register TARGET from the elements in PARALLEL rtx VALS.  */
void
@@ -1358,6 +1558,19 @@ expand_vec_init (rtx target, rtx vals)
  emit_move_insn (target, gen_lowpart (mode, dup));
  return;
}
+
+      /* Case 2: Optimize repeating sequence cases that Case 1 can
+ not handle and it is profitable.  For example:
+ ELEMENT BITSIZE =3D 64.
+ v =3D {a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b}.
+ We can't find a vector mode for "ab" which will be combined into
+ 128-bit element to duplicate.  */
+      if (v.repeating_sequence_use_merge_profitable_p ())
+ {
+   expand_vector_init_merge_repeating_sequence (target, v);
+   return;
+ }
+
       /* TODO: We will support more Initialization of vector in the future=
.  */
     }
diff --git a/gcc/config/riscv/riscv.h b/gcc/config/riscv/riscv.h
index 807b0bccc18..4541255a8ae 100644
--- a/gcc/config/riscv/riscv.h
+++ b/gcc/config/riscv/riscv.h
@@ -150,6 +150,7 @@ ASM_MISA_SPEC
/* Width of a word, in units (bytes).  */
#define UNITS_PER_WORD (TARGET_64BIT ? 8 : 4)
+#define BITS_PER_WORD (BITS_PER_UNIT * UNITS_PER_WORD)
#ifndef IN_LIBGCC2
#define MIN_UNITS_PER_WORD 4
#endif
diff --git a/gcc/machmode.h b/gcc/machmode.h
index a22df60dc20..7d437ac33e8 100644
--- a/gcc/machmode.h
+++ b/gcc/machmode.h
@@ -134,6 +134,10 @@ extern const unsigned char mode_class[NUM_MACHINE_MODE=
S];
    || GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_ACCUM \
    || GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_UACCUM)
+/* Nonzero if MODE is a vector bool mode.  */
+#define VECTOR_BOOL_MODE_P(MODE) \
+  (GET_MODE_CLASS (MODE) =3D=3D MODE_VECTOR_BOOL) \
+
/* Nonzero if MODE is a scalar integral mode.  */
#define SCALAR_INT_MODE_P(MODE) \
   (GET_MODE_CLASS (MODE) =3D=3D MODE_INT \
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-1.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init=
-repeat-sequence-1.c
new file mode 100644
index 00000000000..59ad49cf795
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-1.c
@@ -0,0 +1,21 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=3Drv64gcv_zvl1024b -mabi=3Dlp64d" } */
+
+#include <stdint-gcc.h>
+
+typedef int64_t vnx16di __attribute__ ((vector_size (1024)));
+
+__attribute__ ((noipa)) void
+f_vnx16di (int64_t a, int64_t b, int64_t *out)
+{
+  vnx16di v =3D {
+    a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b=
, a, b, a, b, a, b, a, b,
+    a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b=
, a, b, a, b, a, b, a, b,
+    a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b=
, a, b, a, b, a, b, a, b,
+    a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b=
, a, b, a, b, a, b, a, b,
+  };
+  *(vnx16di *) out =3D v;
+}
+
+/* { dg-final { scan-assembler-times {vmv\.v\.x\s+v[0-9]+,\s*[a-x0-9]+} 2 =
} } */
+/* { dg-final { scan-assembler-times {vmerge\.vxm\s+v[0-9]+,\s*v[0-9]+,\s*=
[a-x0-9]+,\s*v0} 1 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-2.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init=
-repeat-sequence-2.c
new file mode 100644
index 00000000000..fe3741e3be7
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-2.c
@@ -0,0 +1,24 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=3Drv64gcv -mabi=3Dlp64d" } */
+
+#include <stdint-gcc.h>
+
+typedef double vnx8df __attribute__ ((vector_size (64)));
+typedef double vnx16df __attribute__ ((vector_size (128)));
+
+__attribute__ ((noipa)) void
+f_vnx8df (double a, double b, double *out)
+{
+  vnx8df v =3D {a, b, a, b, a, b, a, b};
+  *(vnx8df *) out =3D v;
+}
+
+__attribute__ ((noipa)) void
+f_vnx16df (double a, double b, double *out)
+{
+  vnx16df v =3D {a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b};
+  *(vnx16df *) out =3D v;
+}
+
+/* { dg-final { scan-assembler-times {vmv\.s\.x\tv[0-9]+,\s*[a-x0-9]+} 1 }=
 } */
+/* { dg-final { scan-assembler-times {vfmerge\.vfm\tv[0-9]+,\s*v[0-9]+,\s*=
[a-x0-9]+,\s*v0} 1 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-3.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init=
-repeat-sequence-3.c
new file mode 100644
index 00000000000..74776def963
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-3.c
@@ -0,0 +1,25 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=3Drv64gcv -mabi=3Dlp64d" } */
+
+#include <stdint-gcc.h>
+
+typedef int64_t vnx8di __attribute__ ((vector_size (64)));
+typedef int64_t vnx16di __attribute__ ((vector_size (128)));
+
+__attribute__ ((noipa)) void
+f_vnx8di (int64_t a, int64_t b, int64_t *out)
+{
+  vnx8di v =3D {a, b, a, b, a, b, a, b};
+  *(vnx8di *) out =3D v;
+}
+
+__attribute__ ((noipa)) void
+f_vnx16di (int64_t a, int64_t b, int64_t *out)
+{
+  vnx16di v =3D {a, b, a, b, a, b, a, b, a, b, a, b, a, b, a, b};
+  *(vnx16di *) out =3D v;
+}
+
+
+/* { dg-final { scan-assembler-times {vmv\.s\.x\tv[0-9]+,\s*[a-x0-9]+} 1 }=
 } */
+/* { dg-final { scan-assembler-times {vmerge\.vxm\tv[0-9]+,\s*v[0-9]+,\s*[=
a-x0-9]+,\s*v0} 1 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-4.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init=
-repeat-sequence-4.c
new file mode 100644
index 00000000000..2f61465e84f
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-4.c
@@ -0,0 +1,15 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=3Drv64gcv -mabi=3Dlp64d" } */
+
+#include <stdint-gcc.h>
+
+typedef int64_t vnx8di __attribute__ ((vector_size (64)));
+
+__attribute__ ((noipa)) void
+f_vnx8di (int64_t a, int64_t b, int64_t c, int64_t d, int64_t *out)
+{
+  vnx8di v =3D {a, b, c, d, a, b, c, d};
+  *(vnx8di *) out =3D v;
+}
+
+/* { dg-final { scan-assembler-times {vslide1down\.vx\tv[0-9]+,\s*v[0-9]+,=
\s*[a-x0-9]+} 7 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-5.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init=
-repeat-sequence-5.c
new file mode 100644
index 00000000000..7f4e6783f8e
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-5.c
@@ -0,0 +1,17 @@
+/* { dg-do compile } */
+/* { dg-additional-options "-march=3Drv64gcv -mabi=3Dlp64d" } */
+
+#include <stdint-gcc.h>
+
+typedef int64_t vnx16di __attribute__ ((vector_size (128)));
+
+__attribute__ ((noipa)) void
+f_vnx16di (int64_t a, int64_t b, int64_t c, int64_t d, int64_t *out)
+{
+  vnx16di v =3D {a, b, c, d, a, b, c, d, a, b, c, d, a, b, c, d,};
+  *(vnx16di *) out =3D v;
+}
+
+/* { dg-final { scan-assembler-times {vmv\.v\.x\tv[0-9]+,\s*[a-x0-9]+} 1 }=
 } */
+/* { dg-final { scan-assembler-times {vmv\.s\.x\tv[0-9]+,\s*[a-x0-9]+} 0 }=
 } */
+/* { dg-final { scan-assembler-times {vmerge\.vxm\tv[0-9]+,\s*v[0-9]+,\s*[=
a-x0-9]+,\s*v0} 0 } } */
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-run-1.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/=
init-repeat-sequence-run-1.c
new file mode 100644
index 00000000000..1931d3f5fa0
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-run-1.c
@@ -0,0 +1,47 @@
+/* { dg-do run { target { riscv_vector } } } */
+/* { dg-options "--param riscv-autovec-preference=3Dfixed-vlmax -O3" } */
+
+#include "init-repeat-sequence-2.c"
+
+int
+main ()
+{
+  double a =3D -1789089.23423;
+  double b =3D -8916156.45644;
+
+  double v_vnx8df[sizeof (vnx8df) / sizeof (double)];
+  f_vnx8df (a, b, v_vnx8df);
+
+  return 0;
+  for (int i =3D 0; i < sizeof (vnx8df) / sizeof (double); i++)
+    {
+      if (i % 2 =3D=3D 0)
+ {
+   if (v_vnx8df[i] !=3D a)
+     __builtin_abort ();
+ }
+      else
+ {
+   if (v_vnx8df[i] !=3D b)
+     __builtin_abort ();
+ }
+    }
+
+  double v_vnx16df[sizeof (vnx16df) / sizeof (double)];
+  f_vnx16df (a, b, v_vnx16df);
+  for (int i =3D 0; i < sizeof (vnx16df) / sizeof (double); i++)
+    {
+      if (i % 2 =3D=3D 0)
+ {
+   if (v_vnx16df[i] !=3D a)
+     __builtin_abort ();
+ }
+      else
+ {
+   if (v_vnx16df[i] !=3D b)
+     __builtin_abort ();
+ }
+    }
+
+  return 0;
+}
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-run-2.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/=
init-repeat-sequence-run-2.c
new file mode 100644
index 00000000000..5564dd4a05a
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-run-2.c
@@ -0,0 +1,46 @@
+/* { dg-do run { target { riscv_vector } } } */
+/* { dg-options "--param riscv-autovec-preference=3Dfixed-vlmax -O3" } */
+
+#include "init-repeat-sequence-3.c"
+
+int
+main ()
+{
+  int64_t a =3D -178908923423;
+  int64_t b =3D -891615645644;
+
+  int64_t v_vnx8di[sizeof (vnx8di) / sizeof (int64_t)];
+  f_vnx8di (a, b, v_vnx8di);
+  for (int i =3D 0; i < sizeof (vnx8di) / sizeof (int64_t); i++)
+    {
+      if (i % 2 =3D=3D 0)
+ {
+   if (v_vnx8di[i] !=3D a)
+     __builtin_abort ();
+ }
+      else
+ {
+   if (v_vnx8di[i] !=3D b)
+     __builtin_abort ();
+ }
+    }
+
+  int64_t v_vnx16di[sizeof (vnx16di) / sizeof (int64_t)];
+  f_vnx16di (a, b, v_vnx16di);
+
+  for (int i =3D 0; i < sizeof (vnx16di) / sizeof (int64_t); i++)
+    {
+      if (i % 2 =3D=3D 0)
+ {
+   if (v_vnx16di[i] !=3D a)
+     __builtin_abort ();
+ }
+      else
+ {
+   if (v_vnx16di[i] !=3D b)
+     __builtin_abort ();
+ }
+    }
+
+  return 0;
+}
diff --git a/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repe=
at-sequence-run-3.c b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/=
init-repeat-sequence-run-3.c
new file mode 100644
index 00000000000..fec5adc56de
--- /dev/null
+++ b/gcc/testsuite/gcc.target/riscv/rvv/autovec/vls-vlmax/init-repeat-sequ=
ence-run-3.c
@@ -0,0 +1,41 @@
+/* { dg-do run { target { riscv_vector } } } */
+/* { dg-options "--param riscv-autovec-preference=3Dfixed-vlmax -O3" } */
+
+#include "init-repeat-sequence-5.c"
+
+int
+main ()
+{
+  int64_t a =3D -178908923423;
+  int64_t b =3D -891615645644;
+  int64_t c =3D 78908923423;
+  int64_t d =3D 81615645644;
+
+  int64_t v_vnx16di[sizeof (vnx16di) / sizeof (int64_t)];
+  f_vnx16di (a, b, c, d, v_vnx16di);
+  for (int i =3D 0; i < sizeof (vnx16di) / sizeof (int64_t); i++)
+    {
+      if (i % 4 =3D=3D 0)
+ {
+   if (v_vnx16di[i] !=3D a)
+     __builtin_abort ();
+ }
+      else if (i % 4 =3D=3D 1)
+ {
+   if (v_vnx16di[i] !=3D b)
+     __builtin_abort ();
+ }
+      else if (i % 4 =3D=3D 2)
+ {
+   if (v_vnx16di[i] !=3D c)
+     __builtin_abort ();
+ }
+      else
+ {
+   if (v_vnx16di[i] !=3D d)
+     __builtin_abort ();
+ }
+    }
+
+  return 0;
+}
--
2.34.1


--_000_MW5PR11MB59081BB834A297D19B0F5207A9469MW5PR11MB5908namp_--