From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Received: from EUR03-DBA-obe.outbound.protection.outlook.com (mail-dbaeur03on2048.outbound.protection.outlook.com [40.107.104.48]) by sourceware.org (Postfix) with ESMTPS id A9C1D3858D37 for ; Fri, 28 Apr 2023 16:51:39 +0000 (GMT) DMARC-Filter: OpenDMARC Filter v1.4.2 sourceware.org A9C1D3858D37 Authentication-Results: sourceware.org; dmarc=pass (p=none dis=none) header.from=arm.com Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=armh.onmicrosoft.com; s=selector2-armh-onmicrosoft-com; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=tbaeQ1lDLP3c9Wat9Aj0Olig6uPDP4Q86iXzlRgwUi8=; b=BzejmA/NA5LTt/cnD6Fa7ZDwZ7lmWOhJnI7RPGj7U3KxAJ7CNIinFF/+GLEF4KeNZIiNtQMZ9rIc5aXvGm9LRKDkEIBO6YxoBV6s6kxQXjTuHiHbqcZKRpEZxYKEAwEobsFagO6jzuIo7+UkUPiDaI7yduFIIrXH/CvQciWDGWE= Received: from DUZP191CA0038.EURP191.PROD.OUTLOOK.COM (2603:10a6:10:4f8::22) by GV1PR08MB7778.eurprd08.prod.outlook.com (2603:10a6:150:56::9) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.6340.22; Fri, 28 Apr 2023 16:51:25 +0000 Received: from DBAEUR03FT030.eop-EUR03.prod.protection.outlook.com (2603:10a6:10:4f8:cafe::21) by DUZP191CA0038.outlook.office365.com (2603:10a6:10:4f8::22) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.6340.24 via Frontend Transport; Fri, 28 Apr 2023 16:51:25 +0000 X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123) smtp.mailfrom=arm.com; dkim=pass (signature was verified) header.d=armh.onmicrosoft.com;dmarc=pass action=none header.from=arm.com; Received-SPF: Pass (protection.outlook.com: domain of arm.com designates 63.35.35.123 as permitted sender) receiver=protection.outlook.com; client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com; pr=C Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by DBAEUR03FT030.mail.protection.outlook.com (100.127.142.197) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.6340.23 via Frontend Transport; Fri, 28 Apr 2023 16:51:25 +0000 Received: ("Tessian outbound 5bb4c51d5a1f:v136"); Fri, 28 Apr 2023 16:51:25 +0000 X-CheckRecipientChecked: true X-CR-MTA-CID: 99edca5db396f587 X-CR-MTA-TID: 64aa7808 Received: from 479b88def5d9.1 by 64aa7808-outbound-1.mta.getcheckrecipient.com id F00ACE4C-0CFF-47CF-B2BE-8FA97C89F0EF.1; Fri, 28 Apr 2023 16:51:17 +0000 Received: from EUR04-DB3-obe.outbound.protection.outlook.com by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id 479b88def5d9.1 (version=TLSv1.2 cipher=ECDHE-RSA-AES256-GCM-SHA384); Fri, 28 Apr 2023 16:51:17 +0000 ARC-Seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=WvH47PAqYrmmWitKBq3abkO0gPfNuQjGfg2WlhWO4pZXoArxt2QgeJeSHv+01MCNC2nzB2BI0CAHpjHjIwKWezEiin02yjCh248TnAuw61O64mXsYT/ewckv7Jd6Jblig9e/6FZV5yD13ImrM5CZS9EjV0XeCQFuxIwAiZ7bcRc2x8U9ePxQ3yzFUYBuABu5M0JUinGEAqC3d1FoCfI1M7XY6VB8s+ftnHU1LwCnb1IPuWOgLsc9ePPSXF0a83rqyzNjCPHdoxt+uYQnFpRLr4a1CQE38HDifeUSaeWQ5+cLI8Fk6JTk3CLZakDbe08UC7V7OJ+o+RmqpFMOtqT3SA== ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1; bh=tbaeQ1lDLP3c9Wat9Aj0Olig6uPDP4Q86iXzlRgwUi8=; b=MNQWaIikd1tx0A5/NvF0RvDjzMh9L5xDTcDC/1n9tMxC/YEkYk5GkpGMdQTb1bo6AcqHPCzLCYeNMqIL7LrHvgpuhR/PfGxZ4X0hgt062/a1SxMBjguptqpYpcNniflfuEFXQi8jPqrs7SCKSqU/j8gFiwmoe+H72MG8Y3LsJDjr1gCCSzDdBQMB+HiGECTUzqXLlP4waQSkSHnGjNC8nE8nkUOLoBUg+SbX+0QrltwqqfiQOul2dEUZSCHWITkMkRq4PHzCaEJcSF5nL2Ek10g0cSZ5k1uXzp+gj+LF00vucd0jzFG+uE+4Xwnc5wF2dUYXZ8Ba+NVIFrOPphghzw== ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=arm.com; dmarc=pass action=none header.from=arm.com; dkim=pass header.d=arm.com; arc=none DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=armh.onmicrosoft.com; s=selector2-armh-onmicrosoft-com; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=tbaeQ1lDLP3c9Wat9Aj0Olig6uPDP4Q86iXzlRgwUi8=; b=BzejmA/NA5LTt/cnD6Fa7ZDwZ7lmWOhJnI7RPGj7U3KxAJ7CNIinFF/+GLEF4KeNZIiNtQMZ9rIc5aXvGm9LRKDkEIBO6YxoBV6s6kxQXjTuHiHbqcZKRpEZxYKEAwEobsFagO6jzuIo7+UkUPiDaI7yduFIIrXH/CvQciWDGWE= Received: from PAXPR08MB6926.eurprd08.prod.outlook.com (2603:10a6:102:138::24) by DBBPR08MB6092.eurprd08.prod.outlook.com (2603:10a6:10:20e::21) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.6340.23; Fri, 28 Apr 2023 16:51:04 +0000 Received: from PAXPR08MB6926.eurprd08.prod.outlook.com ([fe80::db73:66ba:ae70:1ff1]) by PAXPR08MB6926.eurprd08.prod.outlook.com ([fe80::db73:66ba:ae70:1ff1%3]) with mapi id 15.20.6340.024; Fri, 28 Apr 2023 16:51:04 +0000 From: Kyrylo Tkachov To: Andrea Corallo , "gcc-patches@gcc.gnu.org" CC: Richard Earnshaw , Stam Markianos-Wright Subject: RE: [PATCH 07/10] arm: Fix MVE header pointer overloads this time (and a bit more tidying) Thread-Topic: [PATCH 07/10] arm: Fix MVE header pointer overloads this time (and a bit more tidying) Thread-Index: AQHZecT7gqu4Oj2Neke+rP99bOOhqq9A74+Q Date: Fri, 28 Apr 2023 16:51:04 +0000 Message-ID: References: <20230428113002.482343-1-andrea.corallo@arm.com> <20230428113002.482343-7-andrea.corallo@arm.com> In-Reply-To: <20230428113002.482343-7-andrea.corallo@arm.com> Accept-Language: en-GB, en-US Content-Language: en-US X-MS-Has-Attach: X-MS-TNEF-Correlator: Authentication-Results-Original: dkim=none (message not signed) header.d=none;dmarc=none action=none header.from=arm.com; x-ms-traffictypediagnostic: PAXPR08MB6926:EE_|DBBPR08MB6092:EE_|DBAEUR03FT030:EE_|GV1PR08MB7778:EE_ X-MS-Office365-Filtering-Correlation-Id: 84726e14-ec01-4f2e-0934-08db4808cde9 x-checkrecipientrouted: true nodisclaimer: true X-MS-Exchange-SenderADCheck: 1 X-MS-Exchange-AntiSpam-Relay: 0 X-Microsoft-Antispam-Untrusted: BCL:0; X-Microsoft-Antispam-Message-Info-Original: j78fxfjfPlTLYTkTc6nN7fV9yl6ZEo93CXL1XxEnIQxOqh5V1OqRd4fN9GyRVX/+jQaMcnhR7Ef7ZF5JeqqLYvUcgFe5aZ2l4TafTnt03Fq/Oj5c2ZFSRNjT7sePJkTVoOKFcX0RaNmx9yTZV3xzFtdqQxzk/qWVhoW77Yoec1aqPH+XWcNLhuvwFBIPl5PDgQyqJFROKyVrL+U0w5IHfEcOMpEs6SGx9m3ZThGT589Ix34v6rSKOTynvJd77uUI8iqeLoD5Z7n6mqc4/5YkcR4sJDCu2qV890WJkAb/Yq+UQWauRo5QUeYnNKsw/GPXmtR9rEzbUCAGY4XodYuvfth+uTv7HoeGKxDlBEGajnZxE5I5WxgLkyGp3Ltd/3dwGHruCwnvkcpmvS+G2ncP9Lsqepg0waQM7vRencfleREaBVKMLzLRUeNTujluXb39sz1LapcilHB+htPkDqedpCeHArGSkLZOkh59Bvzygd1VVTy/N/RQTWPBMfePIiN4P8uitJ7CEqnEUJzFkD0j92RJ98BEAk3f+vfYZhThU2cQQywoZlQVRpHLUikP3mDOAxYjjJUOkSw8wVNzS5mf/7c/pOhwMGQQNss1gjwb7tAFCKLHuSc7o8tzsHrSyWcAXU5x+3O72LRYFeSlYVlVfj9xm522Bh73lCpByeH8u7Y= X-Forefront-Antispam-Report-Untrusted: CIP:255.255.255.255;CTRY:;LANG:en;SCL:1;SRV:;IPV:NLI;SFV:NSPM;H:PAXPR08MB6926.eurprd08.prod.outlook.com;PTR:;CAT:NONE;SFS:(13230028)(4636009)(376002)(346002)(39860400002)(396003)(136003)(366004)(451199021)(110136005)(54906003)(478600001)(52536014)(5660300002)(8676002)(8936002)(86362001)(38070700005)(2906002)(30864003)(33656002)(76116006)(64756008)(66446008)(66946007)(55016003)(66476007)(66556008)(4326008)(316002)(38100700002)(41300700001)(122000001)(53546011)(9686003)(55236004)(6506007)(83380400001)(26005)(84970400001)(186003)(71200400001)(7696005)(559001)(579004)(357404004);DIR:OUT;SFP:1101; Content-Type: text/plain; charset="us-ascii" Content-Transfer-Encoding: quoted-printable MIME-Version: 1.0 X-MS-Exchange-Transport-CrossTenantHeadersStamped: DBBPR08MB6092 Original-Authentication-Results: dkim=none (message not signed) header.d=none;dmarc=none action=none header.from=arm.com; X-EOPAttributedMessage: 0 X-MS-Exchange-Transport-CrossTenantHeadersStripped: DBAEUR03FT030.eop-EUR03.prod.protection.outlook.com X-MS-PublicTrafficType: Email X-MS-Office365-Filtering-Correlation-Id-Prvs: 972d01df-79cc-48da-9446-08db4808c164 X-Microsoft-Antispam: BCL:0; X-Microsoft-Antispam-Message-Info: omPe15dwkyLc5HGQha9iEFkIUr3x5fFhC1F3kQPjUz7ocLae+Lvn4ov+w4s5ktasL4zoZHeCheoOuFGtxHsfyWiBoIAwfYzcLmp2WhCp0YdNKNuoJKTVVOV1FO03q/z1ZlCGNmSUta443NGNOykSpudfm8Sz8cJJISekG0Y6+HFh7yi600SScR2o6msDJ3XPK3NRE8Zh+NsKLyZYywp9pD1MQ3GOUN1/5ngzhZEMR1PaLBfgpRGeua13r6h3JTStGsc1qH91EtAsAQDuMSKvz6m+Fs5P+ZfMZ8THDSK8Z4JttCG5yJ9NApPObhkDWG8SeUK25O5STYLrCjHi+gdOMUdz5a8ZwSCl2VApPH+hwW4dIVmmQVF7PSdDsBRkIIHk8nColFN71IsafAaMlEqCl9G+W4v9OqTBAg8DrOiqQGfjCIsHvjzZEXjxgzIobJkdnxp1SDNi9V+pjU/r6vwCG0RISN7GT1LvHe9PD6+RmvfE8hxmaoi68T1YQqEVaJULz3MEPDDCasAqNgBWbQkmlpXoJbXGOCKKOzRXO0XuqOcEoM4ohVgmlTIuR2wuM+ikr6jjiZ6OuB/q+P2ehnRA+hlw6dql6jVgsxtFPTRJTXK4URcts1yuFals/7OE/hp3REJgxSmlwaNf3JGVuYDxeLyOKhZHlMVhTCzHtjWOYDkNv33/oH0BoStbwguuT6NL8hFFv/kWeVtjCR1WUff4DVspdMwcfh9p3Yp9yjK5fzRtj0qbROarUm3Cb9y2ZZmOkGgxHZV4nXy72GGVJAKgIcSPZAvxC7Ys/5fcK5EO1p0= X-Forefront-Antispam-Report: CIP:63.35.35.123;CTRY:IE;LANG:en;SCL:1;SRV:;IPV:CAL;SFV:NSPM;H:64aa7808-outbound-1.mta.getcheckrecipient.com;PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com;CAT:NONE;SFS:(13230028)(4636009)(396003)(346002)(136003)(376002)(39860400002)(451199021)(36840700001)(40470700004)(46966006)(86362001)(82310400005)(33656002)(2906002)(30864003)(84970400001)(40460700003)(52536014)(40480700001)(55016003)(7696005)(36860700001)(34020700004)(53546011)(47076005)(186003)(336012)(83380400001)(9686003)(26005)(6506007)(110136005)(70586007)(4326008)(356005)(70206006)(82740400003)(478600001)(5660300002)(81166007)(54906003)(8676002)(316002)(8936002)(41300700001)(559001)(579004)(357404004);DIR:OUT;SFP:1101; X-OriginatorOrg: arm.com X-MS-Exchange-CrossTenant-OriginalArrivalTime: 28 Apr 2023 16:51:25.4596 (UTC) X-MS-Exchange-CrossTenant-Network-Message-Id: 84726e14-ec01-4f2e-0934-08db4808cde9 X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d;Ip=[63.35.35.123];Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com] X-MS-Exchange-CrossTenant-AuthSource: DBAEUR03FT030.eop-EUR03.prod.protection.outlook.com X-MS-Exchange-CrossTenant-AuthAs: Anonymous X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem X-MS-Exchange-Transport-CrossTenantHeadersStamped: GV1PR08MB7778 X-Spam-Status: No, score=-11.9 required=5.0 tests=BAYES_00,DKIM_SIGNED,DKIM_VALID,GIT_PATCH_0,KAM_DMARC_NONE,KAM_SHORT,RCVD_IN_DNSWL_NONE,RCVD_IN_MSPIKE_H2,SPF_HELO_NONE,SPF_NONE,TXREP,T_SCC_BODY_TEXT_LINE,UNPARSEABLE_RELAY autolearn=ham autolearn_force=no version=3.4.6 X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org List-Id: > -----Original Message----- > From: Andrea Corallo > Sent: Friday, April 28, 2023 12:30 PM > To: gcc-patches@gcc.gnu.org > Cc: Kyrylo Tkachov ; Richard Earnshaw > ; Stam Markianos-Wright Wright@arm.com> > Subject: [PATCH 07/10] arm: Fix MVE header pointer overloads this time (a= nd > a bit more tidying) >=20 > From: Stam Markianos-Wright >=20 > Hi all, >=20 > Previously we had fixed the overloading of scalar arguments to intrinsics > with the introduction of a new `__ARM_mve_coerce3` _ Generic association. > This allowed users to give types other than int32_t, e.g. int, short, lon= g, > etc., which previously would emit a nonsensical error message from the > _Generic. >=20 > Here I adjust that handling slightly and I am also doing the same thing, = but > for pointer types: > (un)signed char* can be now used instead of (u)int8_t* > (un)signed short* can be now used instead of (u)int16_t* > (un)signed int* and long* can be now used instead of (u)int32_t* > (un)signed long long* can be now used instead of (u)int64_t* > __fp16* and _Float16* can be now used instead of float16_t* > float* can be now used instead of float32_t* >=20 > This required me to break down the _coerce_ generics for the specific > pointer types. > On the scalar types, the change in this patch is minor, renaming the > _coerce_ generics and passing all scalars through the `__typeof` for > consistency with each-other. >=20 Ok. Thanks, Kyrill > No test regressions in the GCC testsuite or CMSIS-NN. >=20 > * config/arm/arm_mve.h: (__ARM_mve_typeid): Add more pointer > types. > (__ARM_mve_coerce1): Remove. > (__ARM_mve_coerce2): Remove. > (__ARM_mve_coerce3): Remove. > (__ARM_mve_coerce_i_scalar): New. > (__ARM_mve_coerce_s8_ptr): New. > (__ARM_mve_coerce_u8_ptr): New. > (__ARM_mve_coerce_s16_ptr): New. > (__ARM_mve_coerce_u16_ptr): New. > (__ARM_mve_coerce_s32_ptr): New. > (__ARM_mve_coerce_u32_ptr): New. > (__ARM_mve_coerce_s64_ptr): New. > (__ARM_mve_coerce_u64_ptr): New. > (__ARM_mve_coerce_f_scalar): New. > (__ARM_mve_coerce_f16_ptr): New. > (__ARM_mve_coerce_f32_ptr): New. > (__arm_vst4q): Change _coerce_ overloads. > (__arm_vbicq): Change _coerce_ overloads. > (__arm_vmulq): Change _coerce_ overloads. > (__arm_vcmpeqq): Change _coerce_ overloads. > (__arm_vcmpneq): Change _coerce_ overloads. > (__arm_vmaxnmavq): Change _coerce_ overloads. > (__arm_vmaxnmvq): Change _coerce_ overloads. > (__arm_vminnmavq): Change _coerce_ overloads. > (__arm_vsubq): Change _coerce_ overloads. > (__arm_vminnmvq): Change _coerce_ overloads. > (__arm_vrshlq): Change _coerce_ overloads. > (__arm_vqsubq): Change _coerce_ overloads. > (__arm_vqdmulltq): Change _coerce_ overloads. > (__arm_vqdmullbq): Change _coerce_ overloads. > (__arm_vqdmulhq): Change _coerce_ overloads. > (__arm_vqaddq): Change _coerce_ overloads. > (__arm_vhaddq): Change _coerce_ overloads. > (__arm_vhsubq): Change _coerce_ overloads. > (__arm_vqdmlashq): Change _coerce_ overloads. > (__arm_vqrdmlahq): Change _coerce_ overloads. > (__arm_vmlasq): Change _coerce_ overloads. > (__arm_vqdmlahq): Change _coerce_ overloads. > (__arm_vmaxnmavq_p): Change _coerce_ overloads. > (__arm_vmaxnmvq_p): Change _coerce_ overloads. > (__arm_vminnmavq_p): Change _coerce_ overloads. > (__arm_vminnmvq_p): Change _coerce_ overloads. > (__arm_vfmasq_m): Change _coerce_ overloads. > (__arm_vld1q): Change _coerce_ overloads. > (__arm_vld1q_z): Change _coerce_ overloads. > (__arm_vld2q): Change _coerce_ overloads. > (__arm_vld4q): Change _coerce_ overloads. > (__arm_vldrhq_gather_offset): Change _coerce_ overloads. > (__arm_vldrhq_gather_offset_z): Change _coerce_ overloads. > (__arm_vldrhq_gather_shifted_offset): Change _coerce_ overloads. > (__arm_vldrhq_gather_shifted_offset_z): Change _coerce_ > overloads. > (__arm_vldrwq_gather_offset): Change _coerce_ overloads. > (__arm_vldrwq_gather_offset_z): Change _coerce_ overloads. > (__arm_vldrwq_gather_shifted_offset): Change _coerce_ overloads. > (__arm_vldrwq_gather_shifted_offset_z): Change _coerce_ > overloads. > (__arm_vst1q_p): Change _coerce_ overloads. > (__arm_vst2q): Change _coerce_ overloads. > (__arm_vst1q): Change _coerce_ overloads. > (__arm_vstrhq): Change _coerce_ overloads. > (__arm_vstrhq_p): Change _coerce_ overloads. > (__arm_vstrhq_scatter_offset_p): Change _coerce_ overloads. > (__arm_vstrhq_scatter_offset): Change _coerce_ overloads. > (__arm_vstrhq_scatter_shifted_offset_p): Change _coerce_ > overloads. > (__arm_vstrhq_scatter_shifted_offset): Change _coerce_ overloads. > (__arm_vstrwq_p): Change _coerce_ overloads. > (__arm_vstrwq): Change _coerce_ overloads. > (__arm_vstrwq_scatter_offset): Change _coerce_ overloads. > (__arm_vstrwq_scatter_offset_p): Change _coerce_ overloads. > (__arm_vstrwq_scatter_shifted_offset): Change _coerce_ overloads. > (__arm_vstrwq_scatter_shifted_offset_p): Change _coerce_ > overloads. > (__arm_vsetq_lane): Change _coerce_ overloads. > (__arm_vcmpneq_m): Change _coerce_ overloads. > (__arm_vldrbq_gather_offset): Change _coerce_ overloads. > (__arm_vdwdupq_x_u8): Change _coerce_ overloads. > (__arm_vdwdupq_x_u16): Change _coerce_ overloads. > (__arm_vdwdupq_x_u32): Change _coerce_ overloads. > (__arm_viwdupq_x_u8): Change _coerce_ overloads. > (__arm_viwdupq_x_u16): Change _coerce_ overloads. > (__arm_viwdupq_x_u32): Change _coerce_ overloads. > (__arm_vidupq_x_u8): Change _coerce_ overloads. > (__arm_vddupq_x_u8): Change _coerce_ overloads. > (__arm_vidupq_x_u16): Change _coerce_ overloads. > (__arm_vddupq_x_u16): Change _coerce_ overloads. > (__arm_vidupq_x_u32): Change _coerce_ overloads. > (__arm_vddupq_x_u32): Change _coerce_ overloads. > (__arm_vhaddq_x): Change _coerce_ overloads. > (__arm_vhsubq_x): Change _coerce_ overloads. > (__arm_vldrdq_gather_offset): Change _coerce_ overloads. > (__arm_vldrdq_gather_offset_z): Change _coerce_ overloads. > (__arm_vldrdq_gather_shifted_offset): Change _coerce_ overloads. > (__arm_vldrdq_gather_shifted_offset_z): Change _coerce_ overloads. > (__arm_vldrbq_gather_offset_z): Change _coerce_ overloads. > (__arm_vqrdmlahq_m): Change _coerce_ overloads. > (__arm_vqrdmlashq_m): Change _coerce_ overloads. > (__arm_vqdmlashq_m): Change _coerce_ overloads. > (__arm_vmlaldavaxq_p): Change _coerce_ overloads. > (__arm_vmlasq_m): Change _coerce_ overloads. > (__arm_vqdmulhq_m): Change _coerce_ overloads. > (__arm_vqdmulltq_m): Change _coerce_ overloads. > (__arm_vidupq_u16): Change _coerce_ overloads. > (__arm_vidupq_u32): Change _coerce_ overloads. > (__arm_vidupq_u8): Change _coerce_ overloads. > (__arm_vddupq_u16): Change _coerce_ overloads. > (__arm_vddupq_u32): Change _coerce_ overloads. > (__arm_vddupq_u8): Change _coerce_ overloads. > (__arm_viwdupq_m): Change _coerce_ overloads. > (__arm_viwdupq_u16): Change _coerce_ overloads. > (__arm_viwdupq_u32): Change _coerce_ overloads. > (__arm_viwdupq_u8): Change _coerce_ overloads. > (__arm_vdwdupq_m): Change _coerce_ overloads. > (__arm_vdwdupq_u16): Change _coerce_ overloads. > (__arm_vdwdupq_u32): Change _coerce_ overloads. > (__arm_vdwdupq_u8): Change _coerce_ overloads. > (__arm_vaddlvaq): Change _coerce_ overloads. > (__arm_vaddlvaq_p): Change _coerce_ overloads. > (__arm_vaddvaq): Change _coerce_ overloads. > (__arm_vaddvaq_p): Change _coerce_ overloads. > (__arm_vcmphiq_m): Change _coerce_ overloads. > (__arm_vmladavaq_p): Change _coerce_ overloads. > (__arm_vmladavaxq): Change _coerce_ overloads. > (__arm_vmlaldavaxq): Change _coerce_ overloads. > (__arm_vstrbq): Change _coerce_ overloads. > (__arm_vstrbq_p): Change _coerce_ overloads. > (__arm_vrmlaldavhaq_p): Change _coerce_ overloads. > (__arm_vstrbq_scatter_offset): Change _coerce_ overloads. > (__arm_vstrbq_scatter_offset_p): Change _coerce_ overloads. > (__arm_vstrdq_scatter_offset_p): Change _coerce_ overloads. > (__arm_vstrdq_scatter_offset): Change _coerce_ overloads. > (__arm_vstrdq_scatter_shifted_offset_p): Change _coerce_ > overloads. > (__arm_vstrdq_scatter_shifted_offset): Change _coerce_ overloads. >=20 > gcc/testsuite/ChangeLog: >=20 > * gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overloads-fp.c: > Add testcases. > * gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overloads-int.c: > Add testcases. > --- > gcc/config/arm/arm_mve.h | 2056 +++++++++-------- > .../mve_intrinsic_type_overloads-fp.c | 55 +- > .../mve_intrinsic_type_overloads-int.c | 74 +- > 3 files changed, 1148 insertions(+), 1037 deletions(-) >=20 > diff --git a/gcc/config/arm/arm_mve.h b/gcc/config/arm/arm_mve.h > index 3a1cffb4063..71ea3ee275e 100644 > --- a/gcc/config/arm/arm_mve.h > +++ b/gcc/config/arm/arm_mve.h > @@ -35582,16 +35582,29 @@ enum { > short: __ARM_mve_type_int_n, \ > int: __ARM_mve_type_int_n, \ > long: __ARM_mve_type_int_n, \ > + long long: __ARM_mve_type_int_n, \ > _Float16: __ARM_mve_type_fp_n, \ > __fp16: __ARM_mve_type_fp_n, \ > float: __ARM_mve_type_fp_n, \ > double: __ARM_mve_type_fp_n, \ > - long long: __ARM_mve_type_int_n, \ > unsigned char: __ARM_mve_type_int_n, \ > unsigned short: __ARM_mve_type_int_n, \ > unsigned int: __ARM_mve_type_int_n, \ > unsigned long: __ARM_mve_type_int_n, \ > unsigned long long: __ARM_mve_type_int_n, \ > + signed char*: __ARM_mve_type_int8_t_ptr, \ > + short*: __ARM_mve_type_int16_t_ptr, \ > + int*: __ARM_mve_type_int32_t_ptr, \ > + long*: __ARM_mve_type_int32_t_ptr, \ > + long long*: __ARM_mve_type_int64_t_ptr, \ > + _Float16*: __ARM_mve_type_float16_t_ptr, \ > + __fp16*: __ARM_mve_type_float16_t_ptr, \ > + float*: __ARM_mve_type_float32_t_ptr, \ > + unsigned char*: __ARM_mve_type_uint8_t_ptr, \ > + unsigned short*: __ARM_mve_type_uint16_t_ptr, \ > + unsigned int*: __ARM_mve_type_uint32_t_ptr, \ > + unsigned long*: __ARM_mve_type_uint32_t_ptr, \ > + unsigned long long*: __ARM_mve_type_uint64_t_ptr, \ > default: __ARM_mve_unsupported_type)) > #else > #define __ARM_mve_typeid(x) _Generic(x, \ > @@ -35650,32 +35663,67 @@ enum { > unsigned int: __ARM_mve_type_int_n, \ > unsigned long: __ARM_mve_type_int_n, \ > unsigned long long: __ARM_mve_type_int_n, \ > + signed char*: __ARM_mve_type_int8_t_ptr, \ > + short*: __ARM_mve_type_int16_t_ptr, \ > + int*: __ARM_mve_type_int32_t_ptr, \ > + long*: __ARM_mve_type_int32_t_ptr, \ > + long long*: __ARM_mve_type_int64_t_ptr, \ > + unsigned char*: __ARM_mve_type_uint8_t_ptr, \ > + unsigned short*: __ARM_mve_type_uint16_t_ptr, \ > + unsigned int*: __ARM_mve_type_uint32_t_ptr, \ > + unsigned long*: __ARM_mve_type_uint32_t_ptr, \ > + unsigned long long*: __ARM_mve_type_uint64_t_ptr, \ > default: __ARM_mve_unsupported_type)) > #endif /* MVE Floating point. */ >=20 > extern void *__ARM_undef; > #define __ARM_mve_coerce(param, type) \ > _Generic(param, type: param, default: *(type *)__ARM_undef) > -#define __ARM_mve_coerce1(param, type) \ > - _Generic(param, type: param, const type: param, default: *(type > *)__ARM_undef) > -#define __ARM_mve_coerce2(param, type) \ > - _Generic(param, type: param, __fp16: param, default: _Generic (param= , > _Float16: param, float16_t: param, float32_t: param, default: *(type > *)__ARM_undef)) > -#define __ARM_mve_coerce3(param, type) \ > - _Generic(param, type: param, default: _Generic (param, int8_t: param= , > int16_t: param, int32_t: param, int64_t: param, uint8_t: param, uint16_t: > param, uint32_t: param, uint64_t: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_i_scalar(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, int8_t: param, int16_t: param, int32_t: param, int64_t: param, > uint8_t: param, uint16_t: param, uint32_t: param, uint64_t: param, defaul= t: > *(type *)__ARM_undef)) > + > +#define __ARM_mve_coerce_s8_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, signed char*: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_u8_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, unsigned char*: param, default: *(type *)__ARM_undef)) > + > +#define __ARM_mve_coerce_s16_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, short*: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_u16_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, unsigned short*: param, default: *(type *)__ARM_undef)) > + > +#define __ARM_mve_coerce_s32_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, int*: param, long*: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_u32_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, unsigned int*: param, unsigned long*: param, default: *(type > *)__ARM_undef)) > + > +#define __ARM_mve_coerce_s64_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, long long*: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_u64_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, unsigned long long*: param, default: *(type *)__ARM_undef)) > + > +#if (__ARM_FEATURE_MVE & 2) /* MVE Floating point. */ > +#define __ARM_mve_coerce_f_scalar(param, type) \ > + _Generic(param, type: param, const type: param, __fp16: param, defau= lt: > _Generic (param, _Float16: param, float16_t: param, float32_t: param, > default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_f16_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, __fp16*: param, _Float16*: param, default: *(type *)__ARM_undef)) > +#define __ARM_mve_coerce_f32_ptr(param, type) \ > + _Generic(param, type: param, const type: param, default: _Generic > (param, float*: param, default: *(type *)__ARM_undef)) > +#endif >=20 > #if (__ARM_FEATURE_MVE & 2) /* MVE Floating point. */ >=20 > #define __arm_vst4q(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x4_t]: > __arm_vst4q_s8 (__ARM_mve_coerce(__p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x4_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x4_t]: > __arm_vst4q_s16 (__ARM_mve_coerce(__p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x4_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x4_t]: > __arm_vst4q_s32 (__ARM_mve_coerce(__p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x4_t]: > __arm_vst4q_u8 (__ARM_mve_coerce(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x4_t]: > __arm_vst4q_u16 (__ARM_mve_coerce(__p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x4_t]: > __arm_vst4q_u32 (__ARM_mve_coerce(__p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x4_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8x4_t]: > __arm_vst4q_f16 (__ARM_mve_coerce(__p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8x4_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4x4_t]: > __arm_vst4q_f32 (__ARM_mve_coerce(__p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x4_t]: > __arm_vst4q_s8 (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x4_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x4_t]: > __arm_vst4q_s16 (__ARM_mve_coerce_s16_ptr(__p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x4_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x4_t]: > __arm_vst4q_s32 (__ARM_mve_coerce_s32_ptr(__p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x4_t]: > __arm_vst4q_u8 (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x4_t]: > __arm_vst4q_u16 (__ARM_mve_coerce_u16_ptr(__p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x4_t]: > __arm_vst4q_u32 (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x4_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8x4_t]: > __arm_vst4q_f16 (__ARM_mve_coerce_f16_ptr(__p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8x4_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4x4_t]: > __arm_vst4q_f32 (__ARM_mve_coerce_f32_ptr(__p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4x4_t)));}) >=20 > #define __arm_vrndxq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -35852,10 +35900,10 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vorrq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vorrq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vorrq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vorrq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vorrq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > @@ -35882,14 +35930,14 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vaddq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vaddq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)));}) >=20 > #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -35906,10 +35954,10 @@ extern void *__ARM_undef; > #define __arm_vbicq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3 (p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vbicq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vbicq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vbicq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -35934,14 +35982,14 @@ extern void *__ARM_undef; > #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -35966,14 +36014,14 @@ extern void *__ARM_undef; > #define __arm_vcmpeqq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpeqq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpeqq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpeqq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36004,16 +36052,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpeqq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpeqq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2));}) >=20 > #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36021,13 +36069,13 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgtq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgtq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)));}) >=20 > #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36037,11 +36085,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpleq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpleq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)));}) >=20 > #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36049,25 +36097,25 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpltq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpltq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)));}) >=20 > #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36122,8 +36170,8 @@ extern void *__ARM_undef; > #define __arm_vmaxnmavq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vmaxnmq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36134,14 +36182,14 @@ extern void *__ARM_undef; > #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vminnmaq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36152,8 +36200,8 @@ extern void *__ARM_undef; > #define __arm_vminnmavq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vbrsrq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -36175,14 +36223,14 @@ extern void *__ARM_undef; > #define __arm_vsubq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36195,8 +36243,8 @@ extern void *__ARM_undef; > #define __arm_vminnmvq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -36251,12 +36299,12 @@ extern void *__ARM_undef; > #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36287,12 +36335,12 @@ extern void *__ARM_undef; > #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36343,12 +36391,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36356,9 +36404,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vmlaldavxq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36391,8 +36439,8 @@ extern void *__ARM_undef; > #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) >=20 > @@ -36405,17 +36453,17 @@ extern void *__ARM_undef; > #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) >=20 > #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > @@ -36423,12 +36471,12 @@ extern void *__ARM_undef; > #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36461,12 +36509,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36491,12 +36539,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36639,12 +36687,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vsriq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36723,44 +36771,44 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36950,11 +36998,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgtq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgtq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > @@ -36966,11 +37014,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpleq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpleq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2));}) >=20 > #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36980,11 +37028,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpltq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpltq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2));}) >=20 > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -36997,14 +37045,14 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpneq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpneq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2));}) >=20 > #define __arm_vcvtbq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37058,8 +37106,8 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double)), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double)), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double)), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double)), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vfmaq_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vfmaq_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t)));}) >=20 > @@ -37074,8 +37122,8 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double)), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double)));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double)), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double)));}) >=20 > #define __arm_vmaxnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37098,14 +37146,14 @@ extern void *__ARM_undef; > #define __arm_vmaxnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vmaxnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vminnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37116,14 +37164,14 @@ extern void *__ARM_undef; > #define __arm_vminnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_p_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_p_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vminnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_p_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_p_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vrndnq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37185,13 +37233,13 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgeq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgeq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double)));}) >=20 > #define __arm_vrshrnbq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37292,11 +37340,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce_f_scalar(__p1, double), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgeq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgeq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > @@ -37325,14 +37373,14 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vaddq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vaddq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vaddq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vandq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37473,15 +37521,15 @@ extern void *__ARM_undef; > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vfmaq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vfmaq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vfmasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vfmsq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37516,14 +37564,14 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vmulq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vmulq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vmulq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37550,14 +37598,14 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vsubq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vsubq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vsubq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vorrq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -37574,236 +37622,236 @@ extern void *__ARM_undef; >=20 > #define __arm_vld1q(p0) (\ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)), \ > - int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld1q_f16 > (__ARM_mve_coerce1(p0, float16_t *)), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld1q_f32 > (__ARM_mve_coerce1(p0, float32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)), \ > + int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld1q_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *)), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld1q_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *)))) >=20 > #define __arm_vld1q_z(p0,p1) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_z_s8 > (__ARM_mve_coerce1(p0, int8_t *), p1), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_z_s16 > (__ARM_mve_coerce1(p0, int16_t *), p1), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_z_s32 > (__ARM_mve_coerce1(p0, int32_t *), p1), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_z_u8 > (__ARM_mve_coerce1(p0, uint8_t *), p1), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_z_u16 > (__ARM_mve_coerce1(p0, uint16_t *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_z_u32 > (__ARM_mve_coerce1(p0, uint32_t *), p1), \ > - int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld1q_z_f16 > (__ARM_mve_coerce1(p0, float16_t *), p1), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld1q_z_f32 > (__ARM_mve_coerce1(p0, float32_t *), p1))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_z_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *), p1), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_z_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), p1), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_z_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_z_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), p1), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_z_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_z_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), p1), \ > + int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld1q_z_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), p1), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld1q_z_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *), p1))) >=20 > #define __arm_vld2q(p0) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld2q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld2q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld2q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld2q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld2q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld2q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)), \ > - int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld2q_f16 > (__ARM_mve_coerce1(p0, float16_t *)), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld2q_f32 > (__ARM_mve_coerce1(p0, float32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld2q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld2q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld2q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld2q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld2q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld2q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)), \ > + int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld2q_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *)), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld2q_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *)))) >=20 > #define __arm_vld4q(p0) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld4q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld4q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld4q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld4q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld4q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld4q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)), \ > - int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld4q_f16 > (__ARM_mve_coerce1(p0, float16_t *)), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld4q_f32 > (__ARM_mve_coerce1(p0, float32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld4q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld4q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld4q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld4q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld4q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld4q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)), \ > + int (*)[__ARM_mve_type_float16_t_ptr]: __arm_vld4q_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *)), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vld4q_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *)))) >=20 > #define __arm_vldrhq_gather_offset(p0,p1) ({ __typeof(p1) __p1 =3D (p1);= \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_s16 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_s32 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_u16 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_u32 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_f16 (__ARM_mve_coerce1(p0, float16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)));}) >=20 > #define __arm_vldrhq_gather_offset_z(p0,p1,p2) ({ __typeof(p1) __p1 =3D > (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_s16 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_s32 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_u16 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_u32 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_f16 (__ARM_mve_coerce1(p0, float16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_u16 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_u32 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_f16 (__ARM_mve_coerce_f16_ptr(p0, > float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2));}) >=20 > #define __arm_vldrhq_gather_shifted_offset(p0,p1) ({ __typeof(p1) __p1 = =3D > (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_s16 (__ARM_mve_coerce1(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_s32 (__ARM_mve_coerce1(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_u16 (__ARM_mve_coerce1(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_u32 (__ARM_mve_coerce1(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_f16 (__ARM_mve_coerce1(p0, float16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_s16 (__ARM_mve_coerce_s16_ptr(p0, > int16_t *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_s32 (__ARM_mve_coerce_s16_ptr(p0, > int16_t *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_u16 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_u32 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_f16 (__ARM_mve_coerce_f16_ptr(p0, > float16_t *), __ARM_mve_coerce(__p1, uint16x8_t)));}) >=20 > #define __arm_vldrhq_gather_shifted_offset_z(p0,p1,p2) ({ __typeof(p1) > __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_s16 (__ARM_mve_coerce1(p0, > int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_s32 (__ARM_mve_coerce1(p0, > int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_u16 (__ARM_mve_coerce1(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_u32 (__ARM_mve_coerce1(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_f16 (__ARM_mve_coerce1(p0, > float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_f16 (__ARM_mve_coerce_f16_ptr(p0, > float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2));}) >=20 > #define __arm_vldrwq_gather_offset(p0,p1) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_s32 > (__ARM_mve_coerce1(p0, int32_t *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vldrwq_gather_offset_u32 > (__ARM_mve_coerce1(p0, uint32_t *), p1), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vldrwq_gather_offset_f32 > (__ARM_mve_coerce1(p0, float32_t *), p1))) > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vldrwq_gather_offset_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), p1), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: __arm_vldrwq_gather_offset_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *), p1))) >=20 > #define __arm_vldrwq_gather_offset_z(p0,p1,p2) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_z_s32 > (__ARM_mve_coerce1(p0, int32_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_offset_z_u32 (__ARM_mve_coerce1(p0, uint32_t *), > p1, p2), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_offset_z_f32 (__ARM_mve_coerce1(p0, float32_t *), > p1, p2))) > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_z_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_offset_z_u32 (__ARM_mve_coerce_u32_ptr(p0, > uint32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_offset_z_f32 (__ARM_mve_coerce_f32_ptr(p0, > float32_t *), p1, p2))) >=20 > #define __arm_vldrwq_gather_shifted_offset(p0,p1) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_s32 (__ARM_mve_coerce1(p0, int32_t > *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_u32 (__ARM_mve_coerce1(p0, > uint32_t *), p1), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_f32 (__ARM_mve_coerce1(p0, > float32_t *), p1))) > + int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_s32 (__ARM_mve_coerce_s32_ptr(p0, > int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_u32 (__ARM_mve_coerce_u32_ptr(p0, > uint32_t *), p1), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_f32 (__ARM_mve_coerce_f32_ptr(p0, > float32_t *), p1))) >=20 > #define __arm_vldrwq_gather_shifted_offset_z(p0,p1,p2) ( \ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_s32 (__ARM_mve_coerce1(p0, > int32_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_u32 (__ARM_mve_coerce1(p0, > uint32_t *), p1, p2), \ > - int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_f32 (__ARM_mve_coerce1(p0, > float32_t *), p1, p2))) > + int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_float32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *), p1, p2))) >=20 > #define __arm_vst1q_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_p_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_p_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_p_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_p_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_p_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_p_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vst1q_p_f16 (__ARM_mve_coerce(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vst1q_p_f32 (__ARM_mve_coerce(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_p_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_p_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_p_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_p_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_p_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_p_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vst1q_p_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vst1q_p_f32 (__ARM_mve_coerce_f32_ptr(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vst2q(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x2_t]: > __arm_vst2q_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x2_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x2_t]: > __arm_vst2q_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x2_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x2_t]: > __arm_vst2q_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x2_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x2_t]: > __arm_vst2q_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x2_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x2_t]: > __arm_vst2q_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x2_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x2_t]: > __arm_vst2q_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x2_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8x2_t]: > __arm_vst2q_f16 (__ARM_mve_coerce(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8x2_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4x2_t]: > __arm_vst2q_f32 (__ARM_mve_coerce(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4x2_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x2_t]: > __arm_vst2q_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x2_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x2_t]: > __arm_vst2q_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x2_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x2_t]: > __arm_vst2q_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x2_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x2_t]: > __arm_vst2q_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x2_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x2_t]: > __arm_vst2q_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x2_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x2_t]: > __arm_vst2q_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x2_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8x2_t]: > __arm_vst2q_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8x2_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4x2_t]: > __arm_vst2q_f32 (__ARM_mve_coerce_f32_ptr(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4x2_t)));}) >=20 > #define __arm_vst1q(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vst1q_f16 (__ARM_mve_coerce(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vst1q_f32 (__ARM_mve_coerce(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vst1q_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vst1q_f32 (__ARM_mve_coerce_f32_ptr(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vstrhq(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_s32 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_u32 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vstrhq_f16 (__ARM_mve_coerce(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vstrhq_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t)));}) >=20 > #define __arm_vstrhq_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_p_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_p_s32 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_p_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_p_u32 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vstrhq_p_f16 (__ARM_mve_coerce(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_p_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_p_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_p_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_p_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_float16x8_t]: > __arm_vstrhq_p_f16 (__ARM_mve_coerce_f16_ptr(p0, float16_t *), > __ARM_mve_coerce(__p1, float16x8_t), p2));}) >=20 > #define __arm_vstrhq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p1) __p1 = =3D > (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_p_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_p_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t), p3));}) >=20 > #define __arm_vstrhq_scatter_offset(p0,p1,p2) ({ __typeof(p1) __p1 =3D (= p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t)));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t), p3));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t)));}) >=20 > #define __arm_vstrwq_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_p_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_p_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_p_f32 (__ARM_mve_coerce(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_p_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_p_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_p_f32 (__ARM_mve_coerce_f32_ptr(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #define __arm_vstrwq(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_f32 (__ARM_mve_coerce(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_f32 (__ARM_mve_coerce_f32_ptr(p0, float32_t *), > __ARM_mve_coerce(__p1, float32x4_t)));}) >=20 > #define __arm_vstrhq_scatter_offset(p0,p1,p2) ({ __typeof(p1) __p1 =3D (= p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t)));}) >=20 > #define __arm_vstrhq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p1) __p1 = =3D > (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_p_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_offset_p_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t), p3));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t)));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_f16 > (__ARM_mve_coerce(p0, float16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int > (*)[__ARM_mve_type_float16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_f16 > (__ARM_mve_coerce_f16_ptr(p0, float16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, float16x8_t), p3));}) >=20 > #define __arm_vstrwq_scatter_base(p0,p1,p2) ({ __typeof(p2) __p2 =3D (p2= ); \ > _Generic( (int (*)[__ARM_mve_typeid(__p2)])0, \ > @@ -37820,44 +37868,44 @@ extern void *__ARM_undef; > #define __arm_vstrwq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 =3D (= p0); > \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_s32 (__ARM_mve_coerce(__p0, int32_t *), p1, > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_u32 (__ARM_mve_coerce(__p0, uint32_t *), > p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_offset_f32 (__ARM_mve_coerce(__p0, float32_t *), > p1, __ARM_mve_coerce(__p2, float32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_s32 (__ARM_mve_coerce_s32_ptr(__p0, > int32_t *), p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_u32 (__ARM_mve_coerce_u32_ptr(__p0, > uint32_t *), p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_offset_f32 (__ARM_mve_coerce_f32_ptr(__p0, > float32_t *), p1, __ARM_mve_coerce(__p2, float32x4_t)));}) >=20 > #define __arm_vstrwq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = =3D > (p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_p_s32 (__ARM_mve_coerce(__p0, int32_t *), > p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_p_u32 (__ARM_mve_coerce(__p0, uint32_t *), > p1, __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_offset_p_f32 (__ARM_mve_coerce(__p0, float32_t *), > p1, __ARM_mve_coerce(__p2, float32x4_t), p3));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_p_s32 (__ARM_mve_coerce_s32_ptr(__p0, > int32_t *), p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_p_u32 (__ARM_mve_coerce_u32_ptr(__p0, > uint32_t *), p1, __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_offset_p_f32 (__ARM_mve_coerce_f32_ptr(__p0, > float32_t *), p1, __ARM_mve_coerce(__p2, float32x4_t), p3));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce(p0, uint32_t > *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_f32 (__ARM_mve_coerce(p0, float32_t > *), __p1, __ARM_mve_coerce(__p2, float32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce_s32_ptr(p0, > int32_t *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce_u32_ptr(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_f32 (__ARM_mve_coerce_f32_ptr(p0, > float32_t *), __p1, __ARM_mve_coerce(__p2, float32x4_t)));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 (__ARM_mve_coerce(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_f32 (__ARM_mve_coerce(p0, > float32_t *), __p1, __ARM_mve_coerce(__p2, float32x4_t), p3));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), __p1, __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), __p1, > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *), __p1, > __ARM_mve_coerce(__p2, float32x4_t), p3));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 (__ARM_mve_coerce(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_f32 (__ARM_mve_coerce(p0, > float32_t *), __p1, __ARM_mve_coerce(__p2, float32x4_t), p3));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), __p1, __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), __p1, > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_f32 > (__ARM_mve_coerce_f32_ptr(p0, float32_t *), __p1, > __ARM_mve_coerce(__p2, float32x4_t), p3));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce(p0, uint32_t > *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > - int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_f32 (__ARM_mve_coerce(p0, float32_t > *), __p1, __ARM_mve_coerce(__p2, float32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce_s32_ptr(p0, > int32_t *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce_u32_ptr(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)), \ > + int (*)[__ARM_mve_type_float32_t_ptr][__ARM_mve_type_float32x4_t]: > __arm_vstrwq_scatter_shifted_offset_f32 (__ARM_mve_coerce_f32_ptr(p0, > float32_t *), __p1, __ARM_mve_coerce(__p2, float32x4_t)));}) >=20 > #define __arm_vuninitializedq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -38030,19 +38078,19 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vaddq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vaddq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vandq_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > @@ -38165,19 +38213,19 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vmulq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vmulq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > @@ -38266,19 +38314,19 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vsubq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vsubq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vsubq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vsubq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vsubq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce_f_scalar(__p2, double), p3));}) >=20 > #define __arm_vcmulq_rot90_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > @@ -38302,16 +38350,16 @@ extern void *__ARM_undef; > #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vsetq_lane_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vsetq_lane_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vsetq_lane_f16 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vsetq_lane_f32 (__ARM_mve_coerce_f_scalar(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) >=20 > #else /* MVE Integer. */ >=20 > @@ -38327,12 +38375,12 @@ extern void *__ARM_undef; >=20 > #define __arm_vst4q(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x4_t]: > __arm_vst4q_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x4_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x4_t]: > __arm_vst4q_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x4_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x4_t]: > __arm_vst4q_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x4_t]: > __arm_vst4q_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x4_t]: > __arm_vst4q_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x4_t]: > __arm_vst4q_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x4_t]: > __arm_vst4q_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x4_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x4_t]: > __arm_vst4q_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x4_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x4_t]: > __arm_vst4q_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x4_t]: > __arm_vst4q_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x4_t]: > __arm_vst4q_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x4_t]: > __arm_vst4q_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x4_t)));}) >=20 > #define __arm_vabsq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -38429,12 +38477,12 @@ extern void *__ARM_undef; > #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38461,12 +38509,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vsubq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vsubq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vsubq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -38480,12 +38528,12 @@ extern void *__ARM_undef; > #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38516,12 +38564,12 @@ extern void *__ARM_undef; > #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38590,12 +38638,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -38603,16 +38651,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > @@ -38620,12 +38668,12 @@ extern void *__ARM_undef; > #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38642,10 +38690,10 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vorrq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vorrq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vorrq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vorrq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vornq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -38660,12 +38708,12 @@ extern void *__ARM_undef; > #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38740,12 +38788,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38770,12 +38818,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38825,10 +38873,10 @@ extern void *__ARM_undef; > #define __arm_vbicq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3 (p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3 (p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vbicq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar (__p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vbicq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vbicq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vbicq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38845,12 +38893,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vaddq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vaddq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -38881,12 +38929,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vqmovntq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -38967,16 +39015,16 @@ extern void *__ARM_undef; > #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) >=20 > #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) >=20 > @@ -38986,9 +39034,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -38996,9 +39044,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39006,9 +39054,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpleq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpleq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39016,20 +39064,20 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > @@ -39054,12 +39102,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vbicq_m_n(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -39169,25 +39217,25 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39250,9 +39298,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 >=20 > #define __arm_vcmpgtq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > @@ -39261,9 +39309,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vcmpleq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39271,9 +39319,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpleq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpleq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39281,9 +39329,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39294,12 +39342,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpneq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vdupq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39322,23 +39370,23 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vnegq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39363,9 +39411,9 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int)));}) >=20 > #define __arm_vqdmlsdhq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39528,12 +39576,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vsubq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vsubq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vsubq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -39633,12 +39681,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -39666,12 +39714,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vaddq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vaddq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vaddq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vaddq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -39683,12 +39731,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vmulq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vmulq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vmulq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -39703,12 +39751,12 @@ extern void *__ARM_undef; >=20 > #define __arm_vldrbq_gather_offset(p0,p1) ({ __typeof(p1) __p1 =3D (p1);= \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_s8 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_s16 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_s32 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_u8 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_u16 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_u32 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_s16 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_s32 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_u16 (__ARM_mve_coerce_u8_ptr(p0, uint8_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_u32 (__ARM_mve_coerce_u8_ptr(p0, uint8_t > *), __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vstrwq_scatter_base_p(p0,p1,p2,p3) ({ __typeof(p2) __p2 = =3D > (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p2)])0, \ > @@ -39717,144 +39765,144 @@ extern void *__ARM_undef; >=20 > #define __arm_vld1q(p0) (\ > _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)))) >=20 > #define __arm_vldrhq_gather_offset(p0,p1) ({ __typeof(p1) __p1 =3D (p1);= \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_s16 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_s32 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_u16 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_u32 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vldrhq_gather_offset_z(p0,p1,p2) ({ __typeof(p1) __p1 =3D > (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_s16 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_s32 (__ARM_mve_coerce1(p0, int16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_u16 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_u32 (__ARM_mve_coerce1(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_offset_z_u16 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_offset_z_u32 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vldrhq_gather_shifted_offset(p0,p1) ({ __typeof(p1) __p1 = =3D > (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_s16 (__ARM_mve_coerce1(p0, int16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_s32 (__ARM_mve_coerce1(p0, int16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_u16 (__ARM_mve_coerce1(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_u32 (__ARM_mve_coerce1(p0, uint16_t > *), __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_s16 (__ARM_mve_coerce_s16_ptr(p0, > int16_t *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_s32 (__ARM_mve_coerce_s16_ptr(p0, > int16_t *), __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_u16 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_u32 (__ARM_mve_coerce_u16_ptr(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vldrhq_gather_shifted_offset_z(p0,p1,p2) ({ __typeof(p1) > __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_s16 (__ARM_mve_coerce1(p0, > int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_s32 (__ARM_mve_coerce1(p0, > int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_u16 (__ARM_mve_coerce1(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_u32 (__ARM_mve_coerce1(p0, > uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrhq_gather_shifted_offset_z_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrhq_gather_shifted_offset_z_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), p2));}) >=20 > #define __arm_vldrwq_gather_offset(p0,p1) ({ __typeof(p0) __p0 =3D (p0);= \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_s32 > (__ARM_mve_coerce1(__p0, int32_t *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vldrwq_gather_offset_u32 > (__ARM_mve_coerce1(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_s32 > (__ARM_mve_coerce_s32_ptr(__p0, int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vldrwq_gather_offset_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vldrwq_gather_offset_z(p0,p1,p2) ({ __typeof(p0) __p0 =3D > (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_z_s32 > (__ARM_mve_coerce1(__p0, int32_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_offset_z_u32 (__ARM_mve_coerce1(__p0, uint32_t *), > p1, p2));}) > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vldrwq_gather_offset_z_s32 > (__ARM_mve_coerce_s32_ptr(__p0, int32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_offset_z_u32 (__ARM_mve_coerce_u32_ptr(__p0, > uint32_t *), p1, p2));}) >=20 > #define __arm_vldrwq_gather_shifted_offset(p0,p1) ({ __typeof(p0) __p0 = =3D > (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_s32 (__ARM_mve_coerce1(__p0, > int32_t *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_u32 (__ARM_mve_coerce1(__p0, > uint32_t *), p1));}) > + int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_s32 > (__ARM_mve_coerce_s32_ptr(__p0, int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vldrwq_gather_shifted_offset_z(p0,p1,p2) ({ __typeof(p0) > __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_s32 (__ARM_mve_coerce1(__p0, > int32_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_u32 (__ARM_mve_coerce1(__p0, > uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_s32 > (__ARM_mve_coerce_s32_ptr(__p0, int32_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: > __arm_vldrwq_gather_shifted_offset_z_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_vst1q(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vst1q_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_p_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_p_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_p_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_p_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_p_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_p_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vst1q_p_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vst1q_p_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vst1q_p_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vst1q_p_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vst1q_p_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vst1q_p_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vst2q(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x2_t]: > __arm_vst2q_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x2_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x2_t]: > __arm_vst2q_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x2_t)), \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x2_t]: > __arm_vst2q_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x2_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x2_t]: > __arm_vst2q_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x2_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x2_t]: > __arm_vst2q_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x2_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x2_t]: > __arm_vst2q_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x2_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16x2_t]: > __arm_vst2q_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16x2_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8x2_t]: > __arm_vst2q_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8x2_t)), \ > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4x2_t]: > __arm_vst2q_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4x2_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16x2_t]: > __arm_vst2q_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16x2_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8x2_t]: > __arm_vst2q_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8x2_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4x2_t]: > __arm_vst2q_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4x2_t)));}) >=20 > #define __arm_vstrhq(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_s32 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_u32 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vstrhq_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_p_s16 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_p_s32 (__ARM_mve_coerce(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_p_u16 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_p_u32 (__ARM_mve_coerce(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrhq_p_s16 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrhq_p_s32 (__ARM_mve_coerce_s16_ptr(p0, int16_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrhq_p_u16 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrhq_p_u32 (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vstrhq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p1) __p1 = =3D > (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrhq_scatter_offset(p0,p1,p2) ({ __typeof(p1) __p1 =3D (= p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 >=20 > #define __arm_vstrwq(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vstrwq_p(p0,p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_p_s32 (__ARM_mve_coerce(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_p_u32 (__ARM_mve_coerce(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_p_s32 (__ARM_mve_coerce_s32_ptr(p0, int32_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_p_u32 (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vstrdq_scatter_base_p(p0,p1,p2,p3) ({ __typeof(p2) __p2 = =3D > (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p2)])0, \ > @@ -39869,58 +39917,58 @@ extern void *__ARM_undef; > #define __arm_vstrhq_scatter_offset(p0,p1,p2) ({ __typeof(p1) __p1 =3D (= p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrhq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p1) __p1 = =3D > (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrhq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid > (__p2)])0, \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce(p0, int16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce(p0, uint16_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_ > mve_type_uint16x8_t]: __arm_vstrhq_scatter_shifted_offset_p_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint16_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_ > mve_type_uint32x4_t]: __arm_vstrhq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrwq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 =3D (= p0); > \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_s32 (__ARM_mve_coerce(__p0, int32_t *), p1, > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_u32 (__ARM_mve_coerce(__p0, uint32_t *), > p1, __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_s32 (__ARM_mve_coerce_s32_ptr(__p0, > int32_t *), p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_u32 (__ARM_mve_coerce_u32_ptr(__p0, > uint32_t *), p1, __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrwq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = =3D > (p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_p_s32 (__ARM_mve_coerce(__p0, int32_t *), > p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_p_u32 (__ARM_mve_coerce(__p0, uint32_t *), > p1, __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_offset_p_s32 (__ARM_mve_coerce_s32_ptr(__p0, > int32_t *), p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_offset_p_u32 (__ARM_mve_coerce_u32_ptr(__p0, > uint32_t *), p1, __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p1) __= p1 > =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce(p0, uint32_t > *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_s32 (__ARM_mve_coerce_s32_ptr(p0, > int32_t *), __p1, __ARM_mve_coerce(__p2, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_u32 (__ARM_mve_coerce_u32_ptr(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrwq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 1) > __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 (__ARM_mve_coerce(p0, int32_t > *), __p1, __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 (__ARM_mve_coerce(p0, > uint32_t *), __p1, __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int (*)[__ARM_mve_type_int32_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), __p1, __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int (*)[__ARM_mve_type_uint32_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrwq_scatter_shifted_offset_p_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), __p1, > __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vuninitializedq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -40025,15 +40073,15 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vcaddq_rot270_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > @@ -40127,15 +40175,15 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > @@ -40219,29 +40267,29 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint32x4_t]: __arm_vbrsrq_x_n_u32 > (__ARM_mve_coerce(__p1, uint32x4_t), p2, p3));}) >=20 > #define __arm_vld1q_z(p0,p1) ( _Generic( (int > (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_z_s8 > (__ARM_mve_coerce1(p0, int8_t *), p1), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_z_s16 > (__ARM_mve_coerce1(p0, int16_t *), p1), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_z_s32 > (__ARM_mve_coerce1(p0, int32_t *), p1), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_z_u8 > (__ARM_mve_coerce1(p0, uint8_t *), p1), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_z_u16 > (__ARM_mve_coerce1(p0, uint16_t *), p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_z_u32 > (__ARM_mve_coerce1(p0, uint32_t *), p1))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld1q_z_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *), p1), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld1q_z_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *), p1), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld1q_z_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *), p1), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld1q_z_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), p1), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld1q_z_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *), p1), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld1q_z_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *), p1))) >=20 > #define __arm_vld2q(p0) ( _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld2q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld2q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld2q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld2q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld2q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld2q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld2q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld2q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld2q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld2q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld2q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld2q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)))) >=20 >=20 > #define __arm_vld4q(p0) ( _Generic( (int (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld4q_s8 > (__ARM_mve_coerce1(p0, int8_t *)), \ > - int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld4q_s16 > (__ARM_mve_coerce1(p0, int16_t *)), \ > - int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld4q_s32 > (__ARM_mve_coerce1(p0, int32_t *)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld4q_u8 > (__ARM_mve_coerce1(p0, uint8_t *)), \ > - int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld4q_u16 > (__ARM_mve_coerce1(p0, uint16_t *)), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld4q_u32 > (__ARM_mve_coerce1(p0, uint32_t *)))) > + int (*)[__ARM_mve_type_int8_t_ptr]: __arm_vld4q_s8 > (__ARM_mve_coerce_s8_ptr(p0, int8_t *)), \ > + int (*)[__ARM_mve_type_int16_t_ptr]: __arm_vld4q_s16 > (__ARM_mve_coerce_s16_ptr(p0, int16_t *)), \ > + int (*)[__ARM_mve_type_int32_t_ptr]: __arm_vld4q_s32 > (__ARM_mve_coerce_s32_ptr(p0, int32_t *)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr]: __arm_vld4q_u8 > (__ARM_mve_coerce_u8_ptr(p0, uint8_t *)), \ > + int (*)[__ARM_mve_type_uint16_t_ptr]: __arm_vld4q_u16 > (__ARM_mve_coerce_u16_ptr(p0, uint16_t *)), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vld4q_u32 > (__ARM_mve_coerce_u32_ptr(p0, uint32_t *)))) >=20 > #define __arm_vsubq_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > @@ -40249,15 +40297,15 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vsubq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vsubq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vsubq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vgetq_lane(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -40273,14 +40321,14 @@ extern void *__ARM_undef; > #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2));}) >=20 > #endif /* MVE Integer. */ >=20 > @@ -40391,62 +40439,62 @@ extern void *__ARM_undef; > #define __arm_vdwdupq_x_u8(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_x_n_u8 ((uint32_t) > __p1, p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u8 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_vdwdupq_x_u16(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); = \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_x_n_u16 ((uint32_t) > __p1, p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u16 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_vdwdupq_x_u32(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); = \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_x_n_u32 ((uint32_t) > __p1, p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u32 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_x_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_viwdupq_x_u8(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_x_n_u8 ((uint32_t) __p1, > p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u8 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_viwdupq_x_u16(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); = \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_x_n_u16 ((uint32_t) > __p1, p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u16 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_viwdupq_x_u32(p1,p2,p3,p4) ({ __typeof(p1) __p1 =3D (p1); = \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_x_n_u32 ((uint32_t) > __p1, p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u32 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_x_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_vidupq_x_u8(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_x_n_u8 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u8 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vddupq_x_u8(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_x_n_u8 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u8 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vidupq_x_u16(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_x_n_u16 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u16 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vddupq_x_u16(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_x_n_u16 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u16 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vidupq_x_u32(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_x_n_u32 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u32 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_x_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vddupq_x_u32(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_x_n_u32 ((uint32_t) __p1, > p2, p3), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u32 > (__ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_x_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vshrq_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > @@ -40460,12 +40508,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > @@ -40490,12 +40538,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq_x(p1,p2,p3) ({ __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > @@ -40535,20 +40583,20 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint64x2_t]: __arm_vstrdq_scatter_base_wb_u64 > (p0, p1, __ARM_mve_coerce(__p2, uint64x2_t)));}) >=20 > #define __arm_vldrdq_gather_offset(p0,p1) ( _Generic( (int > (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int64_t_ptr]: __arm_vldrdq_gather_offset_s64 > (__ARM_mve_coerce1(p0, int64_t *), p1), \ > - int (*)[__ARM_mve_type_uint64_t_ptr]: __arm_vldrdq_gather_offset_u64 > (__ARM_mve_coerce1(p0, uint64_t *), p1))) > + int (*)[__ARM_mve_type_int64_t_ptr]: __arm_vldrdq_gather_offset_s64 > (__ARM_mve_coerce_s64_ptr(p0, int64_t *), p1), \ > + int (*)[__ARM_mve_type_uint64_t_ptr]: __arm_vldrdq_gather_offset_u64 > (__ARM_mve_coerce_u64_ptr(p0, uint64_t *), p1))) >=20 > #define __arm_vldrdq_gather_offset_z(p0,p1,p2) ( _Generic( (int > (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int64_t_ptr]: __arm_vldrdq_gather_offset_z_s64 > (__ARM_mve_coerce1(p0, int64_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_offset_z_u64 (__ARM_mve_coerce1(p0, uint64_t *), > p1, p2))) > + int (*)[__ARM_mve_type_int64_t_ptr]: __arm_vldrdq_gather_offset_z_s64 > (__ARM_mve_coerce_s64_ptr(p0, int64_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_offset_z_u64 (__ARM_mve_coerce_u64_ptr(p0, > uint64_t *), p1, p2))) >=20 > #define __arm_vldrdq_gather_shifted_offset(p0,p1) ( _Generic( (int > (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_s64 (__ARM_mve_coerce1(p0, int64_t > *), p1), \ > - int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_u64 (__ARM_mve_coerce1(p0, uint64_t > *), p1))) > + int (*)[__ARM_mve_type_int64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_s64 (__ARM_mve_coerce_s64_ptr(p0, > int64_t *), p1), \ > + int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_u64 (__ARM_mve_coerce_u64_ptr(p0, > uint64_t *), p1))) >=20 > #define __arm_vldrdq_gather_shifted_offset_z(p0,p1,p2) ( _Generic( (int > (*)[__ARM_mve_typeid(p0)])0, \ > - int (*)[__ARM_mve_type_int64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_z_s64 (__ARM_mve_coerce1(p0, > int64_t *), p1, p2), \ > - int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_z_u64 (__ARM_mve_coerce1(p0, > uint64_t *), p1, p2))) > + int (*)[__ARM_mve_type_int64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_z_s64 > (__ARM_mve_coerce_s64_ptr(p0, int64_t *), p1, p2), \ > + int (*)[__ARM_mve_type_uint64_t_ptr]: > __arm_vldrdq_gather_shifted_offset_z_u64 > (__ARM_mve_coerce_u64_ptr(p0, uint64_t *), p1, p2))) >=20 > #define __arm_vadciq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -40604,36 +40652,36 @@ extern void *__ARM_undef; >=20 > #define __arm_vldrbq_gather_offset_z(p0,p1,p2) ({ __typeof(p1) __p1 =3D > (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_z_s8 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_z_s16 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_z_s32 (__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_z_u8 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_z_u16 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_z_u32 (__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_z_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_z_s16 (__ARM_mve_coerce_s8_ptr(p0, int8_t > *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_z_s32 (__ARM_mve_coerce_s8_ptr(p0, int8_t > *), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_z_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t > *), __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_z_u16 (__ARM_mve_coerce_u8_ptr(p0, uint8_t > *), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_z_u32 (__ARM_mve_coerce_u8_ptr(p0, uint8_t > *), __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vqrdmlahq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqrdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqrshlq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -40734,12 +40782,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqsubq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqsubq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqsubq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -40754,9 +40802,9 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqrdmulhq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqrdmulhq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqrdmulhq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqrdmlsdhxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); = \ > __typeof(p1) __p1 =3D (p1); \ > @@ -40882,17 +40930,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vmlaldavaxq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); = \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) >=20 > #define __arm_vmlsldavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -40962,10 +41010,10 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vmvnq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vmvnq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vmvnq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int) , p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int) , p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int) , p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int) , p2));}) > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int) , p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int) , p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int) , p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmvnq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int) , p2));}) >=20 > #define __arm_vorrq_m_n(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41031,12 +41079,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vhaddq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vhaddq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vhaddq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -41070,12 +41118,12 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vhsubq_m_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vhsubq_m_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vhsubq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vmaxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41103,23 +41151,23 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vmlasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41165,12 +41213,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce_i_scalar(__p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqaddq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqaddq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqaddq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -41182,17 +41230,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqdmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqdmulhq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmulhq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmulhq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) > @@ -41203,15 +41251,15 @@ extern void *__ARM_undef; > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmullbq_m_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmullbq_m_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3));}) >=20 > #define __arm_vqdmulltq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > - int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > + int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce_i_scalar(__p2, int), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmulltq_m_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmulltq_m_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) >=20 > @@ -41277,9 +41325,9 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) >=20 > #define __arm_vmullbq_poly_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0);= \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41290,12 +41338,12 @@ extern void *__ARM_undef; >=20 > #define __arm_vldrbq_gather_offset(p0,p1) ({ __typeof(p1) __p1 =3D (p1);= \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_s8(__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_s16(__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_s32(__ARM_mve_coerce1(p0, int8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_u8(__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_u16(__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_u32(__ARM_mve_coerce1(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_s8(__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_s16(__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_s32(__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vldrbq_gather_offset_u8(__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vldrbq_gather_offset_u16(__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vldrbq_gather_offset_u32(__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vidupq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41303,9 +41351,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vidupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), (uint32_t) > __p1, p2, p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vidupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), (uint32_t) > __p1, p2, p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vidupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), (uint32_t) > __p1, p2, p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vidupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vddupq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41313,89 +41361,89 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vddupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), (uint32_t) > __p1, p2, p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vddupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), (uint32_t) > __p1, p2, p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vddupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), (uint32_t) > __p1, p2, p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vddupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3));}) >=20 > #define __arm_vidupq_u16(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_n_u16 ((uint32_t) __p0, > p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vidupq_u32(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_n_u32 ((uint32_t) __p0, > p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vidupq_u8(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vidupq_n_u8 ((uint32_t) __p0, p1)= , > \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vidupq_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vddupq_u16(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_n_u16 ((uint32_t) __p0, > p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vddupq_u32(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_n_u32 ((uint32_t) __p0, > p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_vddupq_u8(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > int (*)[__ARM_mve_type_int_n]: __arm_vddupq_n_u8 ((uint32_t) __p0, > p1), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1));}) > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vddupq_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1));}) >=20 > #define __arm_viwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_viwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 > (__ARM_mve_coerce3(p0, int), p1, (const int) p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1, (const int) p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, (const int) p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, (const int) p2));}) >=20 > #define __arm_viwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_viwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_vdwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_u32_ptr(__p1, uint32_t *), p2, p3, p4));}) >=20 > #define __arm_vdwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u16 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_vdwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u32 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_vdwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > - int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 > (__ARM_mve_coerce_i_scalar(__p0, int), p1, p2), \ > + int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u8 > (__ARM_mve_coerce_u32_ptr(__p0, uint32_t *), p1, p2));}) >=20 > #define __arm_vshlcq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41431,14 +41479,14 @@ extern void *__ARM_undef; > #define __arm_vaddlvaq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vaddlvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_p_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vaddlvq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41453,22 +41501,22 @@ extern void *__ARM_undef; > #define __arm_vaddvaq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_s8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int8x16_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_s16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_u8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_u16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vaddvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_p_s8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_p_u8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_p_u16 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_p_u32 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vaddvq(p0) ({ __typeof(p0) __p0 =3D (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41494,9 +41542,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpcsq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpcsq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpcsq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmpcsq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41504,9 +41552,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpcsq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpcsq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpcsq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2));}) >=20 > #define __arm_vcmphiq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41514,16 +41562,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmphiq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmphiq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmphiq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int)));}) >=20 > #define __arm_vcmphiq_m(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce_i_scalar(__p1, int), p2), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmphiq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmphiq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmphiq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > @@ -41620,34 +41668,34 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce_i_scalar(__p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t)), > \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) >=20 > #define __arm_vmladavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vmladavaxq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) >=20 > #define __arm_vmladavq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41690,17 +41738,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) >=20 > #define __arm_vmlaldavaxq(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)));}) >=20 > #define __arm_vmlaldavq(p0,p1) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > @@ -41864,22 +41912,22 @@ extern void *__ARM_undef; >=20 > #define __arm_vstrbq(p0,p1) ({ __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vstrbq_s8 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrbq_s16 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrbq_s32 (__ARM_mve_coerce(p0, int8_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vstrbq_u8 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrbq_u16 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrbq_u32 (__ARM_mve_coerce(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vstrbq_s8 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrbq_s16 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrbq_s32 (__ARM_mve_coerce_s8_ptr(p0, int8_t *), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vstrbq_u8 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrbq_u16 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrbq_u32 (__ARM_mve_coerce_u8_ptr(p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t)));}) >=20 > #define __arm_vstrbq_p(p0,p1,p2) ({ __typeof(p0) __p0 =3D (p0); \ > __typeof(p1) __p1 =3D (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, > \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vstrbq_p_s8 (__ARM_mve_coerce(__p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrbq_p_s16 (__ARM_mve_coerce(__p0, int8_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrbq_p_s32 (__ARM_mve_coerce(__p0, int8_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vstrbq_p_u8 (__ARM_mve_coerce(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrbq_p_u16 (__ARM_mve_coerce(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrbq_p_u32 (__ARM_mve_coerce(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int8x16_t]: > __arm_vstrbq_p_s8 (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int16x8_t]: > __arm_vstrbq_p_s16 (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_int32x4_t]: > __arm_vstrbq_p_s32 (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t]: > __arm_vstrbq_p_u8 (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t]: > __arm_vstrbq_p_u16 (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t]: > __arm_vstrbq_p_u32 (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >=20 > #define __arm_vstrdq_scatter_base(p0,p1,p2) ({ __typeof(p2) __p2 =3D (p2= ); \ > _Generic( (int (*)[__ARM_mve_typeid(__p2)])0, \ > @@ -41895,61 +41943,61 @@ extern void *__ARM_undef; > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), > \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce_i_scalar(__p0, > int), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vrmlaldavhaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 =3D (p0);= \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 > (__ARM_mve_coerce_i_scalar(__p0, int), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrbq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 =3D (= p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_mv > e_type_int8x16_t]: __arm_vstrbq_scatter_offset_s8 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, int8x16_t)), \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_mv > e_type_int16x8_t]: __arm_vstrbq_scatter_offset_s16 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t)), \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_mv > e_type_int32x4_t]: __arm_vstrbq_scatter_offset_s32 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t)), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vstrbq_scatter_offset_u8 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t)), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vstrbq_scatter_offset_u16 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vstrbq_scatter_offset_u32 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_mv > e_type_int8x16_t]: __arm_vstrbq_scatter_offset_s8 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, int8x16_t)), \ > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_mv > e_type_int16x8_t]: __arm_vstrbq_scatter_offset_s16 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t)), \ > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_mv > e_type_int32x4_t]: __arm_vstrbq_scatter_offset_s32 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t)), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vstrbq_scatter_offset_u8 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t)), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vstrbq_scatter_offset_u16 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t)), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vstrbq_scatter_offset_u32 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t)));}) >=20 > #define __arm_vstrbq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = =3D > (p0); \ > __typeof(p1) __p1 =3D (p1); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_mv > e_type_int8x16_t]: __arm_vstrbq_scatter_offset_p_s8 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_mv > e_type_int16x8_t]: __arm_vstrbq_scatter_offset_p_s16 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_mv > e_type_int32x4_t]: __arm_vstrbq_scatter_offset_p_s32 > (__ARM_mve_coerce(__p0, int8_t *), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vstrbq_scatter_offset_p_u8 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vstrbq_scatter_offset_p_u16 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vstrbq_scatter_offset_p_u32 > (__ARM_mve_coerce(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_mv > e_type_int8x16_t]: __arm_vstrbq_scatter_offset_p_s8 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, int8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_mv > e_type_int16x8_t]: __arm_vstrbq_scatter_offset_p_s16 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, int16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_mv > e_type_int32x4_t]: __arm_vstrbq_scatter_offset_p_s32 > (__ARM_mve_coerce_s8_ptr(__p0, int8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, int32x4_t), p3), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vstrbq_scatter_offset_p_u8 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint8x16_t), __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vstrbq_scatter_offset_p_u16 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint16x8_t), __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_uint8_t_ptr][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vstrbq_scatter_offset_p_u32 > (__ARM_mve_coerce_u8_ptr(__p0, uint8_t *), __ARM_mve_coerce(__p1, > uint32x4_t), __ARM_mve_coerce(__p2, uint32x4_t), p3));}) >=20 > #define __arm_vstrdq_scatter_offset_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = =3D > (p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_offset_p_s64 (__ARM_mve_coerce(__p0, int64_t *), > p1, __ARM_mve_coerce(__p2, int64x2_t), p3), \ > - int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_offset_p_u64 (__ARM_mve_coerce(__p0, uint64_t *), > p1, __ARM_mve_coerce(__p2, uint64x2_t), p3));}) > + int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_offset_p_s64 (__ARM_mve_coerce_s64_ptr(__p0, > int64_t *), p1, __ARM_mve_coerce(__p2, int64x2_t), p3), \ > + int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_offset_p_u64 (__ARM_mve_coerce_u64_ptr(__p0, > uint64_t *), p1, __ARM_mve_coerce(__p2, uint64x2_t), p3));}) >=20 > #define __arm_vstrdq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 =3D (= p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_offset_s64 (__ARM_mve_coerce(__p0, int64_t *), p1, > __ARM_mve_coerce(__p2, int64x2_t)), \ > - int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_offset_u64 (__ARM_mve_coerce(__p0, uint64_t *), p1, > __ARM_mve_coerce(__p2, uint64x2_t)));}) > + int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_offset_s64 (__ARM_mve_coerce_s64_ptr(__p0, int64_t > *), p1, __ARM_mve_coerce(__p2, int64x2_t)), \ > + int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_offset_u64 (__ARM_mve_coerce_u64_ptr(__p0, > uint64_t *), p1, __ARM_mve_coerce(__p2, uint64x2_t)));}) >=20 > #define __arm_vstrdq_scatter_shifted_offset_p(p0,p1,p2,p3) ({ __typeof(p= 0) > __p0 =3D (p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_shifted_offset_p_s64 (__ARM_mve_coerce(__p0, > int64_t *), p1, __ARM_mve_coerce(__p2, int64x2_t), p3), \ > - int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_shifted_offset_p_u64 (__ARM_mve_coerce(__p0, > uint64_t *), p1, __ARM_mve_coerce(__p2, uint64x2_t), p3));}) > + int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_shifted_offset_p_s64 > (__ARM_mve_coerce_s64_ptr(__p0, int64_t *), p1, __ARM_mve_coerce(__p2, > int64x2_t), p3), \ > + int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_shifted_offset_p_u64 > (__ARM_mve_coerce_u64_ptr(__p0, uint64_t *), p1, > __ARM_mve_coerce(__p2, uint64x2_t), p3));}) >=20 > #define __arm_vstrdq_scatter_shifted_offset(p0,p1,p2) ({ __typeof(p0) __= p0 > =3D (p0); \ > __typeof(p2) __p2 =3D (p2); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p2)])0, > \ > - int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_shifted_offset_s64 (__ARM_mve_coerce(__p0, int64_t > *), p1, __ARM_mve_coerce(__p2, int64x2_t)), \ > - int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_shifted_offset_u64 (__ARM_mve_coerce(__p0, > uint64_t *), p1, __ARM_mve_coerce(__p2, uint64x2_t)));}) > + int (*)[__ARM_mve_type_int64_t_ptr][__ARM_mve_type_int64x2_t]: > __arm_vstrdq_scatter_shifted_offset_s64 > (__ARM_mve_coerce_s64_ptr(__p0, int64_t *), p1, __ARM_mve_coerce(__p2, > int64x2_t)), \ > + int (*)[__ARM_mve_type_uint64_t_ptr][__ARM_mve_type_uint64x2_t]: > __arm_vstrdq_scatter_shifted_offset_u64 > (__ARM_mve_coerce_u64_ptr(__p0, uint64_t *), p1, > __ARM_mve_coerce(__p2, uint64x2_t)));}) >=20 > #endif /* __cplusplus */ > #endif /* __ARM_FEATURE_MVE */ > diff --git > a/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > fp.c > b/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > fp.c > index a2787a47859..a1e786ecd9f 100644 > --- > a/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > fp.c > +++ > b/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > fp.c > @@ -1,6 +1,7 @@ > /* { dg-require-effective-target arm_v8_1m_mve_fp_ok } */ > /* { dg-add-options arm_v8_1m_mve_fp } */ > -/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long" } */ > +/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long -Wno- > incompatible-pointer-types" { target c } } */ > +/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long -fpermissiv= e" > { target c++ } } */ > #include "arm_mve.h" >=20 > float f1; > @@ -10,35 +11,14 @@ float32_t f4; > __fp16 f5; > _Float16 f6; >=20 > -int i1; > -short i2; > -long i3; > -long long i4; > -int8_t i5; > -int16_t i6; > -int32_t i7; > -int64_t i8; > - > float16x8_t floatvec; > -int16x8_t intvec; >=20 > -void test(void) > +/* Test a few different supported ways of passing a scalar int value. > +The intrinsic vmulq was chosen arbitrarily, but it is representative of > +all intrinsics that take a non-const scalar value. */ > +void > +test_scalars (void) > { > - /* Test a few different supported ways of passing an int value. The > - intrinsic vmulq was chosen arbitrarily, but it is representative of > - all intrinsics that take a non-const scalar value. */ > - intvec =3D vmulq(intvec, 2); > - intvec =3D vmulq(intvec, (int32_t) 2); > - intvec =3D vmulq(intvec, (short) 2); > - intvec =3D vmulq(intvec, i1); > - intvec =3D vmulq(intvec, i2); > - intvec =3D vmulq(intvec, i3); > - intvec =3D vmulq(intvec, i4); > - intvec =3D vmulq(intvec, i5); > - intvec =3D vmulq(intvec, i6); > - intvec =3D vmulq(intvec, i7); > - intvec =3D vmulq(intvec, i8); > - > /* Test a few different supported ways of passing a float value. */ > floatvec =3D vmulq(floatvec, 0.5); > floatvec =3D vmulq(floatvec, 0.5f); > @@ -53,4 +33,25 @@ void test(void) > floatvec =3D vmulq(floatvec, (_Float16) 0.15); > } >=20 > +/* Next, test a number of valid pointer overloads. */ > +void > +foo11 (__fp16 * addr, float16x8_t value) > +{ > + vst1q (addr, value); > +} > + > +#ifndef __cplusplus > +void > +foo12 (_Float16 * addr, float16x8_t value) > +{ > + vst1q (addr, value); > +} > +#endif > + > +void > +foo13 (float * addr, float32x4_t value) > +{ > + vst1q (addr, value); > +} > + > /* { dg-final { scan-assembler-not "__ARM_undef" } } */ > diff --git > a/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > int.c > b/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > int.c > index 7b88f462e17..7947dc024bc 100644 > --- > a/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > int.c > +++ > b/gcc/testsuite/gcc.target/arm/mve/intrinsics/mve_intrinsic_type_overload= s- > int.c > @@ -1,7 +1,7 @@ > /* { dg-require-effective-target arm_v8_1m_mve_ok } */ > /* { dg-add-options arm_v8_1m_mve } */ > -/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long" } */ > - > +/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long -Wno- > incompatible-pointer-types" { target c } } */ > +/* { dg-additional-options "-O2 -Wno-pedantic -Wno-long-long -fpermissiv= e" > { target c++ } } */ > #include "arm_mve.h" >=20 > int i1; > @@ -15,11 +15,12 @@ int64_t i8; >=20 > int16x8_t intvec; >=20 > -void test(void) > +/* Test a few different supported ways of passing a scalar int value. > +The intrinsic vmulq was chosen arbitrarily, but it is representative of > +all intrinsics that take a non-const scalar value. */ > +void > +test_scalars (void) > { > - /* Test a few different supported ways of passing an int value. The > - intrinsic vmulq was chosen arbitrarily, but it is representative of > - all intrinsics that take a non-const scalar value. */ > intvec =3D vmulq(intvec, 2); > intvec =3D vmulq(intvec, (int32_t) 2); > intvec =3D vmulq(intvec, (short) 2); > @@ -33,4 +34,65 @@ void test(void) > intvec =3D vmulq(intvec, i8); > } >=20 > +/* Next, test a number of valid pointer overloads. */ > +void > +foo1 (signed char * addr, int8x16_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo2 (short * addr, int16x8_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo3 (int * addr, int32x4_t value) > +{ > + vst1q (addr, value); /* { dg-warning "invalid conversion" "" { target = c++ } } */ > +} > + > +void > +foo4 (long * addr, int32x4_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo5 (long long * addr, uint64x2_t value) > +{ > + vldrdq_gather_offset (addr, value); > +} > + > +void > +foo6 (unsigned char * addr, uint8x16_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo7 (unsigned short * addr, uint16x8_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo8 (unsigned int * addr, uint32x4_t value) > +{ > + vst1q (addr, value); /* { dg-warning "invalid conversion" "" { target = c++ } } */ > +} > + > +void > +foo9 (unsigned long * addr, uint32x4_t value) > +{ > + vst1q (addr, value); > +} > + > +void > +foo10 (unsigned long long * addr, uint64x2_t value) > +{ > + vldrdq_gather_offset (addr, value); > +} > + > /* { dg-final { scan-assembler-not "__ARM_undef" } } */ > -- > 2.25.1