From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Received: from EUR04-HE1-obe.outbound.protection.outlook.com (mail-eopbgr70089.outbound.protection.outlook.com [40.107.7.89]) by sourceware.org (Postfix) with ESMTPS id 089BE384D98F for ; Mon, 21 Nov 2022 10:47:00 +0000 (GMT) DMARC-Filter: OpenDMARC Filter v1.4.1 sourceware.org 089BE384D98F Authentication-Results: sourceware.org; dmarc=pass (p=none dis=none) header.from=arm.com Authentication-Results: sourceware.org; spf=pass smtp.mailfrom=arm.com DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=armh.onmicrosoft.com; s=selector2-armh-onmicrosoft-com; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=usTSCu1ChOe0dDUY7OS3HZ7qnk1FwVPMZgRpsAfSHeA=; b=OiBHY2dBR9XmRqzvRitlxClcM8DDQMEgpauFdkHQuSBEcYTQD8pikqSp9DMhEHhYFwTPftINh6AcabIim75hjAW+MNexLCTKLiM3Uqfu4dyinp1vzZ2SkfOou26bNF6pyrA2Rxjtym0CuzRJg73sNT3WMwy2NDnirK7nPBEtzXk= Received: from AS9PR06CA0766.eurprd06.prod.outlook.com (2603:10a6:20b:484::22) by PAWPR08MB8909.eurprd08.prod.outlook.com (2603:10a6:102:33a::19) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5857.17; Mon, 21 Nov 2022 10:46:53 +0000 Received: from AM7EUR03FT003.eop-EUR03.prod.protection.outlook.com (2603:10a6:20b:484:cafe::63) by AS9PR06CA0766.outlook.office365.com (2603:10a6:20b:484::22) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5834.13 via Frontend Transport; Mon, 21 Nov 2022 10:46:52 +0000 X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123) smtp.mailfrom=arm.com; dkim=pass (signature was verified) header.d=armh.onmicrosoft.com;dmarc=pass action=none header.from=arm.com; Received-SPF: Pass (protection.outlook.com: domain of arm.com designates 63.35.35.123 as permitted sender) receiver=protection.outlook.com; client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com; pr=C Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by AM7EUR03FT003.mail.protection.outlook.com (100.127.140.227) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5834.8 via Frontend Transport; Mon, 21 Nov 2022 10:46:52 +0000 Received: ("Tessian outbound 6c699027a257:v130"); Mon, 21 Nov 2022 10:46:52 +0000 X-CheckRecipientChecked: true X-CR-MTA-CID: de7790b9dbd6ddcb X-CR-MTA-TID: 64aa7808 Received: from c7654fa275eb.1 by 64aa7808-outbound-1.mta.getcheckrecipient.com id 2489574C-CB1C-4465-B390-C52F62D578AE.1; Mon, 21 Nov 2022 10:46:43 +0000 Received: from EUR02-VI1-obe.outbound.protection.outlook.com by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id c7654fa275eb.1 (version=TLSv1.2 cipher=ECDHE-RSA-AES256-GCM-SHA384); Mon, 21 Nov 2022 10:46:43 +0000 ARC-Seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=msezvNxhVR2TNWkg2VZ4Koc3sRWPXlV3NlYOY5Q/Ddsp+8YRJlgcDXF4TCDQPYB5ycSpo7WLgogX1DUsOB18A8Y0Evgmnc1WR7h+/y6AFcEDdPqhOP7lZOxvLoC4vc0sm8FRbWarepvFdPBYAVzzmEbAFwJ92gMhoxhQLYnKLYZsty8GUAWqjR9A8C++urFS8WRBuXN8HUQFeyoeGkDGDvXreHSfQhEPca4FZ2/nrwpmRyBxC/pKMhzUPKkbNiumR3w31+pVH2bLuy+/kVZR6b/tsnEno9o7NDlBFrLHF8lDWQVECEE7j6iiuxH0JG54AmpIMlOS2lawsbNo/CG63Q== ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1; bh=usTSCu1ChOe0dDUY7OS3HZ7qnk1FwVPMZgRpsAfSHeA=; b=oaGMxFDMtvG94HB3amttw2AZzbFqBq97IsEt92mKVN98msNIwDeCkleK6K4fU/0UWwgjPUwnQCW0vH7QDt7oJ8fJg2vMf4pB6SUSVFRkHkDBxljvJS4zy7d8hDatSsWMnpCNuwGPkxURgnDOWnUALyQNeNF+nwSggi9Od2wt7p1lOV6YWcjOQkRDAJcEZsznEqx1hW7BjTQQh+caLX76TIECaVACDiF2I8mNQNmCBmICDq+ZxvAvs3aLYvDOVun7MldPoIHC3KwXQ7nojS6BdPervW6YYU0Q4NYasBTtHi1f7BH2ectUVQHlOz7zQR1Mgo7zA15fOKIiZrR6Cgno3g== ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass smtp.mailfrom=arm.com; dmarc=pass action=none header.from=arm.com; dkim=pass header.d=arm.com; arc=none DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=armh.onmicrosoft.com; s=selector2-armh-onmicrosoft-com; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-SenderADCheck; bh=usTSCu1ChOe0dDUY7OS3HZ7qnk1FwVPMZgRpsAfSHeA=; b=OiBHY2dBR9XmRqzvRitlxClcM8DDQMEgpauFdkHQuSBEcYTQD8pikqSp9DMhEHhYFwTPftINh6AcabIim75hjAW+MNexLCTKLiM3Uqfu4dyinp1vzZ2SkfOou26bNF6pyrA2Rxjtym0CuzRJg73sNT3WMwy2NDnirK7nPBEtzXk= Authentication-Results-Original: dkim=none (message not signed) header.d=none;dmarc=none action=none header.from=arm.com; Received: from DB9PR08MB6507.eurprd08.prod.outlook.com (2603:10a6:10:25a::6) by AS2PR08MB9343.eurprd08.prod.outlook.com (2603:10a6:20b:598::19) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5857.13; Mon, 21 Nov 2022 10:46:35 +0000 Received: from DB9PR08MB6507.eurprd08.prod.outlook.com ([fe80::a98d:81cd:e426:fd21]) by DB9PR08MB6507.eurprd08.prod.outlook.com ([fe80::a98d:81cd:e426:fd21%7]) with mapi id 15.20.5857.017; Mon, 21 Nov 2022 10:46:35 +0000 Message-ID: <50a1bc4a-bf71-ff71-f20c-559fb8f6c84e@arm.com> Date: Mon, 21 Nov 2022 10:46:29 +0000 User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:102.0) Gecko/20100101 Thunderbird/102.5.0 Subject: Re: [PATCH 14/35] arm: propagate fixed overloading of MVE intrinsic scalar parameters Content-Language: en-US To: Kyrylo Tkachov , Andrea Corallo , "gcc-patches@gcc.gnu.org" Cc: Richard Earnshaw References: <20221117163809.1009526-1-andrea.corallo@arm.com> <20221117163809.1009526-15-andrea.corallo@arm.com> From: Stam Markianos-Wright In-Reply-To: Content-Type: text/plain; charset=UTF-8; format=flowed Content-Transfer-Encoding: 7bit X-ClientProxiedBy: LO2P265CA0190.GBRP265.PROD.OUTLOOK.COM (2603:10a6:600:a::34) To DB9PR08MB6507.eurprd08.prod.outlook.com (2603:10a6:10:25a::6) MIME-Version: 1.0 X-MS-TrafficTypeDiagnostic: DB9PR08MB6507:EE_|AS2PR08MB9343:EE_|AM7EUR03FT003:EE_|PAWPR08MB8909:EE_ X-MS-Office365-Filtering-Correlation-Id: f332575c-9013-4a9e-059a-08dacbadb3a0 x-checkrecipientrouted: true NoDisclaimer: true X-MS-Exchange-SenderADCheck: 1 X-MS-Exchange-AntiSpam-Relay: 0 X-Microsoft-Antispam-Untrusted: BCL:0; X-Microsoft-Antispam-Message-Info-Original: IKZyMGS5gB369FBmJTwcm/EQinAGsaE6hAdIhigIrxWfFfrNkGqxF2c+uuCq8uf4r9ZE9KyLDt+OCxNhsgg2F2Bn4tIhFa2ro8OUHkAw4JuHYQVFaMia3OksIpznq7atHUqrZ8sq1cCBspmRcd+m3kNENjwcjVpGAh4B9B5PYQAAkPlkxFX9drWFTAGFsPAw+OhQuqXAXI9WgG6ZWR019+DAYtnUq0QWPl4QQPT7eES/YXSclde9N15JaqBkS5juk0nBZm1t9ZT4jNCymlpoYX3AiYRHz3Qqvxip5sjFK8fUIV0GEhSEvjM3hRnzXUMCBbdqA7/H4JQCjnO74eix/DBsmxeOV9hUymZwVuVM3KVQ1PsMG6OmcpkUUloQ1/6mb/eZru8qaB1sjqufzHfHV2p5ZSz90SCxqeRGkgi/0+TIGML4dMPISHT2pjk0ENr40ir9KEZMnLoLBcbSnIP207JbCbBZTa61icxRqjQdalZ2fBugTQn9KQ/UqvPC1eKJHynjUL9q9BqSSslkGhk2h2DDmISo1wg53hG2odvXsAEiNAirf5/R7YsC4Ma1rcVprznOrDIJQNmv3vxd0SeUDm63sMo41rdpqk2xZPTeV1VmldkdJTtqumLcWJMrtbHjH2FoYGRSPDkjl2dVqlZeVfO4tp0uOH+PW3ldXqcrrA5db9r4BMKejLPg9sf5CB5AjEbeoNIIb1CUXKhj960boKdje7Hp9ZM3KLZtiJg6VtA= X-Forefront-Antispam-Report-Untrusted: CIP:255.255.255.255;CTRY:;LANG:en;SCL:1;SRV:;IPV:NLI;SFV:NSPM;H:DB9PR08MB6507.eurprd08.prod.outlook.com;PTR:;CAT:NONE;SFS:(13230022)(4636009)(396003)(366004)(39860400002)(346002)(376002)(136003)(451199015)(6486002)(66946007)(316002)(30864003)(110136005)(478600001)(8676002)(5660300002)(41300700001)(8936002)(66556008)(4326008)(66476007)(2906002)(31686004)(31696002)(86362001)(36756003)(26005)(83380400001)(53546011)(6512007)(186003)(2616005)(6666004)(6506007)(38100700002)(43740500002)(45980500001)(559001)(579004);DIR:OUT;SFP:1101; X-MS-Exchange-Transport-CrossTenantHeadersStamped: AS2PR08MB9343 Original-Authentication-Results: dkim=none (message not signed) header.d=none;dmarc=none action=none header.from=arm.com; X-EOPAttributedMessage: 0 X-MS-Exchange-Transport-CrossTenantHeadersStripped: AM7EUR03FT003.eop-EUR03.prod.protection.outlook.com X-MS-PublicTrafficType: Email X-MS-Office365-Filtering-Correlation-Id-Prvs: 405cd8ef-f4da-4a5a-6ffb-08dacbada884 X-Microsoft-Antispam: BCL:0; X-Microsoft-Antispam-Message-Info: nuKMxrtV2tFumHp8d0zH4RlcKmsrpDWdLeZAfMaq42gn27CZ/31b3KaHVwLMEzyDYLWJa5ifyOKsM2WYWqsVh9FzY3wW0+RrSlUu9l6uUoACuBcjx4xw1HTSj0RFduXgDqf6SrTkEgg6uWWwGWF4rjxFUYv7Mf00fInavV8OqgI7kILF45FcBFzGOKeIzJ1as8YTExfS14xZF+JAkoGZFp+3iJfQQf75ecgpk9gdRvmJ8mcfofjmIV8ZSBss9mqMBAId1xLpwsqfsU/cPbdRgw9iA3zR69QmP/dKEhIPDW3+8DrPnZKLV7sXOaljRrMhD9/4kmlMiL2aT7F5rnAp0kpq8O/uKqIQrfsTWr3cwsm0aTQyXFgzt2G8ziJF9sob22v/U77Aaq3cJe4HdWXPswuMAuIURMv1LURua9x9XKRTlcm7DKASBSA5fTc5Nj+BNEIE4aYwbgwra+dsZyfAoS4e1sqHn+36l/HJbRX06d8aW6QY9mkUiTLPw8BQU/JnEkqkW+3iUo+th+W+KZ7QRTuaUFnOVr/tbc8sUXgw/h3IIMKGaHwEFaQDI59TSYnALEMMYpYQlVIB9qEdjX+x2VZyDMktqsQ6zaaQRAMV/L8HE7Gi0aSnhFW2hJbZ4K/T2fVlVy9ImsyKmuWV42Q1VMwXhtbmlMyBl2iSXbp/HC7dxpbj8dFp73TkNnehocDjUSZUgXTxjeYWyYTHoaAiYblaCL2Ul9wW8ftIFqmtrmE= X-Forefront-Antispam-Report: CIP:63.35.35.123;CTRY:IE;LANG:en;SCL:1;SRV:;IPV:CAL;SFV:NSPM;H:64aa7808-outbound-1.mta.getcheckrecipient.com;PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com;CAT:NONE;SFS:(13230022)(4636009)(396003)(39860400002)(346002)(376002)(136003)(451199015)(36840700001)(46966006)(40470700004)(6666004)(478600001)(6486002)(31686004)(70586007)(36756003)(110136005)(6512007)(41300700001)(8676002)(4326008)(70206006)(8936002)(186003)(2616005)(30864003)(26005)(40460700003)(336012)(5660300002)(53546011)(316002)(6506007)(83380400001)(82740400003)(2906002)(86362001)(31696002)(47076005)(40480700001)(36860700001)(82310400005)(81166007)(356005)(43740500002)(559001)(579004);DIR:OUT;SFP:1101; X-OriginatorOrg: arm.com X-MS-Exchange-CrossTenant-OriginalArrivalTime: 21 Nov 2022 10:46:52.8954 (UTC) X-MS-Exchange-CrossTenant-Network-Message-Id: f332575c-9013-4a9e-059a-08dacbadb3a0 X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d;Ip=[63.35.35.123];Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com] X-MS-Exchange-CrossTenant-AuthSource: AM7EUR03FT003.eop-EUR03.prod.protection.outlook.com X-MS-Exchange-CrossTenant-AuthAs: Anonymous X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem X-MS-Exchange-Transport-CrossTenantHeadersStamped: PAWPR08MB8909 X-Spam-Status: No, score=-12.6 required=5.0 tests=BAYES_00,DKIM_SIGNED,DKIM_VALID,FORGED_SPF_HELO,GIT_PATCH_0,KAM_DMARC_NONE,NICE_REPLY_A,RCVD_IN_DNSWL_NONE,RCVD_IN_MSPIKE_H2,SPF_HELO_PASS,SPF_NONE,TXREP,UNPARSEABLE_RELAY autolearn=ham autolearn_force=no version=3.4.6 X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org List-Id: On 11/18/22 16:51, Kyrylo Tkachov wrote: > >> -----Original Message----- >> From: Andrea Corallo >> Sent: Thursday, November 17, 2022 4:38 PM >> To: gcc-patches@gcc.gnu.org >> Cc: Kyrylo Tkachov ; Richard Earnshaw >> ; Stam Markianos-Wright > Wright@arm.com> >> Subject: [PATCH 14/35] arm: propagate fixed overloading of MVE intrinsic >> scalar parameters >> >> From: Stam Markianos-Wright >> >> This is a mechanical patch that propagates the change proposed in >> my previous patch for vaddq[_m]_n >> across all other polymorphic MVE intrinsic overloads of scalar types. >> >> The find and Replace patterns used were: >> >> s/__ARM_mve_coerce\(__p(\d+), [u]?int(8|16|32|64)_t\) >> /__ARM_mve_coerce3(p$1, int)/g >> >> s/__ARM_mve_coerce2\(__p(\d+), double\) >> /__ARM_mve_coerce2(p$1, double)/g >> >> gcc/ChangeLog: >> >> * config/arm/arm_mve.h (__arm_vaddq): Fix Overloading. >> (__arm_vmulq): Likewise. >> (__arm_vcmpeqq): Likewise. >> (__arm_vcmpneq): Likewise. >> (__arm_vmaxnmavq): Likewise. >> (__arm_vmaxnmvq): Likewise. >> (__arm_vminnmavq): Likewise. >> (__arm_vsubq): Likewise. >> (__arm_vminnmvq): Likewise. >> (__arm_vrshlq): Likewise. >> (__arm_vqsubq): Likewise. >> (__arm_vqdmulltq): Likewise. >> (__arm_vqdmullbq): Likewise. >> (__arm_vqdmulhq): Likewise. >> (__arm_vqaddq): Likewise. >> (__arm_vhaddq): Likewise. >> (__arm_vhsubq): Likewise. >> (__arm_vqdmlashq): Likewise. >> (__arm_vqrdmlahq): Likewise. >> (__arm_vmlasq): Likewise. >> (__arm_vqdmlahq): Likewise. >> (__arm_vmaxnmavq_p): Likewise. >> (__arm_vmaxnmvq_p): Likewise. >> (__arm_vminnmavq_p): Likewise. >> (__arm_vminnmvq_p): Likewise. >> (__arm_vfmasq_m): Likewise. >> (__arm_vsetq_lane): Likewise. >> (__arm_vcmpneq_m): Likewise. >> (__arm_vhaddq_x): Likewise. >> (__arm_vhsubq_x): Likewise. >> (__arm_vqrdmlashq_m): Likewise. >> (__arm_vqdmlashq_m): Likewise. >> (__arm_vmlaldavaxq_p): Likewise. >> (__arm_vmlasq_m): Likewise. >> (__arm_vqdmulhq_m): Likewise. >> (__arm_vqdmulltq_m): Likewise. >> (__arm_viwdupq_m): Likewise. >> (__arm_viwdupq_u16): Likewise. >> (__arm_viwdupq_u32): Likewise. >> (__arm_viwdupq_u8): Likewise. >> (__arm_vdwdupq_m): Likewise. >> (__arm_vdwdupq_u16): Likewise. >> (__arm_vdwdupq_u32): Likewise. >> (__arm_vdwdupq_u8): Likewise. >> (__arm_vaddlvaq): Likewise. >> (__arm_vaddlvaq_p): Likewise. >> (__arm_vaddvaq): Likewise. >> (__arm_vaddvaq_p): Likewise. >> (__arm_vcmphiq_m): Likewise. >> (__arm_vmladavaq_p): Likewise. >> (__arm_vmladavaxq): Likewise. >> (__arm_vmlaldavaxq): Likewise. >> (__arm_vrmlaldavhaq_p): Likewise. > IMO this should have been squashed with the previous patch. > Is all this covered by the tests that we have (or that you're improving in this series)? Thanks for the review! Yes, I just kept them separate because the last one was done manually as a partial revert of what was previously done, whereas the other was all a mechanical find n replace -- but the end result they both get to is the same, tbh... Also, yep, this batch of tests fully covers the intrinsics that were changed with this patch (and the vaddq patch) and we've also added testcases that take immediate `1` for the `_n` variants. > Ok if so. > Thanks, > Kyrill > >> --- >> gcc/config/arm/arm_mve.h | 1106 +++++++++++++++++++------------------- >> 1 file changed, 553 insertions(+), 553 deletions(-) >> >> diff --git a/gcc/config/arm/arm_mve.h b/gcc/config/arm/arm_mve.h >> index 951dc25374b..fd1876b57a0 100644 >> --- a/gcc/config/arm/arm_mve.h >> +++ b/gcc/config/arm/arm_mve.h >> @@ -35881,8 +35881,8 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -35927,14 +35927,14 @@ extern void *__ARM_undef; >> #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -35959,14 +35959,14 @@ extern void *__ARM_undef; >> #define __arm_vcmpeqq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpeqq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpeqq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpeqq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -35997,16 +35997,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpeqq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpeqq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36014,13 +36014,13 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgtq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgtq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36030,11 +36030,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpleq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpleq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36042,25 +36042,25 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpltq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpltq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36115,8 +36115,8 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vmaxnmq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36127,14 +36127,14 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vminnmaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36145,8 +36145,8 @@ extern void *__ARM_undef; >> #define __arm_vminnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vbrsrq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -36168,14 +36168,14 @@ extern void *__ARM_undef; >> #define __arm_vsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36188,8 +36188,8 @@ extern void *__ARM_undef; >> #define __arm_vminnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -36244,12 +36244,12 @@ extern void *__ARM_undef; >> #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36280,12 +36280,12 @@ extern void *__ARM_undef; >> #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36336,12 +36336,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36349,9 +36349,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vmlaldavxq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36384,8 +36384,8 @@ extern void *__ARM_undef; >> #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> @@ -36398,17 +36398,17 @@ extern void *__ARM_undef; >> #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> @@ -36416,12 +36416,12 @@ extern void *__ARM_undef; >> #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36454,12 +36454,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36484,12 +36484,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36632,12 +36632,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), >> \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vsriq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36716,44 +36716,44 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t)), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vqdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36943,11 +36943,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgtq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgtq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> @@ -36959,11 +36959,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpleq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpleq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36973,11 +36973,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpltq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpltq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36990,14 +36990,14 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpneq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpneq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcvtbq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37051,8 +37051,8 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double)), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double)), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double)), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double)), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vfmaq_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t)), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vfmaq_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t)));}) >> >> @@ -37067,8 +37067,8 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double)), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double)));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double)), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double)));}) >> >> #define __arm_vmaxnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37091,14 +37091,14 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vmaxnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vminnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37109,14 +37109,14 @@ extern void *__ARM_undef; >> #define __arm_vminnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vminnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vrndnq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37178,13 +37178,13 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgeq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgeq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vrshrnbq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37285,11 +37285,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgeq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgeq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> @@ -37324,8 +37324,8 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vandq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37466,15 +37466,15 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vfmaq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vfmaq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vfmasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vfmsq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37509,14 +37509,14 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vmulq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vmulq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vmulq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37543,14 +37543,14 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vsubq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vsubq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vsubq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vorrq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38023,19 +38023,19 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vaddq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vaddq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vandq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -38158,19 +38158,19 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vmulq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vmulq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ >> @@ -38258,8 +38258,8 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vsubq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vsubq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vcmulq_rot90_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -38283,16 +38283,16 @@ extern void *__ARM_undef; >> #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint64x2_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vsetq_lane_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vsetq_lane_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint64x2_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vsetq_lane_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vsetq_lane_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #else /* MVE Integer. */ >> >> @@ -38410,12 +38410,12 @@ extern void *__ARM_undef; >> #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38442,12 +38442,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vsubq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vsubq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vsubq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -38461,12 +38461,12 @@ extern void *__ARM_undef; >> #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38497,12 +38497,12 @@ extern void *__ARM_undef; >> #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38571,12 +38571,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38584,16 +38584,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> @@ -38601,12 +38601,12 @@ extern void *__ARM_undef; >> #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38637,12 +38637,12 @@ extern void *__ARM_undef; >> #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38717,12 +38717,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38747,12 +38747,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38858,12 +38858,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqmovntq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38944,16 +38944,16 @@ extern void *__ARM_undef; >> #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> @@ -38963,9 +38963,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38973,9 +38973,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38983,9 +38983,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpleq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpleq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38993,20 +38993,20 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> @@ -39031,12 +39031,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vbicq_m_n(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -39146,25 +39146,25 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39227,9 +39227,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> >> #define __arm_vcmpgtq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> @@ -39238,9 +39238,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpleq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39248,9 +39248,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpleq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpleq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39258,9 +39258,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39271,12 +39271,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpneq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vdupq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39299,23 +39299,23 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), >> \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t)), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vnegq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39340,9 +39340,9 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlsdhq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39505,12 +39505,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vsubq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vsubq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vsubq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -39610,12 +39610,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39660,12 +39660,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vmulq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vmulq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vmulq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -40002,15 +40002,15 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vcaddq_rot270_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -40104,15 +40104,15 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ >> @@ -40234,14 +40234,14 @@ extern void *__ARM_undef; >> #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint64x2_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint64x2_t), p2));}) >> >> #endif /* MVE Integer. */ >> >> @@ -40421,12 +40421,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> @@ -40451,12 +40451,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> @@ -40576,25 +40576,25 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrshlq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40695,12 +40695,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqsubq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqsubq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqsubq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -40715,9 +40715,9 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqrdmulhq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqrdmulhq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqrdmulhq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrdmlsdhxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40843,17 +40843,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vmlaldavaxq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3));}) >> >> #define __arm_vmlsldavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40992,12 +40992,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vhaddq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vhaddq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vhaddq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -41031,12 +41031,12 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_uint8x16_t]: __arm_vhsubq_m_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_uint16x8_t]: __arm_vhsubq_m_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vhsubq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmaxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41064,23 +41064,23 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmlasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41126,12 +41126,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqaddq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqaddq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqaddq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -41143,17 +41143,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqdmulhq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmulhq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmulhq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> @@ -41164,15 +41164,15 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmullbq_m_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmullbq_m_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmulltq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmulltq_m_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmulltq_m_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> >> @@ -41238,9 +41238,9 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce(__p0, >> int32_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce(__p0, >> int32_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3));}) >> >> #define __arm_vmullbq_poly_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41311,51 +41311,51 @@ extern void *__ARM_undef; >> #define __arm_viwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) >> >> #define __arm_viwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 >> (__ARM_mve_coerce(__p0, uint32_t), p1, (const int) p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 >> (__ARM_mve_coerce3(p0, int), p1, (const int) p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u16 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, (const int) p2));}) >> >> #define __arm_viwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u32 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_viwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u8 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) >> >> #define __arm_vdwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u16 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u32 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u8 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vshlcq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> @@ -41392,14 +41392,14 @@ extern void *__ARM_undef; >> #define __arm_vaddlvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_u32 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> >> #define __arm_vaddlvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_p_u32 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> >> #define __arm_vaddlvq(p0) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -41414,22 +41414,22 @@ extern void *__ARM_undef; >> #define __arm_vaddvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_u16 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> >> #define __arm_vaddvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_p_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_p_u16 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_p_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> >> #define __arm_vaddvq(p0) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -41455,9 +41455,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpcsq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpcsq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpcsq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpcsq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41465,9 +41465,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpcsq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpcsq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpcsq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmphiq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41475,16 +41475,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmphiq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmphiq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmphiq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmphiq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmphiq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmphiq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmphiq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> @@ -41581,34 +41581,34 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmladavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vmladavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmladavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41651,17 +41651,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmlaldavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)));}) >> >> #define __arm_vmlaldavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41856,15 +41856,15 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vrmlaldavhaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vstrbq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); >> \ >> __typeof(p1) __p1 = (p1); \ >> -- >> 2.25.1