| // Copyright (c) 2018 Google LLC. |
| // |
| // Licensed under the Apache License, Version 2.0 (the "License"); |
| // you may not use this file except in compliance with the License. |
| // You may obtain a copy of the License at |
| // |
| // http://www.apache.org/licenses/LICENSE-2.0 |
| // |
| // Unless required by applicable law or agreed to in writing, software |
| // distributed under the License is distributed on an "AS IS" BASIS, |
| // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. |
| // See the License for the specific language governing permissions and |
| // limitations under the License. |
| |
| #include <algorithm> |
| #include <iterator> |
| #include <memory> |
| #include <string> |
| #include <vector> |
| |
| #include "gmock/gmock.h" |
| #include "source/opt/loop_descriptor.h" |
| #include "source/opt/loop_fusion.h" |
| #include "test/opt/pass_fixture.h" |
| |
| namespace spvtools { |
| namespace opt { |
| namespace { |
| |
| using FusionIllegalTest = PassTest<::testing::Test>; |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| int[10] c; |
| // Illegal, loop-independent dependence will become a |
| // backward loop-carried antidependence |
| for (int i = 0; i < 10; i++) { |
| a[i] = b[i] + 1; |
| } |
| for (int i = 0; i < 10; i++) { |
| c[i] = a[i+1] + 2; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, PositiveDistanceCreatedRAW) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %23 "a" |
| OpName %25 "b" |
| OpName %34 "i" |
| OpName %42 "c" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypePointer Function %21 |
| %29 = OpConstant %6 1 |
| %48 = OpConstant %6 2 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %23 = OpVariable %22 Function |
| %25 = OpVariable %22 Function |
| %34 = OpVariable %7 Function |
| %42 = OpVariable %22 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %53 = OpPhi %6 %9 %5 %33 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %53 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %27 = OpAccessChain %7 %25 %53 |
| %28 = OpLoad %6 %27 |
| %30 = OpIAdd %6 %28 %29 |
| %31 = OpAccessChain %7 %23 %53 |
| OpStore %31 %30 |
| OpBranch %13 |
| %13 = OpLabel |
| %33 = OpIAdd %6 %53 %29 |
| OpStore %8 %33 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %34 %9 |
| OpBranch %35 |
| %35 = OpLabel |
| %54 = OpPhi %6 %9 %12 %52 %38 |
| OpLoopMerge %37 %38 None |
| OpBranch %39 |
| %39 = OpLabel |
| %41 = OpSLessThan %17 %54 %16 |
| OpBranchConditional %41 %36 %37 |
| %36 = OpLabel |
| %45 = OpIAdd %6 %54 %29 |
| %46 = OpAccessChain %7 %23 %45 |
| %47 = OpLoad %6 %46 |
| %49 = OpIAdd %6 %47 %48 |
| %50 = OpAccessChain %7 %42 %54 |
| OpStore %50 %49 |
| OpBranch %38 |
| %38 = OpLabel |
| %52 = OpIAdd %6 %54 %29 |
| OpStore %34 %52 |
| OpBranch %35 |
| %37 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| #version 440 core |
| |
| int func() { |
| return 10; |
| } |
| |
| void main() { |
| int[10] a; |
| int[10] b; |
| // Illegal, function call |
| for (int i = 0; i < 10; i++) { |
| a[i] = func(); |
| } |
| for (int i = 0; i < 10; i++) { |
| b[i] = a[i]; |
| } |
| } |
| */ |
| TEST_F(FusionIllegalTest, FunctionCall) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "func(" |
| OpName %14 "i" |
| OpName %28 "a" |
| OpName %35 "i" |
| OpName %43 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypeFunction %6 |
| %10 = OpConstant %6 10 |
| %13 = OpTypePointer Function %6 |
| %15 = OpConstant %6 0 |
| %22 = OpTypeBool |
| %24 = OpTypeInt 32 0 |
| %25 = OpConstant %24 10 |
| %26 = OpTypeArray %6 %25 |
| %27 = OpTypePointer Function %26 |
| %33 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %14 = OpVariable %13 Function |
| %28 = OpVariable %27 Function |
| %35 = OpVariable %13 Function |
| %43 = OpVariable %27 Function |
| OpStore %14 %15 |
| OpBranch %16 |
| %16 = OpLabel |
| %51 = OpPhi %6 %15 %5 %34 %19 |
| OpLoopMerge %18 %19 None |
| OpBranch %20 |
| %20 = OpLabel |
| %23 = OpSLessThan %22 %51 %10 |
| OpBranchConditional %23 %17 %18 |
| %17 = OpLabel |
| %30 = OpFunctionCall %6 %8 |
| %31 = OpAccessChain %13 %28 %51 |
| OpStore %31 %30 |
| OpBranch %19 |
| %19 = OpLabel |
| %34 = OpIAdd %6 %51 %33 |
| OpStore %14 %34 |
| OpBranch %16 |
| %18 = OpLabel |
| OpStore %35 %15 |
| OpBranch %36 |
| %36 = OpLabel |
| %52 = OpPhi %6 %15 %18 %50 %39 |
| OpLoopMerge %38 %39 None |
| OpBranch %40 |
| %40 = OpLabel |
| %42 = OpSLessThan %22 %52 %10 |
| OpBranchConditional %42 %37 %38 |
| %37 = OpLabel |
| %46 = OpAccessChain %13 %28 %52 |
| %47 = OpLoad %6 %46 |
| %48 = OpAccessChain %13 %43 %52 |
| OpStore %48 %47 |
| OpBranch %39 |
| %39 = OpLabel |
| %50 = OpIAdd %6 %52 %33 |
| OpStore %35 %50 |
| OpBranch %36 |
| %38 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| %8 = OpFunction %6 None %7 |
| %9 = OpLabel |
| OpReturnValue %10 |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 16 |
| #version 440 core |
| void main() { |
| int[10][10] a; |
| int[10][10] b; |
| int[10][10] c; |
| // Illegal outer. |
| for (int i = 0; i < 10; i++) { |
| for (int j = 0; j < 10; j++) { |
| c[i][j] = a[i][j] + 2; |
| } |
| } |
| for (int i = 0; i < 10; i++) { |
| for (int j = 0; j < 10; j++) { |
| b[i][j] = c[i+1][j] + 10; |
| } |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, PositiveDistanceCreatedRAWOuterLoop) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %19 "j" |
| OpName %32 "c" |
| OpName %35 "a" |
| OpName %48 "i" |
| OpName %56 "j" |
| OpName %64 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %27 = OpTypeInt 32 0 |
| %28 = OpConstant %27 10 |
| %29 = OpTypeArray %6 %28 |
| %30 = OpTypeArray %29 %28 |
| %31 = OpTypePointer Function %30 |
| %40 = OpConstant %6 2 |
| %44 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %19 = OpVariable %7 Function |
| %32 = OpVariable %31 Function |
| %35 = OpVariable %31 Function |
| %48 = OpVariable %7 Function |
| %56 = OpVariable %7 Function |
| %64 = OpVariable %31 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %78 = OpPhi %6 %9 %5 %47 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %78 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| OpStore %19 %9 |
| OpBranch %20 |
| %20 = OpLabel |
| %82 = OpPhi %6 %9 %11 %45 %23 |
| OpLoopMerge %22 %23 None |
| OpBranch %24 |
| %24 = OpLabel |
| %26 = OpSLessThan %17 %82 %16 |
| OpBranchConditional %26 %21 %22 |
| %21 = OpLabel |
| %38 = OpAccessChain %7 %35 %78 %82 |
| %39 = OpLoad %6 %38 |
| %41 = OpIAdd %6 %39 %40 |
| %42 = OpAccessChain %7 %32 %78 %82 |
| OpStore %42 %41 |
| OpBranch %23 |
| %23 = OpLabel |
| %45 = OpIAdd %6 %82 %44 |
| OpStore %19 %45 |
| OpBranch %20 |
| %22 = OpLabel |
| OpBranch %13 |
| %13 = OpLabel |
| %47 = OpIAdd %6 %78 %44 |
| OpStore %8 %47 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %48 %9 |
| OpBranch %49 |
| %49 = OpLabel |
| %79 = OpPhi %6 %9 %12 %77 %52 |
| OpLoopMerge %51 %52 None |
| OpBranch %53 |
| %53 = OpLabel |
| %55 = OpSLessThan %17 %79 %16 |
| OpBranchConditional %55 %50 %51 |
| %50 = OpLabel |
| OpStore %56 %9 |
| OpBranch %57 |
| %57 = OpLabel |
| %80 = OpPhi %6 %9 %50 %75 %60 |
| OpLoopMerge %59 %60 None |
| OpBranch %61 |
| %61 = OpLabel |
| %63 = OpSLessThan %17 %80 %16 |
| OpBranchConditional %63 %58 %59 |
| %58 = OpLabel |
| %68 = OpIAdd %6 %79 %44 |
| %70 = OpAccessChain %7 %32 %68 %80 |
| %71 = OpLoad %6 %70 |
| %72 = OpIAdd %6 %71 %16 |
| %73 = OpAccessChain %7 %64 %79 %80 |
| OpStore %73 %72 |
| OpBranch %60 |
| %60 = OpLabel |
| %75 = OpIAdd %6 %80 %44 |
| OpStore %56 %75 |
| OpBranch %57 |
| %59 = OpLabel |
| OpBranch %52 |
| %52 = OpLabel |
| %77 = OpIAdd %6 %79 %44 |
| OpStore %48 %77 |
| OpBranch %49 |
| %51 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 4u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| auto loop_0 = loops[0]; |
| auto loop_1 = loops[1]; |
| auto loop_2 = loops[2]; |
| auto loop_3 = loops[3]; |
| |
| { |
| LoopFusion fusion(context.get(), loop_0, loop_1); |
| EXPECT_FALSE(fusion.AreCompatible()); |
| } |
| |
| { |
| LoopFusion fusion(context.get(), loop_0, loop_2); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| |
| { |
| LoopFusion fusion(context.get(), loop_1, loop_2); |
| EXPECT_FALSE(fusion.AreCompatible()); |
| } |
| |
| { |
| LoopFusion fusion(context.get(), loop_2, loop_3); |
| EXPECT_FALSE(fusion.AreCompatible()); |
| } |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 19 |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| int[10] c; |
| // Illegal, would create a backward loop-carried anti-dependence. |
| for (int i = 0; i < 10; i++) { |
| c[i] = a[i] + 1; |
| } |
| for (int i = 0; i < 10; i++) { |
| a[i+1] = c[i] + 2; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, PositiveDistanceCreatedWAR) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %23 "c" |
| OpName %25 "a" |
| OpName %34 "i" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypePointer Function %21 |
| %29 = OpConstant %6 1 |
| %47 = OpConstant %6 2 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %23 = OpVariable %22 Function |
| %25 = OpVariable %22 Function |
| %34 = OpVariable %7 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %52 = OpPhi %6 %9 %5 %33 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %52 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %27 = OpAccessChain %7 %25 %52 |
| %28 = OpLoad %6 %27 |
| %30 = OpIAdd %6 %28 %29 |
| %31 = OpAccessChain %7 %23 %52 |
| OpStore %31 %30 |
| OpBranch %13 |
| %13 = OpLabel |
| %33 = OpIAdd %6 %52 %29 |
| OpStore %8 %33 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %34 %9 |
| OpBranch %35 |
| %35 = OpLabel |
| %53 = OpPhi %6 %9 %12 %51 %38 |
| OpLoopMerge %37 %38 None |
| OpBranch %39 |
| %39 = OpLabel |
| %41 = OpSLessThan %17 %53 %16 |
| OpBranchConditional %41 %36 %37 |
| %36 = OpLabel |
| %43 = OpIAdd %6 %53 %29 |
| %45 = OpAccessChain %7 %23 %53 |
| %46 = OpLoad %6 %45 |
| %48 = OpIAdd %6 %46 %47 |
| %49 = OpAccessChain %7 %25 %43 |
| OpStore %49 %48 |
| OpBranch %38 |
| %38 = OpLabel |
| %51 = OpIAdd %6 %53 %29 |
| OpStore %34 %51 |
| OpBranch %35 |
| %37 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 21 |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| int[10] c; |
| // Illegal, would create a backward loop-carried anti-dependence. |
| for (int i = 0; i < 10; i++) { |
| a[i] = b[i] + 1; |
| } |
| for (int i = 0; i < 10; i++) { |
| a[i+1] = c[i+1] + 2; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, PositiveDistanceCreatedWAW) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %23 "a" |
| OpName %25 "b" |
| OpName %34 "i" |
| OpName %44 "c" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypePointer Function %21 |
| %29 = OpConstant %6 1 |
| %49 = OpConstant %6 2 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %23 = OpVariable %22 Function |
| %25 = OpVariable %22 Function |
| %34 = OpVariable %7 Function |
| %44 = OpVariable %22 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %54 = OpPhi %6 %9 %5 %33 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %54 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %27 = OpAccessChain %7 %25 %54 |
| %28 = OpLoad %6 %27 |
| %30 = OpIAdd %6 %28 %29 |
| %31 = OpAccessChain %7 %23 %54 |
| OpStore %31 %30 |
| OpBranch %13 |
| %13 = OpLabel |
| %33 = OpIAdd %6 %54 %29 |
| OpStore %8 %33 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %34 %9 |
| OpBranch %35 |
| %35 = OpLabel |
| %55 = OpPhi %6 %9 %12 %53 %38 |
| OpLoopMerge %37 %38 None |
| OpBranch %39 |
| %39 = OpLabel |
| %41 = OpSLessThan %17 %55 %16 |
| OpBranchConditional %41 %36 %37 |
| %36 = OpLabel |
| %43 = OpIAdd %6 %55 %29 |
| %46 = OpIAdd %6 %55 %29 |
| %47 = OpAccessChain %7 %44 %46 |
| %48 = OpLoad %6 %47 |
| %50 = OpIAdd %6 %48 %49 |
| %51 = OpAccessChain %7 %23 %43 |
| OpStore %51 %50 |
| OpBranch %38 |
| %38 = OpLabel |
| %53 = OpIAdd %6 %55 %29 |
| OpStore %34 %53 |
| OpBranch %35 |
| %37 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 28 |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| |
| int sum_0 = 0; |
| |
| // Illegal |
| for (int i = 0; i < 10; i++) { |
| sum_0 += a[i]; |
| } |
| for (int j = 0; j < 10; j++) { |
| sum_0 += b[j]; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, SameReductionVariable) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "sum_0" |
| OpName %10 "i" |
| OpName %24 "a" |
| OpName %33 "j" |
| OpName %41 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %17 = OpConstant %6 10 |
| %18 = OpTypeBool |
| %20 = OpTypeInt 32 0 |
| %21 = OpConstant %20 10 |
| %22 = OpTypeArray %6 %21 |
| %23 = OpTypePointer Function %22 |
| %31 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %10 = OpVariable %7 Function |
| %24 = OpVariable %23 Function |
| %33 = OpVariable %7 Function |
| %41 = OpVariable %23 Function |
| OpStore %8 %9 |
| OpStore %10 %9 |
| OpBranch %11 |
| %11 = OpLabel |
| %52 = OpPhi %6 %9 %5 %29 %14 |
| %49 = OpPhi %6 %9 %5 %32 %14 |
| OpLoopMerge %13 %14 None |
| OpBranch %15 |
| %15 = OpLabel |
| %19 = OpSLessThan %18 %49 %17 |
| OpBranchConditional %19 %12 %13 |
| %12 = OpLabel |
| %26 = OpAccessChain %7 %24 %49 |
| %27 = OpLoad %6 %26 |
| %29 = OpIAdd %6 %52 %27 |
| OpStore %8 %29 |
| OpBranch %14 |
| %14 = OpLabel |
| %32 = OpIAdd %6 %49 %31 |
| OpStore %10 %32 |
| OpBranch %11 |
| %13 = OpLabel |
| OpStore %33 %9 |
| OpBranch %34 |
| %34 = OpLabel |
| %51 = OpPhi %6 %52 %13 %46 %37 |
| %50 = OpPhi %6 %9 %13 %48 %37 |
| OpLoopMerge %36 %37 None |
| OpBranch %38 |
| %38 = OpLabel |
| %40 = OpSLessThan %18 %50 %17 |
| OpBranchConditional %40 %35 %36 |
| %35 = OpLabel |
| %43 = OpAccessChain %7 %41 %50 |
| %44 = OpLoad %6 %43 |
| %46 = OpIAdd %6 %51 %44 |
| OpStore %8 %46 |
| OpBranch %37 |
| %37 = OpLabel |
| %48 = OpIAdd %6 %50 %31 |
| OpStore %33 %48 |
| OpBranch %34 |
| %36 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 28 |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| |
| int sum_0 = 0; |
| |
| // Illegal |
| for (int i = 0; i < 10; i++) { |
| sum_0 += a[i]; |
| } |
| for (int j = 0; j < 10; j++) { |
| sum_0 += b[j]; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, SameReductionVariableLCSSA) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "sum_0" |
| OpName %10 "i" |
| OpName %24 "a" |
| OpName %33 "j" |
| OpName %41 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %17 = OpConstant %6 10 |
| %18 = OpTypeBool |
| %20 = OpTypeInt 32 0 |
| %21 = OpConstant %20 10 |
| %22 = OpTypeArray %6 %21 |
| %23 = OpTypePointer Function %22 |
| %31 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %10 = OpVariable %7 Function |
| %24 = OpVariable %23 Function |
| %33 = OpVariable %7 Function |
| %41 = OpVariable %23 Function |
| OpStore %8 %9 |
| OpStore %10 %9 |
| OpBranch %11 |
| %11 = OpLabel |
| %52 = OpPhi %6 %9 %5 %29 %14 |
| %49 = OpPhi %6 %9 %5 %32 %14 |
| OpLoopMerge %13 %14 None |
| OpBranch %15 |
| %15 = OpLabel |
| %19 = OpSLessThan %18 %49 %17 |
| OpBranchConditional %19 %12 %13 |
| %12 = OpLabel |
| %26 = OpAccessChain %7 %24 %49 |
| %27 = OpLoad %6 %26 |
| %29 = OpIAdd %6 %52 %27 |
| OpStore %8 %29 |
| OpBranch %14 |
| %14 = OpLabel |
| %32 = OpIAdd %6 %49 %31 |
| OpStore %10 %32 |
| OpBranch %11 |
| %13 = OpLabel |
| OpStore %33 %9 |
| OpBranch %34 |
| %34 = OpLabel |
| %51 = OpPhi %6 %52 %13 %46 %37 |
| %50 = OpPhi %6 %9 %13 %48 %37 |
| OpLoopMerge %36 %37 None |
| OpBranch %38 |
| %38 = OpLabel |
| %40 = OpSLessThan %18 %50 %17 |
| OpBranchConditional %40 %35 %36 |
| %35 = OpLabel |
| %43 = OpAccessChain %7 %41 %50 |
| %44 = OpLoad %6 %43 |
| %46 = OpIAdd %6 %51 %44 |
| OpStore %8 %46 |
| OpBranch %37 |
| %37 = OpLabel |
| %48 = OpIAdd %6 %50 %31 |
| OpStore %33 %48 |
| OpBranch %34 |
| %36 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopUtils utils_0(context.get(), loops[0]); |
| utils_0.MakeLoopClosedSSA(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 30 |
| #version 440 core |
| int x; |
| void main() { |
| int[10] a; |
| int[10] b; |
| |
| // Illegal, x is unknown. |
| for (int i = 0; i < 10; i++) { |
| a[x] = a[i]; |
| } |
| for (int j = 0; j < 10; j++) { |
| a[j] = b[j]; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, UnknownIndexVariable) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %23 "a" |
| OpName %25 "x" |
| OpName %34 "j" |
| OpName %43 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypePointer Function %21 |
| %24 = OpTypePointer Private %6 |
| %25 = OpVariable %24 Private |
| %32 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %23 = OpVariable %22 Function |
| %34 = OpVariable %7 Function |
| %43 = OpVariable %22 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %50 = OpPhi %6 %9 %5 %33 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %50 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %26 = OpLoad %6 %25 |
| %28 = OpAccessChain %7 %23 %50 |
| %29 = OpLoad %6 %28 |
| %30 = OpAccessChain %7 %23 %26 |
| OpStore %30 %29 |
| OpBranch %13 |
| %13 = OpLabel |
| %33 = OpIAdd %6 %50 %32 |
| OpStore %8 %33 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %34 %9 |
| OpBranch %35 |
| %35 = OpLabel |
| %51 = OpPhi %6 %9 %12 %49 %38 |
| OpLoopMerge %37 %38 None |
| OpBranch %39 |
| %39 = OpLabel |
| %41 = OpSLessThan %17 %51 %16 |
| OpBranchConditional %41 %36 %37 |
| %36 = OpLabel |
| %45 = OpAccessChain %7 %43 %51 |
| %46 = OpLoad %6 %45 |
| %47 = OpAccessChain %7 %23 %51 |
| OpStore %47 %46 |
| OpBranch %38 |
| %38 = OpLabel |
| %49 = OpIAdd %6 %51 %32 |
| OpStore %34 %49 |
| OpBranch %35 |
| %37 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| |
| int sum = 0; |
| |
| // Illegal, accumulator used for indexing. |
| for (int i = 0; i < 10; i++) { |
| sum += a[i]; |
| b[sum] = a[i]; |
| } |
| for (int j = 0; j < 10; j++) { |
| b[j] = b[j]+1; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, AccumulatorIndexing) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "sum" |
| OpName %10 "i" |
| OpName %24 "a" |
| OpName %30 "b" |
| OpName %39 "j" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %17 = OpConstant %6 10 |
| %18 = OpTypeBool |
| %20 = OpTypeInt 32 0 |
| %21 = OpConstant %20 10 |
| %22 = OpTypeArray %6 %21 |
| %23 = OpTypePointer Function %22 |
| %37 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %10 = OpVariable %7 Function |
| %24 = OpVariable %23 Function |
| %30 = OpVariable %23 Function |
| %39 = OpVariable %7 Function |
| OpStore %8 %9 |
| OpStore %10 %9 |
| OpBranch %11 |
| %11 = OpLabel |
| %57 = OpPhi %6 %9 %5 %29 %14 |
| %55 = OpPhi %6 %9 %5 %38 %14 |
| OpLoopMerge %13 %14 None |
| OpBranch %15 |
| %15 = OpLabel |
| %19 = OpSLessThan %18 %55 %17 |
| OpBranchConditional %19 %12 %13 |
| %12 = OpLabel |
| %26 = OpAccessChain %7 %24 %55 |
| %27 = OpLoad %6 %26 |
| %29 = OpIAdd %6 %57 %27 |
| OpStore %8 %29 |
| %33 = OpAccessChain %7 %24 %55 |
| %34 = OpLoad %6 %33 |
| %35 = OpAccessChain %7 %30 %29 |
| OpStore %35 %34 |
| OpBranch %14 |
| %14 = OpLabel |
| %38 = OpIAdd %6 %55 %37 |
| OpStore %10 %38 |
| OpBranch %11 |
| %13 = OpLabel |
| OpStore %39 %9 |
| OpBranch %40 |
| %40 = OpLabel |
| %56 = OpPhi %6 %9 %13 %54 %43 |
| OpLoopMerge %42 %43 None |
| OpBranch %44 |
| %44 = OpLabel |
| %46 = OpSLessThan %18 %56 %17 |
| OpBranchConditional %46 %41 %42 |
| %41 = OpLabel |
| %49 = OpAccessChain %7 %30 %56 |
| %50 = OpLoad %6 %49 |
| %51 = OpIAdd %6 %50 %37 |
| %52 = OpAccessChain %7 %30 %56 |
| OpStore %52 %51 |
| OpBranch %43 |
| %43 = OpLabel |
| %54 = OpIAdd %6 %56 %37 |
| OpStore %39 %54 |
| OpBranch %40 |
| %42 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| // 33 |
| #version 440 core |
| void main() { |
| int[10] a; |
| int[10] b; |
| |
| // Illegal, barrier. |
| for (int i = 0; i < 10; i++) { |
| a[i] = a[i] * 2; |
| memoryBarrier(); |
| } |
| for (int j = 0; j < 10; j++) { |
| b[j] = b[j] + 1; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, Barrier) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %23 "a" |
| OpName %36 "j" |
| OpName %44 "b" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypePointer Function %21 |
| %28 = OpConstant %6 2 |
| %31 = OpConstant %19 1 |
| %32 = OpConstant %19 3400 |
| %34 = OpConstant %6 1 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %23 = OpVariable %22 Function |
| %36 = OpVariable %7 Function |
| %44 = OpVariable %22 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %53 = OpPhi %6 %9 %5 %35 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %53 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %26 = OpAccessChain %7 %23 %53 |
| %27 = OpLoad %6 %26 |
| %29 = OpIMul %6 %27 %28 |
| %30 = OpAccessChain %7 %23 %53 |
| OpStore %30 %29 |
| OpMemoryBarrier %31 %32 |
| OpBranch %13 |
| %13 = OpLabel |
| %35 = OpIAdd %6 %53 %34 |
| OpStore %8 %35 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %36 %9 |
| OpBranch %37 |
| %37 = OpLabel |
| %54 = OpPhi %6 %9 %12 %52 %40 |
| OpLoopMerge %39 %40 None |
| OpBranch %41 |
| %41 = OpLabel |
| %43 = OpSLessThan %17 %54 %16 |
| OpBranchConditional %43 %38 %39 |
| %38 = OpLabel |
| %47 = OpAccessChain %7 %44 %54 |
| %48 = OpLoad %6 %47 |
| %49 = OpIAdd %6 %48 %34 |
| %50 = OpAccessChain %7 %44 %54 |
| OpStore %50 %49 |
| OpBranch %40 |
| %40 = OpLabel |
| %52 = OpIAdd %6 %54 %34 |
| OpStore %36 %52 |
| OpBranch %37 |
| %39 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| #version 440 core |
| struct TestStruct { |
| int[10] a; |
| int b; |
| }; |
| |
| void main() { |
| TestStruct test_0; |
| TestStruct test_1; |
| |
| for (int i = 0; i < 10; i++) { |
| test_0.a[i] = i; |
| } |
| for (int j = 0; j < 10; j++) { |
| test_0 = test_1; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, ArrayInStruct) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 440 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %22 "TestStruct" |
| OpMemberName %22 0 "a" |
| OpMemberName %22 1 "b" |
| OpName %24 "test_0" |
| OpName %31 "j" |
| OpName %39 "test_1" |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 10 |
| %17 = OpTypeBool |
| %19 = OpTypeInt 32 0 |
| %20 = OpConstant %19 10 |
| %21 = OpTypeArray %6 %20 |
| %22 = OpTypeStruct %21 %6 |
| %23 = OpTypePointer Function %22 |
| %29 = OpConstant %6 1 |
| %47 = OpUndef %22 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %24 = OpVariable %23 Function |
| %31 = OpVariable %7 Function |
| %39 = OpVariable %23 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %43 = OpPhi %6 %9 %5 %30 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %43 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %27 = OpAccessChain %7 %24 %9 %43 |
| OpStore %27 %43 |
| OpBranch %13 |
| %13 = OpLabel |
| %30 = OpIAdd %6 %43 %29 |
| OpStore %8 %30 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %31 %9 |
| OpBranch %32 |
| %32 = OpLabel |
| %44 = OpPhi %6 %9 %12 %42 %35 |
| OpLoopMerge %34 %35 None |
| OpBranch %36 |
| %36 = OpLabel |
| %38 = OpSLessThan %17 %44 %16 |
| OpBranchConditional %38 %33 %34 |
| %33 = OpLabel |
| OpStore %24 %47 |
| OpBranch %35 |
| %35 = OpLabel |
| %42 = OpIAdd %6 %44 %29 |
| OpStore %31 %42 |
| OpBranch %32 |
| %34 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| /* |
| Generated from the following GLSL + --eliminate-local-multi-store |
| |
| #version 450 |
| |
| struct P {float x,y,z;}; |
| uniform G { int a; P b[2]; int c; } g; |
| layout(location = 0) out float o; |
| |
| void main() |
| { |
| P p[2]; |
| for (int i = 0; i < 2; ++i) { |
| p = g.b; |
| } |
| for (int j = 0; j < 2; ++j) { |
| o = p[g.a].x; |
| } |
| } |
| |
| */ |
| TEST_F(FusionIllegalTest, NestedAccessChain) { |
| std::string text = R"( |
| OpCapability Shader |
| %1 = OpExtInstImport "GLSL.std.450" |
| OpMemoryModel Logical GLSL450 |
| OpEntryPoint Fragment %4 "main" %64 |
| OpExecutionMode %4 OriginUpperLeft |
| OpSource GLSL 450 |
| OpName %4 "main" |
| OpName %8 "i" |
| OpName %20 "P" |
| OpMemberName %20 0 "x" |
| OpMemberName %20 1 "y" |
| OpMemberName %20 2 "z" |
| OpName %25 "p" |
| OpName %26 "P" |
| OpMemberName %26 0 "x" |
| OpMemberName %26 1 "y" |
| OpMemberName %26 2 "z" |
| OpName %28 "G" |
| OpMemberName %28 0 "a" |
| OpMemberName %28 1 "b" |
| OpMemberName %28 2 "c" |
| OpName %30 "g" |
| OpName %55 "j" |
| OpName %64 "o" |
| OpMemberDecorate %26 0 Offset 0 |
| OpMemberDecorate %26 1 Offset 4 |
| OpMemberDecorate %26 2 Offset 8 |
| OpDecorate %27 ArrayStride 16 |
| OpMemberDecorate %28 0 Offset 0 |
| OpMemberDecorate %28 1 Offset 16 |
| OpMemberDecorate %28 2 Offset 48 |
| OpDecorate %28 Block |
| OpDecorate %30 DescriptorSet 0 |
| OpDecorate %64 Location 0 |
| %2 = OpTypeVoid |
| %3 = OpTypeFunction %2 |
| %6 = OpTypeInt 32 1 |
| %7 = OpTypePointer Function %6 |
| %9 = OpConstant %6 0 |
| %16 = OpConstant %6 2 |
| %17 = OpTypeBool |
| %19 = OpTypeFloat 32 |
| %20 = OpTypeStruct %19 %19 %19 |
| %21 = OpTypeInt 32 0 |
| %22 = OpConstant %21 2 |
| %23 = OpTypeArray %20 %22 |
| %24 = OpTypePointer Function %23 |
| %26 = OpTypeStruct %19 %19 %19 |
| %27 = OpTypeArray %26 %22 |
| %28 = OpTypeStruct %6 %27 %6 |
| %29 = OpTypePointer Uniform %28 |
| %30 = OpVariable %29 Uniform |
| %31 = OpConstant %6 1 |
| %32 = OpTypePointer Uniform %27 |
| %36 = OpTypePointer Function %20 |
| %39 = OpTypePointer Function %19 |
| %63 = OpTypePointer Output %19 |
| %64 = OpVariable %63 Output |
| %65 = OpTypePointer Uniform %6 |
| %4 = OpFunction %2 None %3 |
| %5 = OpLabel |
| %8 = OpVariable %7 Function |
| %25 = OpVariable %24 Function |
| %55 = OpVariable %7 Function |
| OpStore %8 %9 |
| OpBranch %10 |
| %10 = OpLabel |
| %72 = OpPhi %6 %9 %5 %54 %13 |
| OpLoopMerge %12 %13 None |
| OpBranch %14 |
| %14 = OpLabel |
| %18 = OpSLessThan %17 %72 %16 |
| OpBranchConditional %18 %11 %12 |
| %11 = OpLabel |
| %33 = OpAccessChain %32 %30 %31 |
| %34 = OpLoad %27 %33 |
| %35 = OpCompositeExtract %26 %34 0 |
| %37 = OpAccessChain %36 %25 %9 |
| %38 = OpCompositeExtract %19 %35 0 |
| %40 = OpAccessChain %39 %37 %9 |
| OpStore %40 %38 |
| %41 = OpCompositeExtract %19 %35 1 |
| %42 = OpAccessChain %39 %37 %31 |
| OpStore %42 %41 |
| %43 = OpCompositeExtract %19 %35 2 |
| %44 = OpAccessChain %39 %37 %16 |
| OpStore %44 %43 |
| %45 = OpCompositeExtract %26 %34 1 |
| %46 = OpAccessChain %36 %25 %31 |
| %47 = OpCompositeExtract %19 %45 0 |
| %48 = OpAccessChain %39 %46 %9 |
| OpStore %48 %47 |
| %49 = OpCompositeExtract %19 %45 1 |
| %50 = OpAccessChain %39 %46 %31 |
| OpStore %50 %49 |
| %51 = OpCompositeExtract %19 %45 2 |
| %52 = OpAccessChain %39 %46 %16 |
| OpStore %52 %51 |
| OpBranch %13 |
| %13 = OpLabel |
| %54 = OpIAdd %6 %72 %31 |
| OpStore %8 %54 |
| OpBranch %10 |
| %12 = OpLabel |
| OpStore %55 %9 |
| OpBranch %56 |
| %56 = OpLabel |
| %73 = OpPhi %6 %9 %12 %71 %59 |
| OpLoopMerge %58 %59 None |
| OpBranch %60 |
| %60 = OpLabel |
| %62 = OpSLessThan %17 %73 %16 |
| OpBranchConditional %62 %57 %58 |
| %57 = OpLabel |
| %66 = OpAccessChain %65 %30 %9 |
| %67 = OpLoad %6 %66 |
| %68 = OpAccessChain %39 %25 %67 %9 |
| %69 = OpLoad %19 %68 |
| OpStore %64 %69 |
| OpBranch %59 |
| %59 = OpLabel |
| %71 = OpIAdd %6 %73 %31 |
| OpStore %55 %71 |
| OpBranch %56 |
| %58 = OpLabel |
| OpReturn |
| OpFunctionEnd |
| )"; |
| |
| std::unique_ptr<IRContext> context = |
| BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text, |
| SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS); |
| Module* module = context->module(); |
| EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n" |
| << text << std::endl; |
| Function& f = *module->begin(); |
| |
| { |
| LoopDescriptor& ld = *context->GetLoopDescriptor(&f); |
| EXPECT_EQ(ld.NumLoops(), 2u); |
| |
| auto loops = ld.GetLoopsInBinaryLayoutOrder(); |
| |
| LoopFusion fusion(context.get(), loops[0], loops[1]); |
| EXPECT_TRUE(fusion.AreCompatible()); |
| EXPECT_FALSE(fusion.IsLegal()); |
| } |
| } |
| |
| } // namespace |
| } // namespace opt |
| } // namespace spvtools |