Juliaの型推論について – isaで条件分岐したブロックにおける推論
こんにちは、門脇宗平(Shuhei Kadowaki)と言います。
GitHubではaviateskというハンドルで活動していて、JuliaのIDE(Juno, julia-vscode)のメンテナなどをやっています。
最近Juliaの型推論システムを借用してJuliaプログラムのソースコードに対する静的な型解析を行うツールの開発[1]をしているのですが、その過程でJuliaの型推論について、その中でも特にisa
を使って条件分岐した先のブロックにおける推論ついて少し知見ができたので共有します。
1. Juliaの型推論のflow-sensitivity
まず前提としてJuliaの型推論は"flow-sensitive"に行われます。ここで"flow-sensitive"とはどういうことかというと、Juliaはコードをコンパイルするとき、プログラム中の様々なコードに対してその実行コンテクストに応じた型を自動で推論するということです。
例えば以下のようなコードを考えてみましょう。
if isa(a, Int)
return sin(a)
else
return 0
end
この例では1行目でisa(a, Int)
というようにa
の型によって条件分岐を行なっているので、2行目のsin(a)
においてa
がInt
型でしかありえないのは明らかだと思います。
Juliaの型推論はプログラムの実行を仮想的にシミュレートすることによりこのような「2行目のa
は常にInt
である」といった情報を(追加的なアノテーションをせずとも)勝手に推論してくれます。
以下のコードで確認してみましょう。
foo
の引数a
が型不安定(この場合はAny
型)であってもisa
block内ではa
の型がisa(a, Int)
の情報を用いてa::Int
と推論されているのがわかると思います。
julia> function foo(a)
if isa(a, Int)
return sin(a) # <= compiler infers `a::Int`
else
return 0
end
end
foo (generic function with 1 method)
julia> code_typed(foo, (Any,); optimize = false)[1]
CodeInfo(
1 ─ %1 = (a isa Main.Int)::Bool
└── goto #3 if not %1
2 ─ %3 = Main.sin(a::Int64)::Float64 # <= compiler inferred `a::Int`
└── return %3
3 ─ return 0
) => Union{Float64, Int64}
このJuliaの型推論ルーチンのflow-sensitivityは、Juliaはある変数の型がプログラム中で変わったとしてもその変数のその文脈における型に応じた最適なコード生成を行ってくれたり、型不安定なコードを部分的に型安定にしてくれたりと、パフォーマンス上非常に重要です。例えば以下のようなコードを実行する場合、foo
に渡される引数a
は型不安定(Union{Int,Char,String}
)ですが、それでもfoo
3行目の呼び出しsin(a)
はsin(a::Int)
としてコンパイル時に解決されます[2]。
let
s = 0.
for i in 1:100000
a = rand((1, '1', "one"))
s += foo(a) # <= `a` is type-unstable here
end
s
end
より詳しく見てみると
実際に
foo
3行目の呼び出しsin(a)
はsin(a::Int)
としてコンパイル時に解決されます
が起きていることを確認したい人は、Cthulhu.jlというパッケージを使ってみましょう。
optimize
optionをoffにして、%13 = invoke foo(::Union{Char, Int64, String})::Union{Float64, Int64}
に"descend"すると以下のような出力が得られ、期待通りfoo
内のsin(a)
においてa
の型がa::Int
と推論されているのが確認できます:
julia> using Cthulhu
julia> descend_code_typed(Tuple{}; optimize = false) do
s = 0.
for i in 1:100000
a = rand((1, '1', "one"))
s += foo(a)
end
s
end
...
%2 = invoke Colon(::Int64,::Int64)::Core.Const(1:100000)
%3 = invoke iterate(::UnitRange{Int64})::Core.Const((1, 1))
%11 = invoke rand(::Tuple{Int64, Char, String})::Union{Char, Int64, String}
• %13 = invoke foo(::Union{Char, Int64, String})::Union{Float64, Int64}
%14 = call #+(::Float64,::Union{Float64, Int64})::Float64
%15 = invoke iterate(::UnitRange{Int64},::Int64)::Union{Nothing, Tuple{Int64, Int64}}
↩
│ ─ %-1 = invoke foo(::Union{Char, Int64, String})::Union{Float64, Int64}
CodeInfo(
@ none:2 within 'foo'
1 ─ %1 = (a isa Main.Int)::Bool
└── goto #3 if not %1
└
@ none:3 within 'foo'
2 ─ %3 = Main.sin(a::Int64)::Float64
└── return %3
└
@ none:5 within 'foo'
3 ─ return 0
)
...
ただしこの型推論が実際のコード実行で使用されるかは、型推論後の最適化プロセスにおいてfoo
がinliningされるかどうかによって決まります:
- inliningされる場合:
foo(::Union{Char, Int64, String})::Union{Float64, Int64}
の推論結果を用いてfoo
が元のコードにinline展開される - inliningされない場合: runtimeにおける
a
のそれぞれの具体型T
に対してfoo(a::T)
に対するdynamic dispatchが行われるため、例えばfoo(::Int)::Float64
といったまた別のJIT compileが起きる(i.e.foo(::Union{Char, Int64, String})::Union{Float64, Int64}
の推論結果は使用されない)
今回のfoo
ではどうなるのか、code_typed
のoptimize
optionをtrue
(default)にして確認してみましょう:
julia> code_typed(; optimize = true) do
s = 0.
for i in 1:100000
a = rand((1, '1', "one"))
s += foo(a)
end
s
end |> first
CodeInfo(
1 ── goto #19 if not true
2 ┄─ %2 = φ (#1 => 1, #18 => %45)::Int64
│ %3 = φ (#1 => 0.0, #18 => %39)::Float64
│ %4 = Core.tuple(1, '1', "one")::Core.Const((1, '1', "one"))
│ %5 = $(Expr(:foreigncall, :(:jl_threadid), Int16, svec(), 0, :(:ccall)))::Int16
│ %6 = Base.sext_int(Int64, %5)::Int64
│ %7 = Base.add_int(%6, 1)::Int64
│ %8 = invoke Random.default_rng(%7::Int64)::Random.MersenneTwister
│ %9 = %new(Random.SamplerSimple{Tuple{Int64, Char, String}, Random.SamplerTrivial{Random.UInt52{UInt64}, UInt64}, Any}, %4, $(QuoteNode(Random.SamplerTrivial{Random.UInt52{UInt64}, UInt64}(Random.UInt52{UInt64}()))))::Random.SamplerSimple{Tuple{Int64, Char, String}, Random.SamplerTrivial{Random.UInt52{UInt64}, UInt64}, Any}
│ %10 = invoke Random.rand(%8::Random.MersenneTwister, %9::Random.SamplerSimple{Tuple{Int64, Char, String}, Random.SamplerTrivial{Random.UInt52{UInt64}, UInt64}, Any})::Union{Char, Int64, String}
│ %11 = (isa)(%10, Char)::Bool
└─── goto #4 if not %11
3 ── goto #9
4 ── %14 = (isa)(%10, Int64)::Bool
└─── goto #6 if not %14
5 ── %16 = π (%10, Int64)
│ %17 = Base.sitofp(Float64, %16)::Float64
│ %18 = invoke Base.Math.sin(%17::Float64)::Float64 # <= compiler inline-expanded `foo`
└─── goto #9
6 ── %20 = (isa)(%10, String)::Bool
└─── goto #8 if not %20
7 ── goto #9
8 ── Core.throw(ErrorException("fatal error in type inference (type bound)"))::Union{}
└─── unreachable
9 ┄─ %25 = φ (#3 => 0, #5 => %18, #7 => 0)::Union{Float64, Int64}
│ %26 = (isa)(%25, Float64)::Bool
└─── goto #11 if not %26
10 ─ %28 = π (%25, Float64)
│ %29 = Base.add_float(%3, %28)::Float64
└─── goto #14
11 ─ %31 = (isa)(%25, Int64)::Bool
└─── goto #13 if not %31
12 ─ %33 = π (%25, Int64)
│ %34 = Base.sitofp(Float64, %33)::Float64
│ %35 = Base.add_float(%3, %34)::Float64
└─── goto #14
13 ─ Core.throw(ErrorException("fatal error in type inference (type bound)"))::Union{}
└─── unreachable
14 ┄ %39 = φ (#10 => %29, #12 => %35)::Float64
│ %40 = (%2 === 100000)::Bool
└─── goto #16 if not %40
15 ─ goto #17
16 ─ %43 = Base.add_int(%2, 1)::Int64
└─── goto #17
17 ┄ %45 = φ (#16 => %43)::Int64
│ %46 = φ (#15 => true, #16 => false)::Bool
│ %47 = Base.not_int(%46)::Bool
└─── goto #19 if not %47
18 ─ goto #2
19 ┄ %50 = φ (#17 => %39, #1 => 0.0)::Float64
└─── return %50
) => Float64
やや見にくいですが、No.5 blockの%19 = invoke Base.Math.sin(%18::Float64)::Float64
などの行を見ればfoo(::Union{Char, Int64, String})::Union{Float64, Int64}
が見事に消えてinline展開されていることが確認できると思います[3]。
isa
conditionのflow-sensitivity
2. このようにJuliaの"flow-sensitive analysis"は「楽に書けてしかも速いコード」を実現するために必要不可欠な機能です。
特にisa
による条件分岐はよく使われるのでこの「isa
で条件分岐した先のブロックの型推論」は重要なのですが、この機能について参考になるかもしれない知見が2点ほどあるので、以下ではそれを紹介します(本題)。
isa
conditionの制約は最後のものしか伝播しない (Julia<1.6)
2.1. chainしたisa
ブロックがchainした場合はどうなるかみてみましょう。
[email protected]で以下を実行してみます:
julia> code_typed((Any,Any); optimize = false) do a, b
if isa(a, Int) && isa(b, Int)
return sin(a) # <= compiler infers `a::Int` ?
end
return 0
end |> first
CodeInfo(
1 ─ %1 = (a isa Main.Int)::Bool
└── goto #3 if not %1
2 ─ (@_4 = b isa Main.Int)::Bool
└── goto #4
3 ─ (@_4 = false)::Core.Compiler.Const(false, false)
4 ┄ goto #6 if not @_4
5 ─ %7 = Main.sin(a)::Any # <= compiler could NOT infer the type of `a`
└── return %7
6 ─ return 0
) => Any
なんと、3行目のsin(a)
において今回はa::Int
と推論されていません!😱
この場合isa
の条件分岐がchainしていますが、Juliaのコンパイラがchainの最後の制約(この場合はisa(b, Int)
)しか伝播できなかったからです。
そのためこれまではこのようなコードでは、isa
conditionを分けて"diamond"の形をしたコードブロックにしてあげる必要がありました。
if isa(a, Int)
if isa(b, Int)
return sin(a) # <= compiler infers `a::Int`
end
end
...なのですが、この制限は最新のJuliaでは改善[4]されています。
同じコードを[email protected]で実行してみましょう:
julia> code_typed((Any,Any); optimize = false) do a, b
if isa(a, Int) && isa(b, Int)
return sin(a) # <= compiler infers `a::Int`
end
return 0
end |> first
CodeInfo(
1 ─ %1 = (a isa Main.Int)::Bool
└── goto #4 if not %1
2 ─ %3 = (b isa Main.Int)::Bool
└── goto #4 if not %3
3 ─ %5 = Main.sin(a::Int64)::Float64 # <= compiler inferred `a::Int`
└── return %5
4 ┄ return 0
) => Union{Float64, Int64}
コンパイラがシュッと"diamond"を形成してくれてバシッとa
の型が推論されているのが確認できると思います。Julia 1.6が待ち遠しいですね。
isa
conditionは伝播しない
2.2. callee呼び出し内の2020/09/27時点でのJuliaでは、別の関数(callee)呼び出しの結果を用いて条件分岐を行う場合、そのcallee関数内におけるisa
による型制約を伝播させることはできません。
例えば以下のbar
(caller)は意味的には最初の例で紹介したfoo
と一緒ですが、bar
内の3行目のsin(a)
において、コンパイラはa
の型をa::Int
として推論してくれません:
julia> function bar(a)
if baz(a)
return sin(a) # <= compiler infers `a::Int` ?
else
return 0
end
end
bar (generic function with 1 method)
julia> baz(a) = isa(a, Int)
baz (generic function with 1 method)
julia> code_typed(bar, (Any,); optimize = false)[1]
CodeInfo(
1 ─ %1 = Main.baz(a)::Bool
└── goto #3 if not %1
2 ─ %3 = Main.sin(a)::Any # <= compiler could NOT infer the type of `a`
└── return %3
3 ─ return 0
) => Any
これはisa
による条件分岐がbaz
(callee)の中で行われるため、それによる制約が元のcaller関数bar
における型推論にまで伝播していないからです。
baz
をinlineさせたらどうでしょうか:
julia> @inline baz(a) = isa(a, Int)
baz (generic function with 1 method)
julia> code_typed(bar, (Any,); optimize = true)[1]
CodeInfo(
1 ─ %1 = (a isa Main.Int)::Bool
└── goto #3 if not %1
2 ─ %3 = Main.sin(a)::Any # <= compiler could NOT infer the type of `a`
└── return %3
3 ─ return 0
) => Any
生成されるコードではinliningが起きているのが確認できます(Main.baz(a)::Bool
が消えて、(a isa Main.Int)::Bool
に置き換わっている)が、それでもsin(a)
におけるa
の型はうまく推論されていません。
inliningなどの最適化はに型推論で得られた情報を用いて型推論 後 行われるためです。
そこで、以下のように僕らプログラマがやや妥協して型アノテーションをつけてあげることで、強制的に型情報を伝えることができます[5]:
julia> function bar(a)
if baz(a)
return sin(a::Int) # <= ya should know this by yourself, compiler
else
return 0
end
end
bar (generic function with 1 method)
julia> code_typed(bar, (Any,); optimize = false)[1]
CodeInfo(
1 ─ %1 = Main.baz(a)::Bool
└── goto #3 if not %1
2 ─ %3 = Core.typeassert(a, Main.Int)::Int64
│ %4 = Main.sin(%3)::Float64 # <= now compiler knows typeof of `a`
└── return %4
3 ─ return 0
) => Union{Float64, Int64}
とはいえやはりこんな自明な型アノテーションは書きたくない人もいらっしゃるかもしれません。僕もそうです。すでにissueが上がっているので興味がある人はwatchしてみると良いと思います 👀
xref: https://github.com/JuliaLang/julia/issues/37342
3. まとめ
今回はisa
conditionによる型制約の伝播を中心にJuliaの型推論の機能をみてみました。
Juliaのこのあたりの機能は日々改善されているので、おそらく2.2.で紹介した制限も将来的に改善されるでしょう。Juliaのコンパイラにはもっと頑張ってもらって、僕らJuliaプログラマはどんどん楽して高効率なコードを書けるようになってほしいですね。
-
xref: https://github.com/aviatesk/JET.jl, https://github.com/aviatesk/grad-thesis ↩︎
-
もし呼び出されるmethod(この場合は
sin(x::Real) in Base.Math at special/trig.jl:53
)がコンパイル時に解決されない場合、実行時に呼び出すmethodのlookupが行われ(俗に"dynamic dispatch"と呼ばれます)、パフォーマンス上の問題になる場合があります。 ↩︎ -
逆にinlining させない こともできます。
@noinline
をつけてfoo
を再定義してから同じようにcode_typed
を試してみてください。 ↩︎ -
あるいは妥協せず、「マクロを用いてソースレベル(i.e. surface AST level)でcallee(
baz
)をinlineする」といったややハッキーな方法を取ることで、現行のJuliaでも、baz
の呼び出しをキープしたままなおかつ型アノテーションをせず、bar
内のisa
conditionによる制約を伝播させることができるかもしれません。 ↩︎
Discussion