d=512, 8H/4KV, BPE=8192 ââââââââââââââââ â Tool Call â ââââââââ¬ââââââââ ââ´âââââââââââ â Softmax â âââââââ¬ââââââ âââââââ´ââââââ â Linear (T)â â tied âââââââ¬ââââââ âââââââ´ââââââ â ZCRMSNorm â âââââââ¬ââââââ ââââââââââ´âââââââââ â Decoder x 8 â âââââââââââââââââââ ââ ZCRMSNorm ââ ââ Masked Self ââ ââ Attn + RoPE ââ ââ Gated Residualââ ââââââââââââââââââ¤â ââââââââââââââââ ââ ZCRMSNorm ââ â Encoder x 12 â


{{#tags}}- {{label}}
{{/tags}}