2025-03-26

ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã¨ã—ã¦ã®ç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥ã¨ãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—

ç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥ã¨ãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—ã¯ã€ãã‚Œãžã‚Œã€Œæ¬¡ã®è¦ç´ ã‚’å–å¾—ã™ã‚‹ã€ã¨ã„ã†æ“ä½œãŒã§ãã¾ã™ã€‚ã¤ã¾ã‚Šã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã§ã™ãã€‚ ã—ã‹ã—ã€ä¸€è¨€ã§ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã¨è¨€ã£ã¦ã‚‚ä¸¡è€…ã¯å°‘ã—æ€§è³ªãŒé•ã„ã¾ã™ã€‚

ç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥ã¯ã€è¦ç´ ã®å–å¾—ã¨åŒæ™‚ã«ï¼ˆãƒ¦ãƒ¼ã‚¶ã‹ã‚‰è¦³æ¸¬ã§ãã‚‹å½¢ã§ï¼‰æ¬¡ã®è¦ç´ ãŒã‚¹ã‚¿ãƒ³ãƒã‚¤ã•ã‚Œã¾ã™ã€‚ ã‚ã‚‹ã„ã¯ã€æ¬¡ã®è¦ç´ ã‚’å–å¾—ã—ã‚ˆã†ã¨ã™ã‚‹å‰ã«æ¬¡ã®è¦ç´ ã®æœ‰ç„¡ãŒã‚ã‹ã‚Šã¾ã™ã€‚

tissue_box = TissueBox()  # not empty
while True:
    tissue = tissue_box.next()
    # do some work
    if tissue_box.the_last_element_was_emitted():
        break

ä¸€æ–¹ã§ãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—ã¯ã€è¦ç´ ã‚’å–å¾—ã—ã‚ˆã†ã¨ã—ãŸæ™‚ç‚¹ã§ã‚ˆã†ã‚„ãæ¬¡ã®è¦ç´ ã®æœ‰ç„¡ãŒã‚ã‹ã‚Šã¾ã™ã€‚

soap_dispenser = SoapDispenser()  # not empty
while True:
    soap = soap_dispenser.next()
    if soap is None:
        break
    # do some work

ãŸã¨ãˆã° Rust ã§ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã‚’ä½¿ã†éš›ã®æ§‹æ–‡ã¯ã€ãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—ã®æ–¹ã®æ°—æŒã¡ã«è¿‘ã„ã‚ˆã†ãªæ°—ãŒã—ã¾ã™ã€‚

soap_dispenser = SoapDispenser::new()
while let Some(soap) = soap_dispenser.next() {
    // do some work
}

å†…éƒ¨çš„ãªå®Ÿè£…ã¯ãã†ã¨ã¯é™ã‚‰ãšã€ç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥ã®ã‚ˆã†ã«æ¬¡ã®è¦ç´ ã‚’ã‚¹ã‚¿ãƒ³ãƒã‚¤ã•ã›ã¦ã„ã‚‹çŠ¶æ³ã‚‚ã‚ã‚Šã¾ã™ã€‚ <std::iter::successors as Iterator>::next() ãªã©ã¯ã€æ¬¡ã®ã‚ˆã†ãªå®Ÿè£…ã«ãªã£ã¦ã„ã¾ã™ã€‚

fn next(&mut self) -> Option<Self::Item> {
    let item = self.next.take()?;
    self.next = (self.succ)(&item);
    Some(item)
}

è¿”ã—ã¦ã—ã¾ã†è¦ç´ ã¯æ‰€æœ‰æ¨©ã‚’æ¸¡ã—ã¦ã—ã¾ã£ã¦ã„ã‚‹ã®ã§ã€ãã‚Œã‚’ä½¿ã£ã¦ self.succ ã‚’å‘¼ã¶ã“ã¨ã¯ã§ããªã„ã§ã™ã‹ã‚‰ãã€‚ ã“ã‚Œã«ã‚ˆã‚Šã€ã€Œ$n+1$ å€‹ç›®ã®è¦ç´ ã‚’å–å¾—ã—ã‚ˆã†ã¨ã™ã‚‹ã¨ä½•ã‚‰ã‹ã®äº‹æƒ…ã§ panic ã™ã‚‹ãŒã€å®Ÿéš›ã«ã¯ $n$ å€‹ç›®ã¾ã§ã®è¦ç´ ã§çµ‚äº†ã™ã‚‹ã€ã¨ã„ã†ã¨ãã«ã€æœŸå¾…ã«åã—ã¦ $n+1$ å€‹ç›®ã®è¦ç´ ãŒè¨ˆç®—ã•ã‚Œã¦ panic ã—ãŸã‚Šã—ã¾ã™ã€‚

fn main() {
    for i in std::iter::successors(Some(1), |&x| Some(x * 1000)) {
        println!("{i}");
        if i == 10_u32.pow(9) {
            break;
        }
    }
}

ã“ã‚Œã¯ã€1 1000 1000000 ã‚’å‡ºåŠ›ã—ãŸå¾Œã« panic ã—ã¾ã™ (playground)ã€‚

å®Ÿéš›ã«ã¯ç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥ã¯ exact ãª .the_last_element_was_emitted() ã¯å®Ÿè£…ã•ã‚Œã¦ã„ã‚‹ã‚ã‘ã§ã¯ãªãã€.probably_the_last_element_was_emitted() ã§ã‚ã‚‹ã“ã¨ã‚‚å¤šã„ã§ã™ã—ã€ã©ã¡ã‚‰ã®ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã‚‚ .next() ã®å‘¼ã³å‡ºã—æ™‚ã«ã€Œã‚‚ã†ã™ããªããªã‚Šãã†ã ãªã€æ„Ÿã®ã‚ã‚‹å€¤ã‚‚æš—ã«è¿”ã£ã¦ãã¦ã„ã‚‹æ„Ÿã¯ã‚ã‚Šã¾ã™ãŒã€‚

è²·ã„æ›¿ãˆãªã©ã®ã“ã¨ã‚’è€ƒãˆã‚‹ã¨ã€ã‚„ã£ã±ã‚Šç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥åž‹ã®ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã®æ–¹ãŒåŠ©ã‹ã‚Šã¾ã™ãã€‚ã¨ã¯ã„ãˆãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—ï¼ˆã‚„ã‚·ãƒ£ãƒ³ãƒ—ãƒ¼ãªã©ã€ãã®ä»–å¤šãã®ãƒãƒ³ãƒ‰ã‚½ãƒ¼ãƒ—åž‹ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã®ã‚¤ãƒ³ã‚¿ãƒ•ã‚§ãƒ¼ã‚¹ã«ãªã£ã¦ã„ã‚‹è£½å“ï¼‰ãŒç®±ãƒ†ã‚£ãƒƒã‚·ãƒ¥åž‹ã®ã‚¤ãƒ†ãƒ¬ãƒ¼ã‚¿ã«ãªã‚‹ã¨ã€ãã‚Œã¯ãã‚Œã§ä¸å¹¸ã«ãªã‚Šãã†ãªæ°—ã¯ã—ã¾ã™ã€‚

ãŠã‚ã‚Š

ãŠã‚ã‚Šã§ã™ã€‚

ã€Œâ—‹â—‹â—‹ãƒ¼â—‹ã¨ã—ã¦ã®â—‹â—‹â—‹â—‹â—‹â—‹ã¨â—‹â—‹â—‹â—‹ãƒ¼â—‹ã€ã¨ã„ã†ã‚¿ã‚¤ãƒˆãƒ«ã§ãã®ã†ã¡è¨˜äº‹ã‚’æ›¸ã“ã†ã¨æ€ã„ã¾ã™
— ãˆã³ã¡ã‚ƒã‚“ðŸ‘ðŸðŸ¦ƒ (@rsk0315_h4x) 2025å¹´3æœˆ24æ—¥

2025-03-25

correct rounding ã¸ã®é“ (2) shift-and-add algorithm

å‰å›ž ã¯ã€ä¸»ã«è‡ªåˆ†ã§è€ƒãˆãŸç´ æœ´ãªã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã‚’å®Ÿè£…ãƒ»è¨¼æ˜Žã—ã¾ã—ã‚‡ã†ã¨ã„ã†ã‚¹ã‚¿ãƒ³ã‚¹ã®å›žã§ã—ãŸã€‚ ä»Šå›žã¯ï¼ˆä»Šå¾Œã¯ï¼Ÿï¼‰æ—¢å˜ã®å®Ÿè£…ã‚’ãªãžã‚‹å½¢ã§å‹‰å¼·ã—ã¦ã„ãã¾ã™ã€‚

ç´¹ä»‹

å®Ÿè£…

LLVM ã®ã‚‚ã®ã‚’å‚è€ƒã«ã—ã¦ã„ã¾ã™ã€‚

è³‡æ–™

Jean-Michel Muller. (2016). â€œElementary Functions: Algorithms and Implementation.â€ BirkhÃ¤user, Boston, MA. https://doi.org/10.1007/978-1-4899-7983-4
- https://link.springer.com/book/10.1007/978-1-4899-7983-4
Catherine Daramy-Loirat, David Defour, Florent de Dinechin, Matthieu Gallet, Nicolas Gast, et al. â€œCR-LIBM A library of correctly rounded elementary functions in double-precision.â€ [Research Report] LIP. 2006. ensl-01529804
- https://ens-lyon.hal.science/ensl-01529804v1/document

ãƒ„ãƒ¼ãƒ«

Gappa (GÃ©nÃ©ration Automatique de Preuves de PropriÃ©tÃ©s ArithmÃ©tiques)
- automatic generation of proofs of arithmetic properties
- èª¤å·®è©•ä¾¡ã®è¨¼æ˜Žãªã©ã«ç”¨ã„ã‚‹
Sollya
- ãƒãƒ¼ãƒ‰ã‚³ãƒ¼ãƒ‰ç”¨ã®é”æ³•ã®å¤šé …å¼ã‚’ç”Ÿæˆã™ã‚‹ã®ã«ç”¨ã„ã‚‹
- æ•°å€¤è¨ˆç®—ã®ç”¨é€”ã§ã‚‚ã—ã°ã—ã°ä½¿ã†
SageMath
- è«¸ã€…ã®æ•°å€¤è¨ˆç®—ãªã©ã‚’ã—ãŸã„ã¨ãã«ç”¨ã„ã‚‹
SymPy
- æ•°å€¤ä»¥å¤–è¨ˆç®—ã‚’ã—ãŸã„ã¨ãã«ç”¨ã„ã‚‹

ãƒ„ãƒ¼ãƒ«ã«é–¢ã—ã¦ã¯ã€ä»Šå›žã¯ã¾ã ä½¿ã„ã¾ã›ã‚“ã€‚

ãŠã‚ã³

disclaimer: é”æ³•ã®å¤šé …å¼ã¨ Newton æ³•ã«ã¤ã„ã¦ã¯ä¸€æ—¦ãŠã‚ãšã‘ã§ã™ã€‚èª¤å·®è©•ä¾¡ãŒã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã€‚$x, y\ge 1$ ã‚’è¸ã¾ãˆã‚‹ã¨ $y\oplus (x\oslash y)$ ã®éƒ¨åˆ†ã®èª¤å·®ã¯ $y+\tfrac xy$ ã¨æ¯”ã¹ã¦ 1 ULP ç¨‹åº¦ã«åŽã¾ã‚‹ã®ã‹ãªï¼Ÿ

æœ¬é¡Œ

ã•ã¦ã€shift-and-add algorithm ã¨å‘¼ã°ã‚Œã‚‹å…¸åž‹ãƒ†ã‚¯ã‚’ã‚„ã£ã¦ã„ãã¾ã™ã€‚LLVM ã® sqrt ã§ã‚‚ä½¿ã‚ã‚Œã¦ã„ã‚‹ã»ã‹ã€Elementary Functions ã® 8 ç« ã§ã‚‚ç´¹ä»‹ã•ã‚Œã¦ã„ã¾ã™ã€‚

range reduction ã‚„ reconstruction ã®éƒ¨åˆ†ã¯å‰å›žåŒæ§˜ã§ã€æµ®å‹•å°æ•°ç‚¹æ•° $x\in[1\lldot 4)$ ã«ã¤ã„ã¦ $\roundcirc{\sqrt x}$ ã‚’æ±‚ã‚ã‚‹ã¨ã—ã¾ã™ã€‚approximation ã®éƒ¨åˆ†ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã§ã™ã€‚

è€ƒå¯Ÿ

$$ \begin{aligned} y^{(n)} &= \sum_{i=0}^{n} y_i\times 2^{-i}, \\ r^{(n)} &= 2^n\cdot \left(x - (y^{(n)})^2\right) \end{aligned} $$ ã§å®šç¾©ã—ã¾ã™ã€‚ã“ã“ã§ $y_i\in\{0, 1\}$ ã§ã™ã€‚ åˆæœŸå€¤ã¯ $y^{(0)} = 1$ ãŠã‚ˆã³ $r^{(0)} = x-1$ ã§ã™ã€‚

$n\ge 1$ ã¨ã—ã€æ¬¡ã®ã‚ˆã†ã«ã—ã¦æ¼¸åŒ–å¼ã‚’å¾—ã¾ã™ã€‚ $$ \begin{aligned} r^{(n)} &= 2^n\cdot\left(x - (y^{(n)})^2\right) \\ &= 2^n\cdot\left(x - (y^{(n-1)} + y_n\times 2^{-n})^2\right) \\ &= 2^n\cdot\left(x - \left( (y^{(n-1)})^2 + 2y^{(n-1)}\cdot y_n\times 2^{-n} + y_n^2\times 2^{-2n}\right)\right) \\ % &= 2^n\cdot\left(x - (y^{(n-1)})^2 - y^{(n-1)}\cdot y_n\cdot 2^{-(n-1)} - y_n^2\cdot 2^{-2n}\right) \\ &= 2\cdot 2^{n-1}\cdot\left(x - (y^{(n-1)})^2\right) - y_n\cdot\left(2y^{(n-1)} + y_n\cdot 2^{-n}\right) \\ &= 2r^{(n-1)} - y_n\cdot\left(2y^{(n-1)}+2^{-n}\right). \end{aligned} $$ æœ€å¾Œã®ç‰å·ã¯ $y_n\in\{0, 1\}$ ã‹ã‚‰å¾“ã„ã¾ã™*1ã€‚

ã“ã“ã§ã€$r^{(n)}\ge 0$ ã‹ã¤ $r^{(n)}$ ãŒæœ€å°ã¨ãªã‚‹ã‚ˆã†ã« $y^{(n)}$ ã‚’å®šã‚ã‚‹ã¨ã€ $$ y_n = \begin{cases} 1, & \text{if}\:\: 2r^{(n-1)} \ge 2y^{(n-1)} + 2^{-n}; \\ 0, & \text{otherwise} \end{cases} $$ ã‚’å¾—ã¾ã™ã€‚

ã¾ãšã€$y^{(n)}$ ã‚„ $r^{(n)}$ ã«ã¤ã„ã¦ã®æ€§è³ªã‚’ç¤ºã—ã¦ãŠãã¾ã—ã‚‡ã†ã€‚

Claim 1: ä»»æ„ã®æ•´æ•° $n\ge 0$ ã«å¯¾ã—ã¦ã€$y^{(n)}\le \sqrt{x}\lt y^{(n)}+2^{-n}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

æ•°å¦çš„å¸°ç´æ³•ã§ç¤ºã™ã€‚$P(n) \iff y^{(n)}\le \sqrt{x}\lt y^{(n)}+2^{-n}$ ã¨ã™ã‚‹ã€‚

To-be-proved 1: $P(0)$

$y^{(0)} = 1$, $y^{(0)}+2^{-0} = 2$ ãŠã‚ˆã³ $1\le x\lt 4$ ã‚ˆã‚Šå¾“ã†ã€‚

To-be-proved 2: $P(n) \implies P(n+1)$

Case 1: $y_{n+1} = 0$

$y^{(n+1)} = y^{(n)} \le \sqrt x$ ã¯æ˜Žã‚‰ã‹ã€‚$\sqrt x\lt y^{(n+1)}+2^{-(n+1)}$ ã‚’ç¤ºã™ã€‚

$y_{n+1}=0$ ã‚ˆã‚Šã€ä¸‹è¨˜ãŒæˆã‚Šç«‹ã¤ã€‚

$r^{(n+1)} = 2r^{(n)}$,
$2r^{(n)}\lt 2y^{(n)}+2^{-(n+1)}$, and
$y^{(n+1)} = y^{(n)}$.

ã™ãªã‚ã¡ã€$r^{(n+1)}\lt 2y^{(n+1)}+2^{-(n+1)}$ ãŒæˆã‚Šç«‹ã¤ã€‚ $$ \begin{aligned} \left(y^{(n+1)}+2^{-(n+1)}\right)^2 &= (y^{(n+1)})^2+2^{-n}\cdot y^{(n+1)}+2^{-2(n+1)} \\ &= (y^{(n+1)})^2 + 2^{-(n+1)}\cdot(2y^{(n+1)}+2^{-(n+1)}) \\ &\gt (y^{(n+1)})^2 + 2^{-(n+1)}\cdot r^{(n+1)} \\ &= (y^{(n+1)})^2 + \left(x-(y^{(n+1)})^2\right) \\ &= x. \end{aligned} $$

Case 2: $y_{n+1} = 1$

$\sqrt x\lt y^{(n+1)}+2^{-(n+1)} = y^{(n)}+2^{-n}$ ã¯æ˜Žã‚‰ã‹ã€‚$y^{(n+1)}\le \sqrt x$ ã‚’ç¤ºã™ã€‚

$y_{n+1} = 1$ ã‚ˆã‚Šã€ä¸‹è¨˜ãŒæˆã‚Šç«‹ã¤ã€‚

$r^{(n+1)} = 2r^{(n)}-(2y^{(n)}+2^{-(n+1)})$,
$2r^{(n)}\ge 2y^{(n)}+2^{-(n+1)}$, and
$y^{(n+1)} = y^{(n)}+2^{-(n+1)}$.

ã™ãªã‚ã¡ã€$r^{(n+1)}\ge (2y^{(n)}+2^{-(n+1)})-(2y^{(n)}+2^{-(n+1)}) = 0$ ãŒæˆã‚Šç«‹ã¤ã€‚ ã‚ˆã£ã¦ã€$r^{(n+1)} = 2^n\cdot(x-(y^{(n+1)})^2)$ ã‚ˆã‚Šå¾“ã†ã€‚$\qed$

Claim 2: ä»»æ„ã®æ•´æ•° $n\ge 0$ ã«å¯¾ã—ã¦ã€$r^{(n)}\lt 4$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

Claim 1 ã‚ˆã‚Šã€$\sqrt x-y^{(n)}\lt 2^{-n}$ ãŒæˆã‚Šç«‹ã¤ã€‚ ã‚ˆã£ã¦ã€ $$ \begin{aligned} r^{(n)} &= 2^n\cdot(x-(y^{(n)})^2) \\ &= 2^n\cdot(\sqrt x-y^{(n)})(\sqrt x+y^{(n)}) \\ &\lt 2^n\cdot 2^{-n}\cdot(\sqrt 4+2) \\ &= 4.\quad\qed \end{aligned} $$

ã•ã¦ã€$2r^{(n-1)} \ge 2y^{(n-1)} + 2^{-n}$ ã®åˆ¤å®šã«ã¤ã„ã¦è€ƒãˆã¾ã™ã€‚

$2y^{(n-1)}\in[2\lldot 4)$ ãŒå¸¸ã«æˆã‚Šç«‹ã¤ã“ã¨ã‹ã‚‰ã€$2^{-n}\ge 2^{-51}$ã€ã™ãªã‚ã¡ $n\lt 52$ ã§ã‚ã‚Œã° $2r^{(n-1)}\ge 2y^{(n-1)}\oplus 2^{-n}$ ã¨ã—ã¦è¨ˆç®—ã§ãã¾ã™ã€‚ ã‚ˆã£ã¦ã€$n = 52$ ã«ã¤ã„ã¦ã®ã¿åˆ¥é€”è€ƒãˆã¾ã™ã€‚

Claim 3: ä»»æ„ã®æµ®å‹•å°æ•°ç‚¹æ•° $r\ge 0$ ãŠã‚ˆã³ $y\in[1\lldot 2)$ ã«å¯¾ã—ã¦ã€$r\ge y+2^{-53} \iff r\gt y$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

($\implies$): æ˜Žã‚‰ã‹ã€‚

($\impliedby$): å¯¾å¶ $r\lt y+2^{-53} \implies r\le y$ ã‚’ç¤ºã™ã€‚

Case 1: $r\lt 1$

$y\ge 1$ ã‚ˆã‚Šå¾“ã†ã€‚

Case 2: $r\ge 1$

æ•´æ•° $m_r \ge 2^{52}$ ãŠã‚ˆã³ $m_y\ge 2^{52}$ ã‚’ç”¨ã„ã¦ $r-y = (m_r-m_y)\times 2^{-52}$ ã¨è¡¨ã›ã‚‹ã€‚ ã‚ˆã£ã¦ã€$r-y\lt 2^{-53} \implies r-y\le 0$ ã¨ãªã‚‹ã€‚$\qed$

ã•ã¦ã€$y_n = 1$ ã ã£ãŸå ´åˆã€$r^{(n)} = 2r^{(n-1)} - (2y^{(n-1)}+2^{-n})$ ãªã®ã§ã€ã“ã®è¨ˆç®—ã«ã¤ã„ã¦ã‚‚å®Ÿè¡Œå¯èƒ½ã§ã‚ã‚‹å¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚

Lemma 4: ä»»æ„ã®æµ®å‹•å°æ•°ç‚¹æ•° $x\in[1\lldot 4)$, $y\in[1\lldot 2]$ ã«å¯¾ã—ã€$x-y\in[0\lldot 2)$ ãªã‚‰ã° $x\ominus y = x-y$ ã¨ãªã‚‹ã€‚

Proof

Case 1: $x\in[1\lldot 2)$

$2y-x\ge 2\cdot 1-2=0$ ã‚ˆã‚Š $x\le 2y$ã€‚$0\lt \tfrac y2\lt y\le x$ ã¯æ˜Žã‚‰ã‹ã§ã‚ã‚Šã€Sterbenz lemma ã‚ˆã‚Šå¾“ã†ã€‚

Case 2: $x\in[2\lldot 4)$

note: ãŸã¨ãˆã° $x=3-2^{-51}$, $y=1$ ã®ã¨ãã€Sterbenz lemma ã®å‰æãŒæˆã‚Šç«‹ãŸãªã„ã€‚

æ•´æ•° $m_x\in[2^{52}\lldot 2^{53})$, $m_y\in[2^{52}\lldot 2^{53}]$ ã‚’ç”¨ã„ã¦ $x=m_x\times 2^{-51}$, $y=m_y\times 2^{-52}$ ã¨è¡¨ã›ã‚‹ã€‚

$$ \begin{aligned} x-y &= m_x\times 2^{-51} - m_y\times 2^{-52} \\ &= (2m_x-m_y)\times 2^{-52}. \end{aligned} $$ $x-y\in [0\lldot 2)$ ã‚ˆã‚Šã€$2m_x-m_y \in [0\lldot 2^{53})$ ãŒæˆã‚Šç«‹ã¤ã€‚$\qed$

Claim 5: ä»»æ„ã®æ•´æ•° $0\le n\lt 52$ ã«å¯¾ã—ã¦ã€$y_n=1$ ã®ã¨ã $2r^{(n-1)} \ominus (2y^{(n-1)}\oplus 2^{-n}) = 2r^{(n-1)} - (2y^{(n-1)}+2^{-n})$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

Claim 2 ã‚ˆã‚Š $r^{(n)}\in [0\lldot 4)$ ãªã®ã§ã€$\tfrac12 r^{(n)}=r^{(n-1)}-(y^{(n-1)}+2^{-(n+1)}) \in[0\lldot 2)$ ãŒæˆã‚Šç«‹ã¤ã€‚ $y^{(n-1)}+2^{-(n+1)}\in[1\lldot 2]$ ãªã®ã§ã€$r^{(n-1)}\in[1\lldot 4)$ ã¨ãªã‚‹ã€‚

ã‚ˆã£ã¦ã€Lemma 4 ã‚ˆã‚Šå¾“ã†ã€‚$\qed$

ä»¥ä¸Šã«ã‚ˆã‚Šã€$y^{(0)}, \dots, y^{(52)}, y_0, \dots, y_{52}, r^{(0)}, \dots, r^{(51)}$ ãŒå¾—ã‚‰ã‚Œã¾ã™ã€‚ $r^{(52)}$ ã¯å¾—ã‚‰ã‚Œã¦ã„ã¾ã›ã‚“ã€‚ãªã‚“ã¨ã‹ã—ã¦ $y_{53}$ ã‚’æ±‚ã‚ã¦ã€$y^{(52)}+2^{-52}\cdot y_{53}$ ã‚’è¿”ã™å¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚

note: å‰å›ž ã® Claim 2 ã‚’è¸ã¾ãˆã¤ã¤ã€$y_{53} = 1$ ãªã‚‰ $y^{(52)} + 2^{-52}$ã€ãã†ã§ãªã‘ã‚Œã° $y^{(52)}$ ãŒç”ãˆã§ã™ã€‚

Claim 6: ä»»æ„ã®æ•´æ•° $0\le n\le 52$ ã«å¯¾ã—ã¦ã€$r^{(n)}\equiv 0\pmod{2^{-52}}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

æ•°å¦çš„å¸°ç´æ³•ã§ç¤ºã™ã€‚$P(n) \iff r^{(n)} \equiv 0\pmod{2^{-52}}$ ã¨ã™ã‚‹ã€‚

To-be-proved 1: $P(0)$

$x\in[1\lldot 4)$ ã‚ˆã‚Š $x\equiv 0\pmod{2^{-52}}$ ãªã®ã§ã€$r^{(0)} = x-1\equiv 0\pmod{2^{-52}}$ã€‚

To-be-proved 2: $n\lt 52 \wedge P(n) \implies P(n+1)$

Case 1: $y_{n+1} = 0$

$$r^{(n+1)} = 2r^{(n)} \equiv 0\pmod{2^{-52}}.$$

Case 2: $y_{n+1} = 1$

$y^{(n)}\in[1\lldot 2)$ ã‚ˆã‚Š $y^{(n)}\equiv 0\pmod{2^{-52}}$ ãªã®ã§ã€ $$ \begin{aligned} r^{(n+1)} &= 2r^{(n)}-(2y^{(n)}+2^{-(n+1)}) \\ &\equiv 0 \pmod{2^{-52}}. \quad\qed \end{aligned} $$

ã•ã¦ã€$y_{53}$ ã‚’æ±‚ã‚ã¦ã„ãã¾ã™ã€‚ã¾ã è¨ˆç®—ã§ãã¦ã„ãªã„å€¤ãŸã¡ã®å®šç¾©ã¯ä¸‹è¨˜ã§ã™ã€‚ $$ \begin{aligned} r^{(52)} &= 2r^{(51)} - y_{52}\cdot(2y^{(51)}+2^{-52}), \\ y_{53} &= \begin{cases} 1, & \text{if}\:\: 2r^{(52)} \ge 2y^{(52)} + 2^{-53}; \\ 0, & \text{otherwise}. \end{cases} \end{aligned} $$ $y_{52} = 0$ ã®ã¨ãã€$r^{(52)} = 2r^{(51)}$ ãŠã‚ˆã³ $y^{(52)} = y^{(51)}$ ã‚ˆã‚Šã€Claim 6 ã‚’è¸ã¾ãˆã¦ $$ \begin{aligned} y_{53} = 1 &\iff 2r^{(51)} - y^{(51)} \ge 2^{-54} \\ &\iff 2r^{(51)} - y^{(51)} \gt 0 \\ &\iff 2r^{(51)} \gt y^{(51)} \end{aligned} $$ ã§ã™ã€‚$y_{52} = 1$ ã®ã¨ãã¯ã€ $$ \begin{aligned} 2r^{(51)} &\ge 2y^{(51)}+2^{-52}, \\ r^{(52)} &= 2r^{(51)} - (2y^{(51)}+2^{-52}) \end{aligned} $$ ã§ã‚ã‚Šã€ $$ 2\cdot\left(2r^{(51)} - (2y^{(51)}+2^{-52})\right) \ge 2y^{(52)}+2^{-53} $$ ã™ãªã‚ã¡ $$ r^{(51)}-y^{(51)} \ge 2^{-1}\cdot y^{(52)} + 2^{-53} + 2^{-55} $$ ã‚’åˆ¤å®šã™ã‚Œã°ã‚ˆã„ã§ã™ã€‚

Lemma 7: $y_{52} = 1$ ã®ã¨ãã€$r^{(51)}\ominus y^{(51)} = r^{(51)}-y^{(51)}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

Claim 5 ã¨ã»ã¼åŒæ§˜ã«ã—ã¦ç¤ºã™ã€‚

$r^{(51)}-(y^{(51)}+2^{-53})\in[0\lldot 2)$ ã¨ $y^{(51)}+2^{-53}\in[1\lldot 2)$ ã‚ˆã‚Šã€$r^{(51)}\in [1\lldot 4)$ ãŒæˆã‚Šç«‹ã¤ã€‚ ã¾ãŸã€$r^{(52)}\lt 4$ ã‚ˆã‚Š $r^{(52)}\le 4-2^{-51}$ ãªã®ã§ã€$r^{(51)}-y^{(51)} = \tfrac12 r^{(52)}+2^{-53}\in [0\lldot 2)$ ã§ã‚ã‚‹ã€‚ ã‚ˆã£ã¦ã€Lemma 4 ã‚ˆã‚Š $r^{(51)}\ominus y^{(51)} = r^{(51)}-y^{(51)}$ ã¨ãªã‚‹ã€‚$\qed$

Claim 8: $y_{52} = 1$ ã®ã¨ãã€ä¸‹è¨˜ãŒæˆã‚Šç«‹ã¤ã€‚ $$ y_{53} = 1 \iff r^{(51)}\ominus y^{(51)} \gt 0.5\otimes(y^{(52)} \oplus 2^{-52}). $$

Proof

$y^{(52)}\in[1\lldot 2)$ ã‚ˆã‚Š $y^{(52)}\oplus 2^{-52} = y^{(52)}+2^{-52}\in[1\lldot 2]$ ãŒæˆã‚Šç«‹ã¤ã€‚

$z = (r^{(51)}-y^{(51)}) - (2^{-1}\cdot(y^{(52)} + 2^{-52}))$ ã¨ã—ã¦ $z \equiv 0 \pmod{2^{-53}}$ ãŒæˆã‚Šç«‹ã¤ã®ã§ã€$z\ge 2^{-55} \iff z\gt 0$ ã¨ãªã‚‹ã€‚ã‚ã¨ã¯ Lemma 7 ã‚ˆã‚Šå¾“ã†ã€‚$\qed$

ä»¥ä¸Šã«ã‚ˆã‚Šã€$\roundcirc{y^{(53)}}$ ãŒæ±‚ã‚ã‚‰ã‚Œã¾ã—ãŸã€‚ã‚ã§ãŸã—ã‚ã§ãŸã—ã€‚

æ‰‹é †

æ‰‹é †ã¨ã—ã¦æ•´ç†ã™ã‚‹ã¨æ¬¡ã®é€šã‚Šã§ã™ã€‚

ä¾¿å®œä¸Šã€Iverson bracket $[\bullet]$ ã‚’ç”¨ã„ã¾ã™ã€‚ã™ãªã‚ã¡ã€æ¡ä»¶ $x$ ãŒæˆã‚Šç«‹ã¤ã¨ã $[x]=1$ã€ãã†ã§ãªã„ã¨ã $[x]=0$ ã§ã™ã€‚

å…¥åŠ›: $x\in[1\lldot 4)$
å‡ºåŠ›: $\roundcirc{\sqrt x}$
$y\gets 1$ ã§åˆæœŸåŒ–ã™ã‚‹ã€‚
$r\gets x\ominus 1$ ã§åˆæœŸåŒ–ã™ã‚‹ã€‚
$\Delta y \gets 0.5$ ã§åˆæœŸåŒ–ã™ã‚‹ã€‚
å„ $i\gets\angled{1, 2, \dots, 51}$ ã«ã¤ã„ã¦ä¸‹è¨˜ã‚’è¡Œã†ã€‚
- $r\xgets{\otimes}2$ ã§æ›´æ–°ã™ã‚‹ã€‚
- $z \gets (2\otimes y)\oplus\Delta y$ ã§å®šç¾©ã™ã‚‹*2ã€‚
- $r\ge z$ ã§ã‚ã‚Œã°ä¸‹è¨˜ã‚’è¡Œã†ã€‚
  - $r\xgets{\ominus}z$ ã§æ›´æ–°ã™ã‚‹ã€‚
  - $y\xgets{\oplus}\Delta y$ ã§æ›´æ–°ã™ã‚‹ã€‚
- $\Delta\xgets{\otimes}0.5$ ã§æ›´æ–°ã™ã‚‹ã€‚
$(y^{(51)}, r^{(51)}) \gets (y, r)$ ã§å®šç¾©ã™ã‚‹ã€‚
$y_{52} \gets [r^{(51)} \gt y^{(51)}]$ ã§å®šç¾©ã™ã‚‹ã€‚
$y_{52} = 1$ ã§ã‚ã‚Œã°ä¸‹è¨˜ã‚’è¡Œã†ã€‚
- $y\xgets{\oplus}\Delta y$ ã§æ›´æ–°ã™ã‚‹ã€‚
$y_{53} \gets [y_{52} = 0][2\otimes r^{(51)}\ge y^{(51)}] + [y_{52} = 1][r^{(51)}\ominus y^{(51)}\gt 0.5\otimes(y\oplus \Delta y)]$ ã§å®šç¾©ã™ã‚‹ã€‚
$y_{53} = 1$ ã§ã‚ã‚Œã°ä¸‹è¨˜ã‚’è¡Œã†ã€‚
- $y\xgets{\oplus} \Delta y$ ã§æ›´æ–°ã™ã‚‹ã€‚
$y$ ã‚’å‡ºåŠ›ã™ã‚‹ã€‚

å®Ÿè£…

fn sqrt(x: f64) -> f64 {
    if x < 0.0 {
        return f64::NAN;
    }
    if x == 0.0 || x.is_infinite() || x.is_nan() {
        return x;
    }

    let (x_m, x_e) = match frexp(x) {
        (m, e) if e % 2 == 0 => (4.0 * m, e - 2),
        (m, e) => (2.0 * m, e - 1),
    };
    assert_eq!(x_e % 2, 0);
    assert!(1.0 <= x_m && x_m < 4.0);

    let mut y = 1.0;
    let mut r = x_m - 1.0;
    let mut two_pmn = 0.5;
    for _ in 1..=51 {
        r *= 2.0;
        let tmp = 2.0 * y + two_pmn;
        if r >= tmp {
            r -= tmp;
            y += two_pmn;
        }
        two_pmn *= 0.5;
    }

    let (y51, r51) = (y, r);

    let y_52 = if r51 > y51 { 1 } else { 0 };
    if y_52 == 1 {
        y += two_pmn;
    }

    let y_53 = if y_52 == 0 {
        if 2.0 * r51 >= y51 { 1 } else { 0 }
    } else {
        if r51 - y51 > 0.5 * (y + two_pmn) { 1 } else { 0 }
    };
    if y_53 == 1 {
        y += two_pmn;
    }
    ldexp(y, x_e / 2)
}

ãŠã¾ã‘

å„æ•´æ•° $0\le n\le 52$ ã«å¯¾ã—ã¦ $y^{(n)}\in[1\lldot 2)$, $r^{(n)}\in[0\lldot 4)$, $r^{(n)}\equiv 0\pmod{2^{-52}}$ ãŒæˆã‚Šç«‹ã¤ã“ã¨ã‹ã‚‰ã€ãã‚Œãžã‚Œ $2^{52}$ å€ã—ãŸã‚‚ã®ã‚’è€ƒãˆã¦ u64 ã§è¨ˆç®—ã™ã‚‹ã“ã¨ã‚‚å¯èƒ½ã§ã™ã€‚å®Ÿéš›ã€LLVM ã®å®Ÿè£…ã§ã¯ãã®ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ å‰å›žã®äºŒåˆ†æŽ¢ç´¢ã®æ–¹é‡ã§ã¯ u128 ãŒå¿…è¦ãªä¸Šã«ä¹—ç®—ãŒå¿…è¦ã§ã—ãŸãŒã€ä»Šå›žã®æ–¹é‡ã§ã¯ u64 ã®åŠ æ¸›ç®—ã¨ã‚·ãƒ•ãƒˆæ¼”ç®—ã®ã¿ã§å®Ÿè£…å¯èƒ½ã§ã™ãã€‚

æ‰€æ„Ÿ

ãªã‚“ã§ã“ã‚“ãªã¤ã‚‰ã„æ€ã„ã‚’ã—ãªãŒã‚‰ f64 ã§è¨ˆç®—å¯èƒ½ãªã“ã¨ã‚’ç¤ºã—ãŸãŒã£ã¦ã‚‹ã‚“ã ï¼Ÿ ç´ ç›´ã« u64 ã‚’ä½¿ã„ãŸã„æ°—æŒã¡ã§ã„ã£ã±ã„
— ãˆã³ã¡ã‚ƒã‚“ðŸ‘ðŸðŸ¦ƒ (@rsk0315_h4x) 2025å¹´3æœˆ23æ—¥

ç¤ºã›ã‚‹ã¨ã†ã‚Œã—ã„ã¨ã„ã†æ°—æŒã¡ã¯ã‚ã‚Šã¾ã™ã€‚

ã‚ªãƒ¼ãƒãƒ¼ãƒ•ãƒãƒ¼ã—ãŸã¨ãã«ä¸Šã®æ¡ã‚’æ¨ã¦ã‚‹ã®ãŒ u64 ã§ã€ä¸‹ã®æ¡ã‚’æ¨ã¦ã‚‹ï¼ˆ+ ã©ã®ãã‚‰ã„ã‚ªãƒ¼ãƒãƒ¼ãƒ•ãƒãƒ¼ã—ãŸã‹ã‚’åˆ¥é€”æŒã£ã¦ãŠãï¼‰ã®ãŒ f64 ã ã¨ã„ã†æ„Ÿè¦šãŒèº«ã«ã¤ã„ã¦ãã¾ã—ãŸ*3ã€‚ ãã†ã„ã†æ„å‘³ã§ã€ã€Œèª¤å·®ã‚’å‡ºã•ãªã„ã€ã¨ã€Œã‚ªãƒ¼ãƒãƒ¼ãƒ•ãƒãƒ¼ã•ã›ãªã„ã€ãŒã‚ã‚‹ç¨®ã®ä¼¼ãŸè¦‹æ–¹ã ã¨æ€ã†ã‚ˆã†ã«ãªã£ã¦ãã¾ã—ãŸã€‚

Elementary Functions ã§ã¯ã€shift-and-add algorithm ã®ä½¿ç”¨ä¾‹ã¨ã—ã¦ log ã‚„ exp ã‚’æŒ™ã’ã¦ãŠã‚Šã€ã“ã¡ã‚‰ã‚‚å¾Œã€…ç´¹ä»‹ã™ã‚‹ã“ã¨ã«ãªã‚‹ã‹ãªï¼Ÿã¨æ€ã£ã¦ã„ã¾ã™ã€‚ 1 ãƒ“ãƒƒãƒˆãšã¤æ±ºã‚ã¦ã„ããŸã‚ä»®æ•°éƒ¨ã®é•·ã•ã«å¯¾ã—ã¦ç·šå½¢æ™‚é–“ã¯ã‹ã‹ã£ã¦ã—ã¾ã„ã¾ã™ãŒã€å€¤ãŒ $0$ ã¾ãŸã¯ $1$ ã§ã‚ã‚‹ã“ã¨ã‚’åˆ©ç”¨ã—ãŸå¼å¤‰å½¢ãŒä½¿ãˆãŒã¡ã§é¢ç™½ã„ã§ã™ãã€‚ ä»Šå›žã®ä¾‹ã§è¨€ã†ã¨ã“ã‚ã® $$ y_n\cdot(2y^{(n-1)}+y_n\cdot 2^{-n}) = y_n\cdot(2y^{(n-1)}+2^{-n}) $$ ã®ã‚ˆã†ãªã‚‚ã®ã§ã™ã€‚

æ°—åˆ†ã¨ã—ã¦ã¯ã€æ¬¡ã¯ sin, cos ã‚’ã—ã‚ˆã†ã‹ãªã¨æ€ã£ã¦ã„ã¾ã™ãŒã€ã©ã†ãªã‚‹ã‹ã¯ã‚ã‹ã‚Šã¾ã›ã‚“ã€‚ é”æ³•ã®å¤šé …å¼ã‚„ Newton æ³•ã¨ã‚‚ä»²ã‚ˆããªã‚ŠãŸã„æ°—æŒã¡ã¯ã‚ã‚Šã¾ã™ã‹ã‚‰ãã€‚

ãŠã‚ã‚Š

ãŠã‚ã‚Šã§ã™ã€‚

*1:LLVM ã®ã‚³ãƒ¡ãƒ³ãƒˆä¸Šã§ã¯æœ€å¾Œã®é …ãŒ $2^{-n-1}$ ã«ãªã£ã¦ã„ã¾ã™ãŒã€ãã®å¾Œã®å®Ÿè£…ã‚’è¦‹ã¦ã‚‚ $2^{-n}$ ç›¸å½“ã«ãªã£ã¦ã„ã‚‹ã‚ˆã†ã«è¦‹ãˆã¾ã™ã—ã€ã“ã‚Œã§æ£ã—ã„ã¨æ€ã£ã¦ã„ã¾ã™ã€‚

*2:immutable å‰æã®å¤‰æ•°ã®å°Žå…¥ã‚’ã—ãŸã„ã¨ãã€ã€ŒåˆæœŸåŒ–ã€ã¯é•ã†ã‹ã‚‚ã¨æ€ã£ã¦ç”¨èªžã‚’åˆ†ã‘ã¾ã—ãŸã€‚ã€ŒæŸç¸›ã€ï¼Ÿ

*3:æµ®å‹•å°æ•°ç‚¹æ•°ã§è¨€ã†ã¨ã“ã‚ã®ã‚ªãƒ¼ãƒãƒ¼ãƒ•ãƒãƒ¼ã¯ $\pm\infty$ ã«ãªã‚‹ã“ã¨ã ã¨æ€ã„ã¾ã™ãŒã€ã“ã“ã§ã¯ä»®æ•°éƒ¨ã«å¯¾ã—ã¦å››å‰‡æ¼”ç®—ã‚’ã—ãŸã¨ãã®æ¡ã‚ãµã‚Œãã‚‰ã„ã®æ„å‘³ã§è§£é‡ˆã—ã¦ãã ã•ã„ã€‚

2025-03-23

ç”»åƒã®ã¦ã™ã¨

ã“ã“ã«ãƒ†ã‚¹ãƒˆç”¨ã®ç”»åƒã‚’è²¼ã‚Šã¾ã™ã€‚

2025-03-22

correct rounding ã¸ã®é“ (1) ç´ æœ´ãª sqrt

ã„ã‚ã„ã‚ãªæ•°å¦é–¢æ•°ãŸã¡ã® correct rounding ãªå®Ÿè£…ã‚’ã—ã¦ã„ã“ã†ã¨ã„ã†éŠã³ã§ã™ã€‚ ä¸¸ã‚æ–¹å‘ã«ã¤ã„ã¦ã¯ä¸€æ—¦ã¯ tiesToEven ã®ã¿ã‚’è€ƒãˆã¦ã„ã¾ã™ã€‚

$\sin$ ã‚„ $\log$ ã®ã‚ˆã†ãªè¶…è¶Šé–¢æ•° (transcendental functions) ã¯å¤§å¤‰ã§ã¯ã‚ã‚Šã¾ã™ãŒã€ã•ã¾ã–ã¾ãªå…¸åž‹ãƒ†ã‚¯ãŒã‚ã‚‹ã®ã§ã€ãã®ã†ã¡ç´¹ä»‹ã™ã‚‹ã“ã¨ã«ãªã‚‹ã¨æ€ã„ã¾ã™ã€‚ ä»Šå›žã¯ã€ç‰¹ã«æ´—ç·´ã•ã‚Œã¦ã„ãªã„æ–¹æ³•ã‚’ç”¨ã„ã¦ $\sqrt{x}$ ã® correctly-rounded ãªå€¤ã‚’å¾—ã¾ã—ã‚‡ã†ã¨ã„ã†å›žã§ã™ã€‚

å‰æ

ç«‹å ´

ã“ã“ã§ã¯ correct rounding ã§ã‚ã‚‹ã“ã¨ã‚’ä¸€ç•ªã«é‡è¦è¦–ã—ã¾ã™ã€‚ã™ãªã‚ã¡ã€çœŸã®å€¤ãŒ $f(x)$ ã®ã¨ãã€ãã‚Œã‚’æ£ç¢ºã«ä¸¸ã‚ãŸå€¤ãŒæ¬²ã—ã„ã§ã™ã€‚ ã„ãã‚‰ã‹èª¿ã¹ãŸã¨ã“ã‚ã€ã“ã®åˆ†é‡Žã§ã¯ $\roundcirc{f(x)}$ ã¨æ›¸ãã“ã¨ãŒå¤šãã†ãªã®ã§ã€ã“ã“ã§ã‚‚ãã†ã—ã¾ã™*1ã€‚ä»Šã¾ã§ã®è¨˜äº‹ã§ $\roundp{f(x)}$ ã®ã‚ˆã†ã«æ›¸ã„ã¦ã„ãŸã‚‚ã®ã¨åŒã˜ã§ã™ã€‚

åˆã‚ã¦ã®äººã‹ã‚‰ã™ã‚‹ã¨ã€Œæ£ç¢ºã«ä¸¸ã‚ã‚‹ã€ã¨ã„ã†ã®ãŒæ…£ã‚Œãªã„æ¦‚å¿µã‹ã‚‚ã—ã‚Œãªã„ã®ã§ã€ä¸€å¿œå…·ä½“ä¾‹ã‚’å‡ºã—ã¦ãŠãã¾ã™ã€‚$\roundcirc{\sqrt2}$ ã‚’è€ƒãˆã¾ã™ã€‚ $$ \sqrt{2} = {\small 1.}{\footnotesize 414213562373095}{\scriptsize 048801688724209}{\tiny 698078569671875}{\tiny 376948073176679{\dots}} $$ ã§ã€binary64 ã§è¡¨ã›ã‚‹æ•°ã®ã†ã¡ã€$\sqrt{2}$ ä»¥ä¸‹ã§æœ€å¤§ã®ã‚‚ã®ã¨ $\sqrt{2}$ ä»¥ä¸Šã§æœ€å°ã®ã‚‚ã®ã¯ã€ãã‚Œãžã‚Œä¸‹è¨˜ã®é€šã‚Šã§ã™ã€‚ $$ \begin{aligned} \texttt{16A09E667F3BCC}_{(16)}\times 2^{-52} &= {\small 1.}{\footnotesize 414213562373094}{\scriptsize 923430016933707}{\tiny 520365715026855}{\tiny 46875}, \\ \texttt{16A09E667F3BCD}_{(16)}\times 2^{-52} &= {\small 1.}{\footnotesize 414213562373095}{\scriptsize 145474621858738}{\tiny 828450441360473}{\tiny 6328125}. \end{aligned} $$

å‰è€…ã¨ã®å·®ã¯ $1.253\times 10^{-16}$ ç¨‹åº¦ã€å¾Œè€…ã¨ã®å·®ã¯ $9.667\times 10^{-17}$ ç¨‹åº¦ã§ã‚ã‚Šã€å¾Œè€…ã®æ–¹ãŒè¿‘ã„ãŸã‚ã€å¾Œè€…ã«ä¸¸ã‚ã‚‰ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™*2ã€‚ ã“ã“ã§å‰è€…ã«ä¸¸ã‚ã¦ã—ã¾ã†ã‚‚ã®ã¯ correct ã¨ã¯èªã‚ã‚‰ã‚Œã¾ã›ã‚“ã€‚ãªãŠã€è² æ–¹å‘ã¾ãŸã¯æ£æ–¹å‘ã§æœ€ã‚‚è¿‘ã„ã‚‚ã®ã®ã©ã¡ã‚‰ã‹ï¼ˆæ–¹å‘ã¯å¼•æ•°ã«ã‚ˆã£ã¦å¤‰ã‚ã£ã¦ã‚ˆã„ï¼‰ã«ä¸¸ã‚ã‚‹ã‚‚ã®ã¯ faithful rounding ã¨å‘¼ã°ã‚Œã¾ã™ã€‚

note: $\sqrt{2}$ ã‚„ $\tfrac13$ ãªã©ã€ï¼ˆäºŒé€²æ³•ã§ï¼‰ç„¡é™å°æ•°ã¨ãªã‚‹ã‚‚ã®ã°ã‹ã‚ŠãŒæ„è˜ã•ã‚ŒãŒã¡ã§ã™ãŒã€$(1+2^{-52})^2$ ã®ã‚ˆã†ãªæœ‰é™å°æ•°ã§ã‚‚ä¸¸ã‚èª¤å·®ã¯ç”Ÿã˜ã¾ã™ã€‚

å¿œç”¨å…ˆã«ã‚ˆã£ã¦ã¯ faithful rounding ã§ã‚ˆã„ã§ã—ã‚‡ã†ã—ã€ã‚ã‚‹ã„ã¯ã‚‚ã£ã¨ãƒ©ãƒ•ã«ã€Œç›¸å¯¾èª¤å·® $10^{-14}$ã€ã®ã‚ˆã†ãªã®ã§æº€è¶³ã§ãã‚‹çŠ¶æ³ã‚‚å¤šã€…ã‚ã‚‹ã§ã—ã‚‡ã†ãŒã€ã“ã“ã§ã¯ãã†ã§ã¯ãªã„ã¨ã„ã†ã“ã¨ã§ã™ã€‚èª˜æƒ‘ã«è² ã‘ãšã«ã„ãã¾ã—ã‚‡ã†ã€‚

ã¾ãŸã€æ£å½“æ€§ã®è¨¼æ˜Žã‚’é‡è¦è¦–ã—ã¾ã™ã€‚ã“ã‚Œã¯æµ®å‹•å°æ•°ç‚¹åž‹ã«é™ã£ãŸè©±ã§ã¯ãªã„ã§ã™ãŒã€æœªè¨¼æ˜Žã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã¯ä½¿ã†æ°—ãŒã—ãªã„ã§ã™ã‹ã‚‰ãã€‚ äººé–“ãŒæ•°å¼ã§è¡Œã†ã®ãŒä¸»ã«ãªã‚‹ã¨æ€ã„ã¾ã™ãŒã€Gappa ã‚„ Coq ãªã©ã®è¨¼æ˜Žæ”¯æ´ã‚·ã‚¹ãƒ†ãƒ ã‚’ä½¿ã†ã“ã¨ã‚‚è¦–é‡Žã«å…¥ã‚Œã¦ã„ã¾ã™ã€‚

é€Ÿåº¦ã‚‚é€Ÿã„ã«è¶Šã—ãŸã“ã¨ã¯ãªã„ã§ã™ãŒã€äºŒã®æ¬¡ã§ã™ã€‚ãŸã¨ãˆã€Œfaithfully-rounded ãªçµæžœã¯ 0.01 ms ã§å¾—ã‚‰ã‚Œã‚‹ãŒã€correctly-rounded ãªçµæžœã¯ 30 s ã‹ã‹ã‚‹ã€ã¨ã—ã¦ã‚‚ã€æˆ‘ã€…ã¯ correct rounding ã«å›ºåŸ·ã—ã¾ã™ã€‚ æ£å½“æ€§ã‚’ä¿ã£ãŸã¾ã¾ã§é«˜é€ŸåŒ–ã‚’ãŒã‚“ã°ã‚Œã°ã‚ˆã„ã®ã§ã‚ã£ã¦ã€correct rounding ã‚’æ¨ã¦ã‚‹ã®ã¯è«–å¤–ã§ã™ã€‚ correct rounding ã®ç‹‚ä¿¡è€…ã«ãªã£ãŸã¨æ€ã£ã¦ãã ã•ã„ã€‚

åž‹

æµ®å‹•å°æ•°ç‚¹åž‹ã¨ã—ã¦ binary64 (double, f64) ã‚’è€ƒãˆã¾ã™ã€‚ä¸¸ã‚ãƒ¢ãƒ¼ãƒ‰ã¨ã—ã¦ã¯ tiesToEven ã ã‘ã‚’ä¸€æ—¦æƒ³å®šã—ã¾ã™ã€‚

ãƒ—ãƒªãƒŸãƒ†ã‚£ãƒ–æ¼”ç®—

å®šæ•°ãƒªãƒ†ãƒ©ãƒ«
- NaN ã‚„ $\pm\infty$ ã‚’å«ã‚€å®šæ•°ã®ç”Ÿæˆ
ãƒ“ãƒƒãƒˆè¡¨ç¾åŒå£«ã®å¤‰æ› (transmute)
- f64 ã‹ã‚‰ u64 ã¸ã®ãƒ“ãƒƒãƒˆè¡¨ç¾ã‚’ä¿ã£ãŸå¤‰æ›
- u64 ã‹ã‚‰ f64 ã¸ã®ãƒ“ãƒƒãƒˆè¡¨ç¾ã‚’ä¿ã£ãŸå¤‰æ›
128-bit ä»¥ä¸‹ã®æ•´æ•°åž‹ï¼ˆç¬¦å·ãªã—ã€ç¬¦å·ã¤ãï¼‰ã®å„æ¼”ç®—
- å››å‰‡æ¼”ç®— (+, -, *, /, %)
  - / ãŠã‚ˆã³ % ã¯ã€å•†ã‚’ $0$ æ–¹å‘ã«ä¸¸ã‚ã‚‹åˆ‡ã‚Šæ¨ã¦é™¤ç®—ã¨ã™ã‚‹*3
- ãƒ“ãƒƒãƒˆæ¼”ç®— (&, |, ^, !, <<, >>)
- æ¯”è¼ƒæ¼”ç®— (==, !=, <, >, <=, >=)
æµ®å‹•å°æ•°ç‚¹åž‹ã®å„æ¼”ç®—
- å››å‰‡æ¼”ç®— (+, -, *, /)
  - æ•°å¼ä¸ã§ã¯ $\oplus$, $\ominus$, $\otimes$, $\oslash$ ã¨è¡¨è¨˜ã™ã‚‹
- fused multiply-add (FMA)
  - $\roundcirc{x\times y + z}$ ã®ã“ã¨
- æ¯”è¼ƒæ¼”ç®— (==, !=, <, >, <=, >=)
- NaN ã®åˆ¤å®š

æµ®å‹•å°æ•°ç‚¹åž‹ã®å„æ¼”ç®—ã¯ correct rounding ã¨ã—ã¾ã™ã€‚å¾Œã€…ã«ãªã£ã¦ã‹ã‚‰æ•´æ•°åž‹ãªã©ã§ã‚¨ãƒŸãƒ¥ãƒ¬ãƒ¼ãƒˆã™ã‚‹æ–¹æ³•ã‚’æ›¸ãã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒã€ä¸€æ—¦ã¯ä¸Žãˆã‚‰ã‚Œã¦ã„ã‚‹ã‚‚ã®ã¨ã—ã¾ã™ã€‚

ã—ã°ã—ã°æš—é»™ã«è¡Œã„ã¾ã™ãŒã€$2^{-1022}$ ã‚„ $2^{54}$ ã®ã‚ˆã†ãªå®šæ•°ã¯ã€æŒ‡æ•°é–¢æ•°ã®ã‚ˆã†ãªã‚‚ã®ã‚’æ„å›³ã—ã¦ã„ã‚‹ã®ã§ã¯ãªãã€ã‚ãã¾ã§å®šæ•°ãƒªãƒ†ãƒ©ãƒ«ã«ç›¸å½“ã™ã‚‹ã‚‚ã®ã¨ã—ã¦ä½¿ã£ã¦ã„ã¾ã™ã€‚

ä¸Šè¨˜ã®æ¼”ç®—ã®ã¿ã§è¨ˆç®—ã§ãã‚‹ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã‚’æ§‹æˆã—ã€ãã®æ£å½“æ€§ã®è¨¼æ˜Žã®éš›ã«å¿…è¦ã§ã‚ã‚Œã°ç„¡é™ç²¾åº¦ã®å®Ÿæ•°ã®æ¼”ç®—ã‚‚ç”¨ã„ã¾ã™ã€‚æ•°å¼ä¸ã®è¨ˆç®—ã¯ã€ä¸¸ã‚ $\roundcirc{\bullet}$ ã‚’æ˜Žç¤ºã—ãªã„é™ã‚Šã¯ç„¡é™ç²¾åº¦ã§ï¼ˆã¨ã„ã†ã‹ãŸã ã®å®Ÿæ•°ã®æ¼”ç®—ã¨ã—ã¦ï¼‰è¡Œã„ã¾ã™*4ã€‚

note: $x \oplus y$ ã®ã‚ˆã†ãªæµ®å‹•å°æ•°ç‚¹æ•°ç”¨ã®æ¼”ç®—åã¯ã€ã‚ªãƒšãƒ©ãƒ³ãƒ‰ã® $x$ ã‚„ $y$ ãŒæµ®å‹•å°æ•°ç‚¹æ•°ã¨ã—ã¦è¡¨ã›ã‚‹å€¤ã§ã‚ã‚‹å ´åˆã®ã¿ä½¿ã†æƒ³å®šã§ã™ãŒã€ãã†ã„ã†å‰æã§ $\roundcirc{x+y}$ ã®ç•¥è¨˜ã ã¨æ€ã£ã¦å·®ã—æ”¯ãˆãªã„ã§ã™ã€‚

æœ¬é¡Œ

ã‚„ã‚Šã¾ã—ã‚‡ã†ã€‚

frexp

ã¾ãšã¯ frexp ã¨å‘¼ã°ã‚Œã‚‹é–¢æ•°ã‚’ç”¨æ„ã—ã¦ãŠãã¾ã—ã‚‡ã†ã€‚ ä¸Žãˆã‚‰ã‚ŒãŸæµ®å‹•å°æ•°ç‚¹åž‹ã®å€¤ã‚’ã€fraction ã¨ exponent ã«åˆ†ã‘ã‚‹é–¢æ•°ã§ã™ã€‚ å…·ä½“çš„ã«ã¯ã€éžé›¶ãªæœ‰é™å€¤ $x$ ãŒä¸Žãˆã‚‰ã‚ŒãŸã¨ãã€ä¸‹è¨˜ã‚’æº€ãŸã™ã‚ˆã†ãªçµ„ $(x_m, x_e)$ ã‚’è¿”ã—ã¾ã™ã€‚$x_m$ ã¯æµ®å‹•å°æ•°ç‚¹åž‹ã§ã€$x_e$ ã¯ç¬¦å·ã¤ãæ•´æ•°åž‹ã§ã™ã€‚

$x_m\times 2^{x_e} = x$, and
$|x_m|\in[0.5\lldot 1)$.

$x$ ãŒã‚¼ãƒ ($0_{\pm}$) ã¾ãŸã¯ NaNã€$\pm\infty$ ã®ã¨ãã¯ $(x, 0)$ ã‚’è¿”ã™ã“ã¨ã«ã—ã¦ãŠãã¾ã™ã€‚

ã‚¼ãƒã®ç¬¦å·ã«ã¤ã„ã¦

æ£è² ã®ã‚¼ãƒ +0.0 ã¨ -0.0 ã‚’ãã‚Œãžã‚Œ $0_+$, $0_-$ ã¨æ›¸ã„ã¦ã„ã¾ã™ã€‚$\roundcirc{0} = 0_+$ ã‚„ $-0_+ = 0_-$ ãªã©ãŒæˆã‚Šç«‹ã¡ã¾ã™ã€‚ +0.0 == -0.0 ã§ã™ãŒã€è¨˜å·ã®æ¯”è¼ƒã¨ã„ã†æ„å‘³ã§ $0_+ \ne 0_-$ ã¨ã—ã¦ãŠãã¾ã™ã€‚

ä¸‹è¨˜ã®è¨˜äº‹ã§ã‚‚å¤šå°‘è§¦ã‚Œã¦ã„ã¾ã™ã€‚

rsk0315.hatenablog.com

signaling NaN ã‚„ quiet NaN ã®åŒºåˆ¥ãªã©ã«é–¢ã—ã¦ã¯ã€ä¸€æ—¦æ°—ã«ã—ãªã„ã“ã¨ã«ã—ã¦ãŠãã¾ã™*5ã€‚

ãƒ“ãƒƒãƒˆè¡¨ç¾ã‚’å¾—ã¦ã‹ã‚‰æŒ‡æ•°éƒ¨ã‚’èª¿æ•´ã—ã¾ã™ã€‚éžæ£è¦æ•°ã«æ³¨æ„ã—ã¾ã—ã‚‡ã†ã€‚glibc ã®å®Ÿè£…ã§ã¯ $2^{54}\cdot x$ ã®ã‚±ãƒ¼ã‚¹ã«å¸°ç€ã•ã›ã¦ã„ã¾ã™ã*6ã€‚

å®Ÿè£…

const TWO_P54: f64 = 18014398509481984.0;

fn frexp(x: f64) -> (f64, i32) {
    let mut ix = x.to_bits();
    let mut ex = (ix >> 52 & 0x7FF) as i32;

    if ex != 0x7FF && x != 0.0 {
        // Not zero and finite.
        let mut e = ex - 1022;
        if ex == 0 {
            // subnormal.
            let x = x * TWO_P54;
            ix = x.to_bits();
            ex = 0x7FF & (ix >> 52) as i32;
            e = ex - 1022 - 54;
        }
        ix = (ix & 0x800FFFFFFFFFFFFF_u64) | 0x3FE0000000000000_u64;
        (f64::from_bits(ix), e)
    } else {
        (x, 0)
    }
}

ldexp

ç¶šã„ã¦ frexp ã®é€†æ“ä½œ (load exponent) ã‚’ç”¨æ„ã—ã¦ãŠãã¾ã—ã‚‡ã†ã€‚$(x_m, x_e)$ ã«å¯¾ã—ã¦ $\roundcirc{x_m\times 2^{x_e}}$ ã‚’è¿”ã—ã¾ã™ã€‚ $x_e$ ã®ç¯„å›²æ¬¡ç¬¬ã§ã¯ overflow ã‚„ underflow ãŒèµ·ãã‚‹ã®ã§ $\circ$ ã‚’æ˜Žç¤ºã—ã¦ã„ã¾ã™ãŒã€ãã‚Œä»¥å¤–ã®ã‚±ãƒ¼ã‚¹ã§ã¯èª¤å·®ã¯ç”Ÿã˜ã¾ã›ã‚“ã€‚ å¼•æ•°ã¯ $x_m\in[0.5\lldot 1)$ ã§ã‚ã‚‹å¿…è¦ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚

å®Ÿè£…

const TWO_P54: f64 = 18014398509481984.0;
const TWO_PM54: f64 = 5.5511151231257827021181583404541015625e-17;

fn ldexp(mut x: f64, e: i32) -> f64 {
    if !x.is_finite() || x == 0.0 {
        return x;
    }
    let mut ix = x.to_bits();
    let mut k = (ix >> 52 & 0x7FF) as i32;
    if k == 0 {
        // subnormal.
        x *= TWO_P54;
        ix = x.to_bits();
        k = (ix >> 52 & 0x7FF) as i32 - 54;
    }
    if e < -50000 {
        return 0.0_f64.copysign(x);
    }
    if e > 50000 || k + e > 0x7FE {
        return f64::INFINITY.copysign(x);
    }
    k += e;
    if k > 0 {
        let bits = (ix & 0x800FFFFFFFFFFFFF_u64) | (k as u64) << 52;
        return f64::from_bits(bits);
    }
    if k <= -54 {
        return 0.0_f64.copysign(x);
    }
    k += 54;
    let bits = (ix & 0x800FFFFFFFFFFFFF_u64) | (k as u64) << 52;
    f64::from_bits(bits) * TWO_PM54
}

sqrt

ã•ã¦ã€ã„ã‚ˆã„ã‚ˆæœ¬é¡Œã§ã™ã€‚$\roundcirc{\sqrt{x}}$ ã‚’æ±‚ã‚ã¾ã™ã€‚

ã¾ãš correct rounding ãªå®Ÿè£…ã®å…¸åž‹çš„ãªãƒ‘ã‚¿ãƒ¼ãƒ³ã¨ã—ã¦ã€æ¬¡ã®ã‚ˆã†ãªæµã‚ŒãŒã‚ã‚Šã¾ã™ã€‚

range reduction
- å…¥åŠ›ã‚’ä¸€èˆ¬ã®ã‚±ãƒ¼ã‚¹ã‹ã‚‰ç‰¹æ®Šãªã‚±ãƒ¼ã‚¹ã«å¸°ç€ã•ã›ã‚‹
approximation
- æ‰€æœ›ã®é–¢æ•°ã«å¿œã˜ãŸæ‰‹æ³•ã‚’ç”¨ã„ã€ç‰¹æ®Šãªã‚±ãƒ¼ã‚¹ã«ã¤ã„ã¦ã®ç”ãˆã‚’æ±‚ã‚ã‚‹
reconstruction
- 2. ã®çµæžœã‚’ç”¨ã„ã€å…ƒã€…ã®å…¥åŠ›ã«å¯¾ã™ã‚‹ç”ãˆã‚’æ±‚ã‚ã‚‹

ä»Šå›žã‚‚ãã‚Œã«å¾“ã£ã¦è¡Œã„ã¾ã™ã€‚è² ã®æ•°ã‚„ NaN ãªã©ã®ã‚±ãƒ¼ã‚¹ã«ã¤ã„ã¦ã¯äºˆã‚å‡¦ç†ã—ã¦ãŠãã“ã¨ã«ã—ã¾ã™ã€‚ ã¾ãŸã€$\sqrt{0_{\pm}\vphantom{0^0}} = 0_{\pm}$ï¼ˆè¤‡å·åŒé †ï¼‰ã¨å®šç¾©ã•ã‚Œã¦ã„ã‚‹ã®ã§ã€ãã‚Œã‚‚å…ˆã«å‡¦ç†ã—ã¦ãŠãã¾ã™ã€‚

range reduction

$\sqrt{2^{2 x_e}\cdot x_m} = 2^{x_e}\cdot\sqrt{x_m\vphantom{2^2}}$ ã§ã‚ã‚‹ã“ã¨ã‹ã‚‰ã€$x_m\in[1\lldot 4)$ ã®ã‚±ãƒ¼ã‚¹ã«ã¤ã„ã¦è€ƒãˆã¾ã™ã€‚ $\texttt{frexp}(x) = (x_m', x_e')$ ã«å¯¾ã—ã¦ä¸‹è¨˜ã‚’è¡Œã†ã“ã¨ã§å¸°ç€ã§ãã¾ã™ã€‚ $$ (x_m, x_e) = \begin{cases} (4x_m', x_e'-2), & \text{if }x_e' \equiv 0\pmod 2; \\ (2x_m', x_e'-1), & \text{if }x_e' \equiv 1\pmod 2. \end{cases} $$

approximation

æœ€åˆã«ã€$y\in[1\lldot 2)$ ã§ã‚ã£ã¦ã€$y\le \sqrt{x_m\vphantom{2^2}}\lt y+2^{-52}$ ã¨ãªã‚‹ã‚‚ã®ã‚’æ±‚ã‚ã¾ã™ã€‚ ã“ã‚Œã¯ã€äºŒåˆ†æŽ¢ç´¢ã®è¦é ˜ã§ã€ä»¥ä¸‹ã®æ‰‹ç¶šãã«ã‚ˆã£ã¦å¯èƒ½ã§ã™ã€‚

å…¥åŠ›: $x_m\in[1\lldot 4)$
$y \gets 1$ ã§åˆæœŸåŒ–ã™ã‚‹ã€‚
$\Delta y \gets 0.5$ ã§åˆæœŸåŒ–ã™ã‚‹ã€‚
å„ $i \gets \angled{1, 2, \dots, 52}$ ã«ã¤ã„ã¦ä¸‹è¨˜ã‚’è¡Œã†ã€‚
- $\roundcirc{(y\oplus\Delta y)\times(y\oplus\Delta y)+(-x_m)}\le 0$ ã§ã‚ã‚Œã°ä¸‹è¨˜ã‚’è¡Œã†ã€‚
  - $y\xgets{\oplus}\Delta y$ ã§æ›´æ–°ã™ã‚‹ã€‚
- $\Delta y \xgets{\otimes} 0.5$ ã§æ›´æ–°ã™ã‚‹ã€‚
$y$ ã‚’å‡ºåŠ›ã™ã‚‹

note: å„ãƒ«ãƒ¼ãƒ—ã®å…ˆé ã«ãŠã„ã¦ã€$\Delta y = 0.5^i$ ãŒæˆã‚Šç«‹ã¡ã¾ã™ã€‚

Claim 1: ä»»æ„ã®æµ®å‹•å°æ•°ç‚¹æ•° $x\in[1\lldot 2)$, $y\in[1\lldot 2]$, $z\in[1\lldot 4)$ ã«å¯¾ã—ã€$$x\times y\le z \iff \roundcirc{x\times y+(-z)}\le 0$$ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

ä»»æ„ã®å®Ÿæ•° $w$ ã«å¯¾ã—ã€$\roundcirc{w}\le 0 \iff w\le 2^{-1075}$ ã§ã‚ã‚‹ã€‚ ã‚ˆã£ã¦ã€ $$ x\times y\le z \iff x\times y-z \le 2^{-1075} $$ ã‚’ç¤ºã™ã€‚

($\implies$): æ˜Žã‚‰ã‹ã€‚

($\impliedby$): å¯¾å¶ $x\times y\gt z \implies x\times y-z \gt 2^{-1075}$ ã‚’ç¤ºã™ã€‚

ã‚ã‚‹æ•´æ•° $m_x\in[2^{52}\lldot 2^{54})$, $m_y\in[2^{52}\lldot 2^{53}]$, $m_z\in[2^{52}\lldot 2^{54})$ ã‚’ç”¨ã„ã¦ $x = m_x\times 2^{-52}$, $y = m_y\times 2^{-52}$, $z = m_z\times 2^{-52}$ ã¨è¡¨ã›ã‚‹ã€‚ $$ \begin{aligned} x\times y - z &= (m_x\times 2^{-52})\times (m_y\times 2^{-52})-(m_z\times 2^{-52}) \\ &= (m_x\cdot m_y - m_z\cdot 2^{52})\times 2^{-104} \end{aligned} $$ ã‚ˆã‚Š $x\times y-z$ ã¯ $2^{-104}$ ã®å€æ•°ã§ã‚ã‚‹ã‹ã‚‰ã€ $$x\times y\gt z\implies x\times y-z\ge 2^{-104}\gt 2^{-1075}. \quad\qed$$

ã™ãªã‚ã¡ã€$\roundcirc{(y\oplus\Delta y)\times(y\oplus\Delta y)+(-x_m)}\le 0$ ã®éƒ¨åˆ†ã¯ $(y\oplus\Delta y)^2\le x_m$ ã¨åŒå€¤ã§ã™*7ã€‚ $y\oplus\Delta y = y+\Delta y\in[1\lldot 2)$ ã¯å¸¸ã«æˆã‚Šç«‹ã¡ã¾ã™ã€‚ ã¾ãŸã€$y$ ã‚„ $\Delta y$ ã®æ›´æ–°ã«éš›ã—ã¦ç”Ÿã˜ã‚‹èª¤å·®ã¯ $0$ ã§ã™ã€‚

æ¬¡ã«ã€ä¸¸ã‚ã®å¢ƒç•Œã«çœŸã®å€¤ãŒç¾ã‚Œã‚‹ã“ã¨ã¯ãªã„ã“ã¨ã‚’ç¤ºã—ã¾ã™ã€‚

Claim 2: ä»»æ„ã® $x_m$ ã«å¯¾ã—ã¦ $y+2^{-53} \ne \sqrt{x_m\vphantom{2^2}}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

èƒŒç†æ³•ã«ã‚ˆã‚‹ã€‚

ä¸Šè¨˜ã®æ‰‹ç¶šãã®çµæžœ $y+2^{-53} = \sqrt{x_m\vphantom{2^2}}$ ãªã‚‹ã‚ˆã†ãªæµ®å‹•å°æ•°ç‚¹æ•°ã®çµ„ $(x_m, y)$ ãŒå˜åœ¨ã—ãŸã¨ã™ã‚‹ã€‚ ã“ã®ã¨ãã€$x_m = (y+2^{-53})^2 = y^2+2^{-52}\cdot y+2^{-106}$ ã¨ãªã‚‹ã€‚

$y\in[1\lldot 2)$ ã‚ˆã‚Š $y$ ã¯ $2^{-52}$ ã®å€æ•°ã§ã‚ã‚Šã€ $$ y^2+2^{-52}\cdot y + 2^{-106} \equiv 2^{-106} \not\equiv 0 \pmod{2^{-104}} $$ ã¨ãªã‚‹ã€‚ä¸€æ–¹ã€$x_m\in[1\lldot 4)$ ã§ã‚ã£ãŸã‹ã‚‰ã€$x_m$ ã¯ $2^{-52}$ ã®å€æ•°ã§ã‚ã‚Šã€$x_m\equiv 0\pmod{2^{-104}}$ ã¨ãªã‚‹ã€‚$\qed$

ã‚ˆã£ã¦ã€$y+2^{-53}\lt \sqrt{x_m\vphantom{2^2}}$ ã§ã‚ã‚Œã° $y\oplus 2^{-52}$ ãŒã€ãã†ã§ãªã‘ã‚Œã° $y$ ãŒ approximation step ã®ç”ãˆã¨ãªã‚Šã¾ã™ã€‚

éžè² æ€§ã¯æ˜Žã‚‰ã‹ãªã®ã§ã€$(y+2^{-53})^2\lt x_m$ ã¨åŒå€¤ã§ã™*8ã€‚ ã™ãªã‚ã¡ã€$y^2+2^{-52}\cdot y+2^{-106}-x_m\lt 0$ ã‚’åˆ¤å®šã§ãã‚Œã°ã‚ˆã„ã§ã™ã€‚

Claim 3: ä»»æ„ã®æµ®å‹•å°æ•°ç‚¹æ•° $x\in[1\lldot 4)$ ãŠã‚ˆã³ $y\in[1\lldot 2)$ ã«å¯¾ã—ã€$$y^2+2^{-52}\cdot y-x\lt -2^{-106} \iff y^2+2^{-52}\cdot y-x\lt 0$$ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

($\implies$): æ˜Žã‚‰ã‹ã€‚

($\impliedby$): å¯¾å¶ $y^2+2^{-52}\cdot y-x\ge -2^{-106} \implies y^2+2^{-52}\cdot y-x\ge 0$ ã‚’ç¤ºã™ã€‚

ã‚ã‚‹æ•´æ•° $m_x\in[2^{52}\lldot 2^{54})$, $m_y\in[2^{52}\lldot 2^{53})$ ã‚’ç”¨ã„ã¦ $x = m_x\times 2^{-52}$, $y = m_y\times 2^{-52}$ ã¨è¡¨ã›ã‚‹ã€‚ $$ \begin{aligned} y^2+2^{-52}\cdot y-x &= (m_y\times 2^{-52})^2 + 2^{-52}\cdot(m_y\times 2^{-52}) - (m_x\times 2^{-52}) \\ &= (m_y^2+m_y-m_x\cdot 2^{52})\times 2^{-104} \end{aligned} $$ ã‚ˆã‚Š $y^2+2^{-52}\cdot y-x$ ã¯ $2^{-104}$ ã®å€æ•°ã§ã‚ã‚‹ã‹ã‚‰ã€ $$y^2+2^{-52}\cdot y-x\ge -2^{-106} \implies y^2+2^{-52}\cdot y-x\ge 0.\quad\qed$$

Claim 3 ã‚ˆã‚Š $y^2+2^{-52}\cdot y-x_m\lt 0$ ã‚’åˆ¤å®šã™ã‚Œã°ã‚ˆã„ã“ã¨ã«ãªã‚Šã¾ã—ãŸã€‚ ã™ãªã‚ã¡ã€$y\times(y+2^{-52})\lt x_m$ ã§ã™ã€‚ã“ã‚Œã¯ Claim 1 ã‹ã‚‰ FMA ã§è¨ˆç®—å¯èƒ½ã§ã™ã€‚

reconstruction

ã•ã¦ã€ã“ã“ã¾ã§ã§ $\roundcirc{\sqrt{x_m\vphantom{2^2}}} = y$ ãŒå¾—ã‚‰ã‚Œã¾ã—ãŸã€‚$\texttt{ldexp}(y, \tfrac{x_e}2)$ ãŒæœ€çµ‚çš„ãªç”ãˆã§ã™ã€‚

å®Ÿè£…

const TWO_PM52: f64 = 2.220446049250313080847263336181640625e-16;

fn sqrt(x: f64) -> f64 {
    if x < 0.0 {
        return f64::NAN;
    }
    if x == 0.0 || x.is_infinite() || x.is_nan() {
        return x;
    }

    let (x_m, x_e) = match frexp(x) {
        (m, e) if e % 2 == 0 => (4.0 * m, e - 2),
        (m, e) => (2.0 * m, e - 1),
    };
    assert_eq!(x_e % 2, 0);
    assert!(1.0 <= x_m && x_m < 4.0);

    let mut y = 1.0_f64;
    let mut dy = 0.5;
    for _ in 0..52 {
        if (y + dy).mul_add(y + dy, -x_m) <= 0.0 {
            y += dy;
        }
        dy *= 0.5;
    }

    if y.mul_add(y + TWO_PM52, -x_m) < 0.0 {
        y += TWO_PM52;
    }

    let y = ldexp(y, x_e / 2);
    assert_eq!(y, x.sqrt());
    y
}

æ¬¡å›žäºˆå‘Š

ã¨ã‚Šã‚ãˆãš $\roundcirc{\sqrt{x}}$ ãŒè¨ˆç®—å¯èƒ½ã§ã‚ã‚‹ã“ã¨ã¯ç¤ºã—ã¾ã—ãŸãŒã€ãƒ“ãƒƒãƒˆé•· $p$ ã«å¯¾ã—ã¦ $\Theta(p)$ æ™‚é–“ã¨ã„ã†ã®ã¯ã¡ã‚‡ã£ã¨ã... ã¨ã„ã†ã®ãŒæ£ç›´ãªã¨ã“ã‚ã§ã™ã€‚ ãŸã¨ãˆã° $\Theta(\log(p))$ æ™‚é–“ãã‚‰ã„ã«ãªã£ã¦ãã‚ŒãŸã‚‰ã†ã‚Œã—ã„ã§ã™ã‚ˆãã€‚

ã¨ã„ã†ã“ã¨ã§ä¸€æ—¦å®Ÿé¨“ã—ã¾ã—ãŸã€‚

ã¾ãš $3$ æ¬¡ãã‚‰ã„ã®é”æ³•ã®å¤šé …å¼ã§ã–ã£ãã‚Šè¿‘ä¼¼å€¤ï¼ˆèª¤å·® $10^{-4}$ ãã‚‰ã„ï¼‰ã‚’æ±‚ã‚ã¦ã€Newton æ³•ã§ $2$ å›žãã‚‰ã„åå¾©ã•ã›ã‚‹ã¨ã€1 ULP ãã‚‰ã„ã®èª¤å·®ã«åŽã¾ã£ã¦ãã‚Œãã†ï¼Ÿ 1 ULPï¼ˆã¨ã„ã†ã‹å®šæ•° ULPï¼‰ã«åŽã¾ã‚‹ã“ã¨ãŒç¤ºã›ã‚‹ã®ã§ã‚ã‚Œã°ã€ä»Šå›žã‚„ã£ãŸã‚ˆã†ã«ä¸ç‰å¼è©•ä¾¡ã—ã¦è£œæ£ã™ã‚Œã°ã„ã„ã§ã™ã‹ã‚‰ãã€‚

é”æ³•ã®å¤šé …å¼ã¯æ¬¡ã®ã‚ˆã†ãªæ„Ÿã˜ã§ã™ã€‚ $$ \begin{aligned} f_0(x) &= \left(\begin{matrix} \roundcirc{0.371351660146978} \\ \roundcirc{0.784942635287931} \\ \roundcirc{-0.180689144911217} \\ \roundcirc{0.0244769088312593} \end{matrix}\right)^{\top}\cdot\left(\begin{matrix} x^0 \\ x^1 \\ x^2 \\ x^3 \end{matrix}\right), \\ f_1(x) &= \left(\begin{matrix} \roundcirc{0.525170554189621} \\ \roundcirc{0.555038260254535} \\ \roundcirc{-0.0638832598267602} \\ \roundcirc{0.00432694705426709} \end{matrix}\right)^{\top}\cdot\left(\begin{matrix} x^0 \\ x^1 \\ x^2 \\ x^3 \end{matrix}\right). \\ \end{aligned} $$ $f_0$ ã¯ $[1\lldot 2)$ ç”¨ã€$f_1$ ã¯ $[2\lldot 4)$ ç”¨ã§ã™ã€‚ åå¾©ã¯ $y \xgets{\oplus} (x_m\oslash y)$ ã¨ $y\xgets{\otimes} 0.5$ ã§ã™ã€‚ ä¸‹è¨˜ã¯ $\sqrt{2}$ ã‚’æ±‚ã‚ã‚ˆã†ã¨ã—ã¦ã„ã‚‹ã¨ã“ã‚ã®ã‚¤ãƒ¡ãƒ¼ã‚¸ã§ã™ã€‚

fn main() {
    let poly = |x: f64| {
        let mut y = 0.00432694705426709_f64;
        y = y.mul_add(x, -0.0638832598267602);
        y = y.mul_add(x, 0.555038260254535);
        y.mul_add(x, 0.525170554189621)
    };
    let iter = |x: f64, y: f64| (y + x / y) * 0.5;
    
    let x = 2.0;
    let y = poly(x);    // 0x1.6A1181648E5E8p0, 1.4143296118257869
    let y = iter(x, y); // 0x1.6A09E67C6699Fp0, 1.414213567134176
    let y = iter(x, y); // 0x1.6A09E667F3BCCp0, 1.414213562373095
    let y = iter(x, y); // 0x1.6A09E667F3BCCp0, 1.414213562373095
}

åˆæœŸå€¤ã‚’é”æ³•ã§æ±ºã‚ãšã« $1$ ã¨ã‹ã‹ã‚‰å§‹ã‚ã¦ã‚‚ $6$ å›žç¨‹åº¦ã§åŽæŸã—ã¦ãã‚Œã¦ã„ãã†ã§ã—ãŸã€‚

disclaimer: ãˆã³ã¡ã‚ƒã‚“ã¯æ°—åˆ†å±‹ã•ã‚“ãªã®ã§ã€ã“ã®é€šã‚Šã«é€²ã¾ãªã„ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

ã¨ã‚Šã‚ãˆãš hypot, cbrt, log, exp, sin, cos ã‚ãŸã‚Šã‚’ã‚„ã‚‹ã¾ã§ã«é£½ããªã„ã¨ã„ã„ã§ã™ãã€‚é †ç•ªã¯æœªå®šã§ã™ã€‚

ãŠã¾ã‘

äºŒåˆ†æŽ¢ç´¢ã™ã‚‹ã®ã§ã‚ã‚Œã°ã€f64 ã‚’ä½¿ã‚ãªã„æ–¹æ³•ã‚‚ã‚ã£ã¦ã€ãŸã¨ãˆã° u128 ãªã©ã‚’ä½¿ã„ãªãŒã‚‰æ•´æ•°ã¨ã—ã¦äºŒåˆ†æŽ¢ç´¢ã—ã¦ã‚‚ã‚ˆã„ã§ã™ã‚ˆãã€‚

æ•´æ•° $m_x\in[2^{52}\lldot 2^{54})$, $m_y\in[2^{52}\lldot 2^{53})$ ã§ã‚ã£ã¦ $$ (m_y-\tfrac12)\times 2^{-52} \lt \sqrt{m_x\times 2^{-52}} $$ ãªã‚‹ $y$ã€ã™ãªã‚ã¡ $$ \begin{aligned} m_y-\tfrac12 &\lt 2^{52-26}\cdot\sqrt{m_x\mathstrut} \\ \Floor{(2m_y-1)^2\times 2^{-54}} &\lt m_x \end{aligned} $$ ã‚’æº€ãŸã™ã‚ˆã†ãª $m_y$ ã®æœ€å¤§å€¤ã‚’æ±‚ã‚ã‚Œã°ã‚ˆã„ã§ã™ã€‚

fn sqrt(x: f64) -> f64 {
    // ... Same as the preceding one.
    assert_eq!(x_e % 2, 0);
    assert!(1.0 <= x_m && x_m < 4.0);

    let m_x = {
        let mant = (1 << 52 | x_m.to_bits() & !(!0 << 52)) as u128;
        if x_m >= 2.0 { 2 * mant } else { mant }
    };
    let m_y = {
        let mut lo = 1_u128 << 52;
        let mut hi = 2 * lo;
        while hi - lo > 1 {
            let mid = lo + (hi - lo) / 2;
            let too_lo = (2 * mid - 1) * (2 * mid - 1) >> 54 < m_x;
            *(if too_lo { &mut lo } else { &mut hi }) = mid;
        }
        lo as u64
    };
    let y = f64::from_bits(0x3FF << 52 | (m_y & !(!0 << 52)));
    ldexp(y, x_e / 2)
}

ã¾ãŸã€ä¸‹è¨˜ã®è¨˜äº‹ã® Corollary 10 ã¨ u128::isqrt ã‚’ç”¨ã„ã‚‹ã“ã¨ã§ã€ã‚‚ã£ã¨ç°¡å˜ã«æ±‚ã‚ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

rsk0315.hatenablog.com

fn sqrt(x: f64) -> f64 {
    // ... Same as the preceding one.

    let m_x_p52 = m_x << 52;
    let m_y = m_x_p52.isqrt();
    let m_y = (if m_y * (m_y + 1) < m_x_p52 { m_y + 1 } else { m_y }) as u64;

    let y = f64::from_bits(0x3FF << 52 | (m_y & !(!0 << 52)));
    ldexp(y, x_e / 2)
}

ã“ã†ã—ã¦ã€u128 ã§ $\floor{\sqrt{x_m\mathstrut}\times 2^{104}}$ ã‚’æ±‚ã‚ã‚‹ã“ã¨ãŒã§ãã‚Œã°ã€ãã‚Œã‚’ä½¿ã£ãŸå®šæ•°å›žã®æ¼”ç®—ã§ f64 ã§ã® $\roundcirc{\sqrt{x_m\mathstrut}}$ ã‚‚æ±‚ã‚ã‚‰ã‚Œã‚‹ã“ã¨ãŒã‚ã‹ã£ã¦ã—ã¾ã„ã¾ã—ãŸã€‚ Rust ã® isqrt ã§ã¯ã€Karatsuba square root algorithm ã‚’ç”¨ã„ã¦ã„ã‚‹ã‚ˆã† ([src]) ã§ã™ã€‚ç«¶ãƒ—ãƒ er ã«ã¯ã‚ã¾ã‚Šé¦´æŸ“ã¿ã®ãªã„ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ãªã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹*9ã€‚

æ‰€æ„Ÿ

ã†ã€œã€œã‚€ã€çµå±€ã€Œæ•´æ•°åž‹ã§ãªã‚“ã¨ã‹ãªã‚‹ã˜ã‚ƒã‚“ã€ã¨ã„ã†ä¾‹ãŒå‡ºã¦ã—ã¾ã„ã€ã€Œã“ã‚Œã§ã‚ˆã‹ã£ãŸã®ã‹...ï¼Ÿã€ã¨ã„ã†æ°—æŒã¡ã§ã™ã€‚ ã‚‚ã¡ã‚ã‚“ã€ã“ã‚“ãªã®ã¯ãŠãã‚‰ãsqrt ã®ã‚ˆã†ãªç°¡å˜ãª algebraic ãªé–¢æ•°ã ã‹ã‚‰ã§ãã‚‹ã“ã¨ã§ã€ä»Šå¾Œã® transcendental ãªé–¢æ•°ã§ã¯ã“ã†ã¯ã„ã‹ãªã„ã¨æ€ã£ã¦ã„ã¾ã™ã€‚ æ¬¡å›žã¯ã€ãã‚Œã«å‚™ãˆã¦è«¸ã€…ã®å…¸åž‹ãƒ†ã‚¯ã‚’å°Žå…¥ã™ã‚‹ã¯ãšã§ã™ã€‚

ãŠã‚ã‚Š

ãŠã‚ã‚Šã§ã™ã€‚

*1:ãŠãã‚‰ã round-to-the-nearest ã‹ã‚‰ $\mathrm{RN}(f(x) )$ ã¨æ›¸ã„ã¦ã„ã‚‹æ–‡çŒ®ã‚‚ã‚ã‚Šã¾ã™ã€‚ã¾ãŸã€ä»»æ„ã®ä¸¸ã‚ãƒ¢ãƒ¼ãƒ‰ã‚’è€ƒãˆã‚‹ã¨ãã¯ $\operatorname{\diamond}{(f(x) )}$ ã¨æ›¸ã‹ã‚Œã‚‹ã“ã¨ãŒå¤šãã†ã§ã—ãŸã€‚

*2:$\sqrt2$ ã‚’æ£ç¢ºã«è¡¨ã›ãªã„ã“ã¨è‡ªä½“ã«ã¯ç‰¹ã«é–¢å¿ƒãŒãªãã€$\roundcirc{\sqrt2}$ ã‚’æ±‚ã‚ã‚‹ã“ã¨ã«èˆˆå‘³ãŒã‚ã‚Šã¾ã™ã€‚

*3:$-\infty$ æ–¹å‘ä¸¸ã‚ã®æ–¹ãŒã‚„ã‚Šã‚„ã™ã„ãŒ...

*4:$\roundcirc{\bullet}$ ã® $\circ$ ã¯ä¸¸ã‚ã®é–¢æ•°ã§ã€$\bullet$ ã¯ï¼ˆ$\sqrt{\bullet\mathstrut}$ ã®ã‚ˆã†ã«ä½¿ã†ï¼‰ãƒ—ãƒ¬ãƒ¼ã‚¹ãƒ›ãƒ«ãƒ€ã§ã™ã€‚å½¢ãŒä¼¼ã¦ã„ã¦ã‚ã‹ã‚Šã«ãã„ã§ã™ãã€‚

*5:glibc ã®å®Ÿè£…ãŒè¦æ ¼ã«åã—ã¦ã„ã‚‹ã‚ˆã†ãªæ°—ãŒã—ã¤ã¤ã€ã‚ã¾ã‚Šè‡ªä¿¡ãŒãªã„ã§ã™ãã€‚

*6:$2^{52}\cdot x$ ã§ã„ã„æ°—ãŒã™ã‚‹ã®ã§ã™ãŒã€æ„å›³ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã€‚

*7:$x^2$ ã¯é€šå¸¸ã® $x\times x$ ã®ã“ã¨ã§ã‚ã‚Šã€$x\otimes x$ ã®ã“ã¨ã§ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚

*8:$y\oplus 2^{-53} \ne y+2^{-53}$ ãªã®ã§ã€ã“ã®æ™‚ç‚¹ã§ã¯ Claim 1 ã¯ä½¿ãˆã¾ã›ã‚“ã€‚

*9:äºŒåˆ†æŽ¢ç´¢ã§æ¸ˆã‚€ãªã‚‰ä»–ã®ã“ã¨ã‚’å¦ã¶ç†ç”±ãŒãªã„ã¨æ€ã£ã¦ã„ã‚‹äººã€…ãŒå¤šæ•°æ´¾ã ã‹ã‚‰ï¼ˆåè¦‹ï¼‰ã€‚

2025-03-20

æµ®å‹•å°æ•°ç‚¹åž‹ã«é–¢ã™ã‚‹ãƒã‚¨ãƒ 20250320

ãˆã³ã¡ã‚ƒã‚“ã§ã™ã€‚ãŠæ°—æŒã¡è¡¨æ˜Žè¨˜äº‹ã§ã™ã€‚æœ€è¿‘ã€ŒãŠæ°—æŒã¡è¡¨æ˜Žã€ã¨ã„ã†ãƒ•ãƒ¬ãƒ¼ã‚ºã‚’ã‚ã¾ã‚Šèžã‹ãªããªã£ãŸæ°—ãŒã—ã¾ã™ãã€‚

å„ç« ã¯ãã‚Œãžã‚ŒåŸºæœ¬çš„ã«ç‹¬ç«‹ã§ã™ã€‚ç‰¹ã«çµè«–ã‚ã„ãŸã‚‚ã®ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚

å‡ºä¼šã„

ãˆã³ã¡ã‚ƒã‚“ãŒç«¶ãƒ—ãƒã‚’å§‹ã‚ãŸã®ã¯ 2016 å¹´é ƒã§ã€ãã‚Œä»¥æ¥ãªã‚“ã‚„ã‹ã‚“ã‚„ã§æµ®å‹•å°æ•°ç‚¹åž‹ã«ã¯ã€Œãƒ–ãƒ©ãƒƒã‚¯ãƒœãƒƒã‚¯ã‚¹ã€æ„Ÿã‚’æŠ±ã„ã¦ã„ãŸè¨˜æ†¶ãŒã‚ã‚Šã¾ã™ã€‚ ç«¶ãƒ—ãƒç•Œéšˆã¯åˆ¥ã«æµ®å‹•å°æ•°ç‚¹åž‹ã«è©³ã—ã„ç•Œéšˆã§ã¯ãªã„ã®ã§ã€ï¼ˆ#define EPS 1e-6 ãªã©ã«ä»£è¡¨ã•ã‚Œã‚‹ã‚ˆã†ãªï¼‰æ€ªã—ã„æ°‘é–“ç™‚æ³•ã®ã‚ˆã†ãªã‚‚ã®ãŒå½“æ™‚ã‹ã‚‰ä¿¡ä»°ã•ã‚Œã¦ã„ã¾ã—ãŸã€‚

ã€Œã§ãã‚‹é™ã‚Šæ•´æ•°åž‹ã§å‡¦ç†ã§ãã‚‹ã‚ˆã†ã«å¼å¤‰å½¢ãƒ»è€ƒå¯Ÿã—ã¾ã—ã‚‡ã†ã€ã¨ã„ã†å®šçŸ³ã¯å…¨ãæ£ã—ã„ã¨æ€ã£ã¦ã„ã¾ã™ãŒã€æµ®å‹•å°æ•°ç‚¹åž‹ã¸ã®å¿Œé¿æ„è˜ã®ã‚ˆã†ãªã‚‚ã®ã¯å¼·ã¾ã‚‹ã°ã‹ã‚Šã§ã™ã€‚ ãã†ã—ã¦é¿ã‘ãŸã¾ã¾ã€ã„ã–é¿ã‘ã‚‰ã‚Œãªããªã£ãŸã¨ãã«ã€ŒåŸºç¤ŽãŒèº«ã«ã¤ã„ã¦ã„ãªã„ãŸã‚ã€å…¸åž‹çš„ãªãƒŸã‚¹ã‚’ã™ã‚‹ã€ã¨ã„ã†ã®ãŒã‚ã‚ŠãŒã¡ãªãƒ‘ã‚¿ãƒ¼ãƒ³ãªæ°—ãŒã—ã¾ã™ã€‚

ä¸€ç”Ÿãã†ã—ãŸæ„Ÿè¦šã§ç”Ÿãç¶šã‘ã‚‹ã“ã¨ã«è€ãˆã‚‰ã‚Œãªããªã£ãŸãŸã‚ã€2023 å¹´é ƒã«ã¡ã‚ƒã‚“ã¨å‹‰å¼·ã‚’å§‹ã‚ã¾ã—ãŸã€‚ ã‚‚ã£ã¨ã‚‚ã€æµ®å‹•å°æ•°ç‚¹åž‹ã«é™ã‚‰ãšã€ãã†ã—ãŸãƒ–ãƒ©ãƒƒã‚¯ãƒœãƒƒã‚¯ã‚¹ã‚ã„ãŸã‚‚ã®ã®å†…éƒ¨ã‚’çŸ¥ã‚ŠãŸã„ãŒã¡ãªæ€§æ ¼ã§ã¯ã‚ã£ãŸã®ã§ã€ã‚ˆã†ã‚„ãã‹ã¨ã„ã†æ„Ÿã˜ã§ã¯ã‚ã£ãŸã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

æ•´æ•°åž‹ã¨ã®å¯¾æ¯”

ã“ã‚Œã¯ã±ã£ã¨æ€ã„ã¤ã„ãŸä¾‹ã§ã™ãŒã€JPEG ã¯ã€Œã‚ˆãã‚ã‹ã‚‰ã‚“ãŒãã¡ã‚ƒãã¡ã‚ƒã«ãªã£ã¡ã‚ƒã†ã‚‚ã®ã€ã¨ã„ã†å°è±¡ãŒã‚ã‚Šã€PNG ã¯ã€Œãã‚Œã„ãªã‚‚ã®ã€ã¨ã„ã†å°è±¡ãŒã‚ã‚Šã¾ã™ã‚ˆãã€‚æµ®å‹•å°æ•°ç‚¹åž‹ã¨æ•´æ•°åž‹ã®å¯¾æ¯”ã‚‚ãã‚Œã¨ä¼¼ã¦ã„ã‚‹æ°—ãŒã—ã¾ã™ã€‚

æ•´æ•°åž‹ã¯ãã£ã¡ã‚Šã¨ã—ãŸè¨ˆç®—ã‚’è¡Œã†ã“ã¨ãŒã§ãã‚‹ã‚‚ã®ã§ã€ãŸã¨ãˆã° 0x29AEDBEFB219581E18E1217B2715654F ã‚’ 0x89FC309DF824DC7C ã§å‰²ã£ãŸã‚ã¾ã‚Š (%) ãªã©ã‚‚ã‚„ã‚ã†ã¨æ€ãˆã°æ‰‹è¨ˆç®—ã§æ¨¡å€£ã™ã‚‹ã“ã¨ãŒã§ãã‚‹ã¨æ€ã‚ã‚Œã¦ã„ãã†ã§ã™ã€‚ãŸã„ã¸ã‚“é¢å€’ãªã®ã§ã‚„ã‚ŠãŸãŒã‚‹äººã¯ã„ãªã„ã¨æ€ã„ã¾ã™ãŒã€ã‚„ã‚Šæ–¹è‡ªä½“ãŒã‚ã‹ã‚‰ãªã„ã¨ã„ã†ã“ã¨ã¯ãªã„ã¨æ€ã„ã¾ã™ã€‚ä»®ã«ãŠé‡‘ãŒã‚‚ã‚‰ãˆã‚‹ãªã‚‰ã‚„ã‚Šã¾ã™ã‚ˆãã€‚

ä¸€æ–¹ã§ã€æµ®å‹•å°æ•°ç‚¹åž‹ã«ãŠã„ã¦ã¯ã€ã€Œã‚³ãƒ³ãƒ”ãƒ¥ãƒ¼ã‚¿ã®ãŠæ°—æŒã¡æ¬¡ç¬¬ã§èª¤å·®ãŒå‡ºã‚‹ã‚ˆã†ãªäºˆæ¸¬ä¸èƒ½ãªå¤‰ãªã‚‚ã®ã€ã¨æ€ã£ã¦ã„ã‚‹äººãŒãã‚Œãªã‚Šã«ã„ã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚ ãŸã¨ãˆã° 0x1.26ECE273B8E6Ap-11 ã¨ 0x1.EC8689D97BFB8p+3 ã®ç© (*) ã‚’æ‰‹è¨ˆç®—ã§æ¨¡å€£ã™ã‚‹ã“ã¨ã¯ã§ãã¾ã™ã‹ï¼Ÿ

ã“ã®ã¸ã‚“ã¯äººã«ã‚ˆã‚‹ã‹ã‚‚ã§ã€ã€Œã‚ãã¾ã§ float -> float -> float ã®ã‚ˆã†ãªé–¢æ•°ã®æŒ™å‹•ãŒå®Ÿè³ªçš„ã«ã¯äºˆæ¸¬ä¸èƒ½ãªã ã‘ã§ã€å€¤ã‚’å›ºå®šã™ã‚Œã°æ‰‹è¨ˆç®—ï¼ˆã‚ã‚‹ã„ã¯æ•´æ•°åž‹ã®æ¼”ç®—ã«å¸°ç€ã•ã›ã‚‹ãªã©ã—ã¦ï¼‰ã§ã‚‚æ¨¡å€£å¯èƒ½ã€ãã‚‰ã„ã«æ€ã£ã¦ã„ã‚‹äººã‚‚å¤šã„ã®ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ï¼Ÿ å¤šãã®äººãŒã©ã†æ€ã£ã¦ã„ã‚‹ã®ã‹ã‚‚ã†ã‚ã‹ã‚Šã¾ã›ã‚“ã€‚

ã¨ã¯ã„ãˆã€æ•´æ•°åž‹ã§ã®æ¼”ç®—ã§ã‚‚ãƒ–ãƒ©ãƒƒã‚¯ãƒœãƒƒã‚¯ã‚¹ãªã‚‚ã®ã¯ã„ãã‚‰ã§ã‚‚ã‚ã£ã¦ã€ãã†ã—ãŸã‚‚ã®ã«ã¤ã„ã¦ã¯ã€Œã»ã‚“ã¨ã«ã©ã‚“ãªã¨ãã§ã‚‚ã“ã‚ã‚Œãªã„ã®ï¼Ÿã€ã¨ã„ã†æ°—æŒã¡ã¯ç”Ÿã˜ãã†ãªã®ã§ã€æµ®å‹•å°æ•°ç‚¹åž‹ã°ã‹ã‚ŠãŒé™¤ã‘è€…ã¨ã„ã†ã‚ã‘ã§ã¯ãªã„ã®ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚AtCoder Library ã® math ã«ã‚ã‚‹ã‚ˆã†ãªã‚‚ã®ãŸã¡ã‚’æƒ³åƒã—ã¦è©±ã—ã¦ã„ã¾ã™ã€‚

rsk0315.hatenablog.com

å›ºå®šå°æ•°ç‚¹åž‹ã‚„åé€²æµ®å‹•å°æ•°ç‚¹åž‹ãªã©

æµ®å‹•å°æ•°ç‚¹åž‹ã¯ã‚«ã‚¹ã ãŒå›ºå®šå°æ•°ç‚¹åž‹ã¯ã‚«ã‚¹ã§ã¯ãªã„ã¨ã‹ã€æµ®å‹•å°æ•°ç‚¹åž‹ã® NaN ã¯ã‚«ã‚¹ã ã¨ã‹ã€ã‚ã‚Œã“ã‚Œç†ç”±ã‚’ã¤ã‘ã¦ï¼ˆäºŒé€²ï¼‰æµ®å‹•å°æ•°ç‚¹åž‹ã‚’è²¶ã‚ã‚ˆã†ã¨ã™ã‚‹è¨€èª¬ã¯ã—ã°ã—ã°è¦‹ã‹ã‘ã¾ã™ã€‚

ä¸‹è¨˜ãªã©ãŒå‚è€ƒã«ãªã‚Šã¾ã™ã€‚

qiita.com

æµ®å‹•å°æ•°ç‚¹åž‹ã¯ãã‚“ãªã«ç›®ã®æ•µã«ã•ã‚Œã‚‹ã¹ãç™ºæ˜Žã§ã™ã‹ï¼Ÿ ã‚€ã—ã‚æ¦‚å¿µè‡ªä½“ã¯ç›´æ„Ÿçš„ã¾ã§ã‚ã‚‹ã‚ˆã†ãªæ°—ãŒã—ã¾ã™ã€‚ æ‰¹åˆ¤ã®è¦æ—¨ãŒã€Œç›´æ„Ÿçš„ãƒ»ç´ æœ´ã™ãŽã¦ã€ã‚‚ã£ã¨æ´—ç·´ã•ã‚Œã‚‹ã¹ãã ã€ã®ã‚ˆã†ãªæ„Ÿã˜ãªã‚‰ç´å¾—ã—ãªãã‚‚ãªã„ã§ã™ãŒã€ã‚‚ã£ã¨ç´ æœ´ã§æ‰±ã„ã«ãã„ã‚‚ã®ãŒä»£æ›¿æ¡ˆã¨ã—ã¦å‡ºã•ã‚ŒãŒã¡ãªã®ã§å¾®å¦™ãªæ°—æŒã¡ã«ãªã‚Šã¾ã™ã€‚

å¤šå€é•·æ•´æ•°ãŒå®šæ•°æ™‚é–“ã§è¨ˆç®—ã§ãã‚‹ã¨æ€ã£ã¦ä½¿ã£ã¦ã„ãã†ãªäººã€…ã‚‚ã„ã¾ã™ã—ã€è‡ªåˆ†ã®é–¢å¿ƒã®ãªã„éƒ¨åˆ†ã¯ã€Œå…¨éƒ¨å‹æ‰‹ã«ã†ã¾ãã„ã£ã¦ãã‚Œã‚‹ã€ã¨ï¼ˆç„¡æ„è˜ã«ï¼Ÿï¼‰æ€ã£ã¦ä»£æ›¿æ¡ˆã‚’å‡ºã—ã¦ã„ã‚‹ã‚“ã ã‚ã†ã¨æ€ã†ã¨ã€ç†è§£ã¯ã§ãã¾ã™ã€‚

èª¤å·®

ã‚ˆãã‚ã‚‹ 0.1 + 0.2 != 0.3 ã®ã‚ˆã†ãªè©±é¡Œã¯ã‚‚ã†è¦‹é£½ãã¾ã—ãŸãŒã€ã€Œã€Œ$0.1$ ã‚’æµ®å‹•å°æ•°ç‚¹åž‹ã§è¡¨ã›ã‚‹ã‚ˆã†ã«ä¸¸ã‚ãŸã‚„ã¤ã€ã¨ã€Œ$0.2$ ã‚’æµ®å‹•å°æ•°ç‚¹åž‹ã§è¡¨ã›ã‚‹ã‚ˆã†ã«ä¸¸ã‚ãŸã‚„ã¤ã€ã®å’Œã‚’æµ®å‹•å°æ•°ç‚¹åž‹ã§è¡¨ã›ã‚‹ã‚ˆã†ã«ä¸¸ã‚ãŸã‚„ã¤ã€ãŒã€Œ$0.3$ ã‚’æµ®å‹•å°æ•°ç‚¹åž‹ã§è¡¨ã›ã‚‹ã‚ˆã†ã«ä¸¸ã‚ãŸã‚„ã¤ã€ã¨ç•°ãªã‚‹ã¨ã„ã†äº‹å®Ÿè‡ªä½“ã¯ã€åˆ¥ã«ãã“ã¾ã§é©šãã¹ãã“ã¨ã§ã‚‚ãªã„ã®ã§ã¯ãªã„ã‹ï¼Ÿã¨ã„ã†æ°—æŒã¡ã¯ã‚ã‚Šã¾ã™ã€‚

ãã‚‚ãã‚‚ï¼ˆã‚ªãƒšãƒ©ãƒ³ãƒ‰è‡ªä½“ã®ä¸¸ã‚ã‚‚ãã†ã§ã™ãŒï¼‰+ è‡ªä½“ãŒå˜ãªã‚‹ $+$ ã¨ã¯ç•°ãªã‚‹ã‚‚ã®ãªã®ã§ã€ã€Œæµ®å‹•å°æ•°ç‚¹åž‹ã§ã¯ $0.1 + 0.2 = 0.3$ ã¯æˆã‚Šç«‹ãŸãªã„ã€ã®ã‚ˆã†ãªè¨€ã„æ–¹ã¯ã¡ã‚‡ã£ã¨ã†ã‚Œã—ããªã„ãªãã¨æ€ã£ã¦ã—ã¾ã„ã¾ã™ã€‚

ã‚ˆãã‚ã‚‹ REPL ãªã©ã§ã€Œ$0.1$ ã‚’æµ®å‹•å°æ•°ç‚¹åž‹ã§è¡¨ã›ã‚‹ã‚ˆã†ã«ä¸¸ã‚ãŸã‚„ã¤ã€ãŒã€Œ0.1ã€ã¨è¡¨ç¤ºã•ã‚Œã‚‹ã“ã¨ã¯éžå¸¸ã« confusing ã§ã€å¤‰ãªèª¤è§£ã‚’ç”Ÿã‚€è¦å› ã®ä¸€ã¤ãªã‚“ã˜ã‚ƒãªã„ã‹ãªãã¨ã„ã†æ€ã„ã¯ã‚ã‚Šã¾ã™ã€‚ä¸‹è¨˜ã¿ãŸã„ãªã®ãŒäººé¡žã«ã¨ã£ã¦å¹¸ç¦ã‹ã¨è¨€ã‚ã‚Œã‚‹ã¨ã€ãã‚Œã¯ãã‚Œã§æ‚©ã‚€ã¨ã“ã‚ã§ã¯ã‚ã‚Šã¾ã™ã€‚

>>> 0.1
0.1000000000000000055511151231257827021181583404541015625

ã“ã‚Œã ã¨çµå±€ã¯ã€Œã‚ã‘ã®ã‚ã‹ã‚‰ãªã„ãã¡ã‚ƒãã¡ã‚ƒãªå€¤ã‚’ $0.1$ ã«è¶³ã—ãŸã‚‚ã®ã€ã ã¨èªè˜ã™ã‚‹ã—ã‹ãªãã€ã€Œæµ®å‹•å°æ•°ç‚¹åž‹ã¯å¤‰ãªã‚„ã¤ã€ã¨ã—ã¦é¿ã‘ã‚‰ã‚Œãã†ãªæ°—ãŒã—ã¾ã™ã€‚ åˆå¿ƒè€…ã«ã€Œå®Ÿæ•°ã‚’æ¨¡å€£ã§ãã‚‹ã‚„ã¤ã€ã ã¨èª¤è§£ã•ã‚Œã¦ä¹±ç”¨ã•ã‚Œã‚‹ã‚ˆã‚Šã¯ãƒžã‚·ãªã®ã‹ã‚‚ã—ã‚Œãªã„æ°—ã‚‚ã—ã¾ã™ã€‚

ãˆã³ã¡ã‚ƒã‚“ã¯ã€ä¸Šè¨˜ã®å€¤ãŒ $\tfrac1{10}(1+2^{-54})$ ã¨æ£ç¢ºã«ç‰ã—ã„å€¤ã ã¨çŸ¥ã£ã¦ã‹ã‚‰ã€ãã‚Œã ã‘ã§ãŠå‹ã ã¡åº¦ãŒå°‘ã—å¢—ã—ãŸã‚ˆã†ãªæ°—æŒã¡ã«ãªã‚Šã¾ã—ãŸã€‚

æ¯”è¼ƒ

ã‚ˆãè¨€ã‚ã‚Œã¦ã„ã‚‹ã€Œã‚»ã‚ªãƒªãƒ¼ã€ã®ä¸€ã¤ã«ã€æµ®å‹•å°æ•°ç‚¹åž‹ã®æ¯”è¼ƒã¯ x == y ã§è¡Œã†ã®ã§ã¯ãªãã€1e-15 ãªã©ã®ååˆ†å°ã•ã„å€¤ã‚’ä½¿ã£ã¦ (x - y).abs() < 1e-15 ã®ã‚ˆã†ã«ã—ã¦è¡Œã„ã¾ã—ã‚‡ã†ã¨ã„ã†ã‚‚ã®ãŒã‚ã‚Šã¾ã™ã€‚

ã‚„ã£ã±ã‚Šã“ã‚Œã¯ã©ã†ã«ã‚‚æ€ªã—ã„ã¨ã„ã†æ„Ÿæƒ³ã«ãªã£ã¦ã—ã¾ã„ã¾ã™ã€‚1e-15 ã®ã‚ˆã†ãªå€¤ãŒé©åˆ‡ã§ã‚ã‚‹ã¨ã„ã†ã“ã¨ã¯ã©ã†ã‚„ã£ã¦è¨¼æ˜Žã—ãŸã®ã§ã™ã‹ï¼Ÿã¨ã„ã†è©±ã§ã™ã€‚ ãã‚ŒãŒã€Œãªã‚“ã¨ãªãã€ãªã®ã§ã‚ã‚Œã°ã€æ€ªã—ã„ã®ã¯æµ®å‹•å°æ•°ç‚¹åž‹ã§ã¯ãªãå®Ÿè£…è€…ã§ã™*1ã€‚

ã“ã®å°ã•ã„å€¤ã®æ±ºã‚æ–¹ï¼ˆã‚ã‚‹ã„ã¯ã“ã†ã—ãŸæ¯”è¼ƒã®ä»•æ–¹ãŒå¯èƒ½ã‹ã©ã†ã‹è‡ªä½“ã‚‚ï¼‰ã¯çŠ¶æ³æ¬¡ç¬¬ã§ã‚ã‚Šã€éƒ½åº¦è¨¼æ˜Žã™ã‚‹å¿…è¦ãŒã‚ã‚‹*2ã‚‚ã®ã§ã™ã€‚ ãã‚‚ãã‚‚ä¸€èˆ¬ã«ã€ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®æ£å½“æ€§ã¨ã„ã†ã‚‚ã®ã«èˆˆå‘³ãŒãªã„äººã‚‚ã‚‚ã—ã‹ã—ã¦å¤šã„ã§ã™ã‹ï¼Ÿ å›°ã£ãŸã‚‚ã®ã§ã™ãã€‚

ä»®æ•°éƒ¨ã®ãƒ“ãƒƒãƒˆé•·ãªã©ã®æ„å‘³ã§ã®ç²¾åº¦ (precision) ã¨ã€ãã®åž‹ã‚’ç”¨ã„ã¦ä½•ã‚‰ã‹ã®å¼ã‚’è¨ˆç®—ã—ãŸéš›ã®ç²¾åº¦ (accuracy) ã‚’åŒºåˆ¥ã›ãšã«èªè˜ã—ã¦ã„ã¦ã€ã€Œprecision ãŒ 53 bits ã§ã‚ã‚Œã°ã€ï¼ˆã‚ã‚‹ç¨‹åº¦è¤‡é›‘ãªå¼ã®ï¼‰è¨ˆç®—çµæžœã‚‚ $2^{-53} \approx 10^{-16}$ ç¨‹åº¦ãã‚‰ã„ã«ãªã‚‹ã ã‚ã†ã€ã¨æ€ã£ã¦ã„ã‚‹äººã‚‚ã„ã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚ã•ã™ãŒã«ãã‚“ãªã“ã¨ã¯ãªã„ã§ã™ã‹ï¼Ÿ

æ•°å¼ã§ã®è¨¼æ˜Ž

IEEE 754 ã®è¦æ ¼ã«ã‚ˆã£ã¦ã€æµ®å‹•å°æ•°ç‚¹åž‹ã®è¨ˆç®—ã¯ï¼ˆIEEE 754 ã«æº–æ‹ ã—ãŸã‚‚ã®ã§ã‚ã‚Œã°ï¼‰ç’°å¢ƒã«ã‚ˆã‚‰ãšã«å†ç¾æ€§ã®ã‚ã‚‹ã‚‚ã®ã«ãªã£ã¦ã„ã¾ã™ã€‚ ã“ã®è¦æ ¼ã®ç™»å ´å‰ã¯ãƒ—ãƒã‚»ãƒƒã‚µãªã©ã”ã¨ã«ã•ã¾ã–ã¾ãªæŒ™å‹•ã‚’ã—ã¦ã„ã¦ã‚«ã‚ªã‚¹ã ã£ãŸã¨èžã„ã¦ã„ã¾ã™ã€‚

å†ç¾æ€§ãŒã‚ã‚‹ã¨ã„ã†ã“ã¨ã¯æ•°å¼ãªã©ã«ã‚ˆã‚‹è¨¼æ˜Žã‚‚æœ‰åŠ¹ã§ã€ã“ã‚Œã¯éžå¸¸ã«ã†ã‚Œã—ã„ã“ã¨ã§ã™ã€‚ ã«ã‚‚ã‹ã‹ã‚ã‚‰ãšã€ã‚„ã¯ã‚Šã‚ã–ã‚ã–ã€Œfloat ã‚’ä½¿ã†ãŸã³ã«æ•°å¼ï¼ˆãªã©ï¼‰ã§è¨¼æ˜Žã‚’æ›¸ãã€ã¨ã„ã†å–¶ã¿ã‚’ã—ã¦ã„ã‚‹äººã¯ãã†å¤šãã¯ãªã„ã‚ˆã†ãªæ°—ãŒã—ã¾ã™ã€‚ ãªã«ã‚’ã©ã†è¨¼æ˜Žã™ã‚Œã°ã„ã„ã‹ã‚‚ã‚ã‹ã‚‰ãªã„ã—ã€ãã‚‚ãã‚‚è¨¼æ˜Žã§ãã‚‹ï¼ˆã‚ã‚‹ã„ã¯è¨¼æ˜Žã™ã‚‹ã¹ãï¼‰ã“ã¨ã ã¨æ€ã£ã¦ã„ãªã„äººãŒå¤šæ•°æ´¾ãªã®ã‹ãªï¼Ÿã¨æ€ã£ã¦ã„ã¾ã™ã€‚

æœ€è¿‘ã§ã¯ AI ã«ã‚ˆã‚‹ã‚³ãƒ¼ãƒ‰ç”ŸæˆãŒæµè¡Œã£ã¦ã„ã¾ã™ãŒã€ï¼ˆGappa ãªã‚Š Coq ãªã‚Šã‚’é§†ä½¿ã—ã¤ã¤ï¼‰è¨¼æ˜Žã‚‚ã‚„ã£ã¦ãã‚ŒãŸã‚‰ã†ã‚Œã—ã„ã‚‚ã®ã§ã—ã‚‡ã†ã‹ã€‚ã§ãã‚‹ã®ã‹ãªï¼Ÿ ã§ããªã„ã¨ã¯ã‚ã¾ã‚Šæ€ã£ã¦ãªã„ã§ã™ã‘ã©ã€‚

æ•°å¦é–¢æ•°ãŸã¡ã«ã¤ã„ã¦

æ•°å¦é–¢æ•°ãŸã¡ã®å®Ÿè£…ã¯å¿…ãšã—ã‚‚ correctly-rounded ã«ãªã£ã¦ã„ãªã„ã“ã¨ã‚‚å¤šãã€å«Œãªæ°—æŒã¡ã«ãªã‚Šã¾ã™ã€‚LLVM ã¯ correct rounding ãªå®Ÿè£…ã‚’ ç›®æŒ‡ã—ã¦ã„ãã† ãªã®ã§ã€ã†ã‚Œã—ã„æ°—æŒã¡ã«ãªã‚Šã¾ã™ã€‚ãŒã‚“ã°ãˆãƒ¼ã£ã£

å®Ÿå‹™ï¼Ÿ

é•·ã‚ã®ä¿å®ˆã‚’å‰æã¨ã™ã‚‹å®Ÿå‹™ã®ã‚³ãƒ¼ãƒ‰ã§ä½¿ã„ãŸã„ã‹ï¼Ÿã¨ãªã£ã¦ãã‚‹ã¨ã€ã“ã‚Œã¯è©±ãŒåˆ¥ã§ã™ã€‚

ãƒªãƒ•ã‚¡ã‚¯ã‚¿ã®åç›®ã§æ‹¬å¼§ã®ã¤ã‘æ–¹ã‚’å‹æ‰‹ã«å¤‰ãˆã‚‰ã‚Œã‚‹ã ã‘ã§ã‚ã¡ã‚ƒãã¡ã‚ƒã«ãªã£ãŸã‚Šã€ãã‚‚ãã‚‚è¨¼æ˜Žã‚’ç†è§£ã—ã¦ãƒ¡ãƒ³ãƒ†ã§ãã‚‹äººã®æ•™è‚²ã‚³ã‚¹ãƒˆã¯ãŸãã•ã‚“ã ã£ãŸã‚Šã€å˜ä½“ãƒ†ã‚¹ãƒˆã§ãªã«ã‹ã‚’ä¿è¨¼ã™ã‚‹ã®ãŒå¤§å¤‰ã ã£ãŸã‚Šã€æœ¬ç•ªç’°å¢ƒã§ãƒã‚°ãŒå‡ºãŸã¨ãã®å†ç¾ã«å›°ã£ãŸã‚Šãªã©ã€ã±ã£ã¨æ€ã„ã¤ãã ã‘ã§ã‚‚å«Œãªè¦ç´ ã°ã‹ã‚Šã§ã™ã€‚ã†ã€œã€œã‚“å‚ã£ãŸã€‚

ã§ã‚‚ç¾å®Ÿã¯ãŸã¶ã‚“ã‚‚ã£ã¨é…·ãã¦ã€æ™®é€šã«æ¡è½ã¡ã§ã‚ã¡ã‚ƒãã¡ã‚ƒã«ãªã‚Šã†ã‚‹ã‚ˆã†ãªã‚³ãƒ¼ãƒ‰ãŒä¸–ã®ä¸ã®æœ¬ç•ªç’°å¢ƒã«ãŸãã•ã‚“ãƒ‡ãƒ—ãƒã‚¤ã•ã‚Œã¦ãŸã‚Šã™ã‚‹ã‚“ã˜ã‚ƒãªã„ã§ã™ã‹ï¼Ÿã¨ã‚‚æ€ã£ãŸã‚Šã§ã€å«Œã€œã€œã¨ã„ã†æ°—æŒã¡ã«ãªã‚Šã¾ã™ã€‚

ã¨ã„ã†ã‚ã‘ãªã®ã§ã€ãˆã³ã¡ã‚ƒã‚“ã¯æµ®å‹•å°æ•°ç‚¹åž‹ãŒå¥½ãã§ã¯ã‚ã‚‹ã‚‚ã®ã®ã€ã€Œä¸–ã®ä¸ã®äººãŒã‚‚ã£ã¨ä½¿ã£ã¦ãã‚Œã€œã€œã€ã¨æ€ã£ã¦ã„ã‚‹ã‚ã‘ã§ã‚‚ãªã„ã§ã™ã€‚ ã€Œä¸–ã®ä¸ã®äººãŒæµ®å‹•å°æ•°ç‚¹åž‹é–¢é€£ã®è¨¼æ˜Žã‚’ã§ãã‚‹ã‚ˆã†ã«ãªã£ã¦ãã‚Œã€œã€œã€ã¨ã‚‚åˆ¥ã«æ€ã£ã¦ã¯ã„ãªã„ã§ã™ãŒã€ã§ãã‚‹ã‚ˆã†ã«ãªã£ãŸä¸–ç•Œã‚‚è¦‹ã¦ã¿ãŸãã¯ã‚ã‚Šã¾ã™ãã€‚

æµ®å‹•å°æ•°ç‚¹åž‹ã‚’ä½¿ã£ãŸã‚³ãƒ¼ãƒ‰ã‚’æ›¸ã„ã¦ã„ã‚‹ã¨ãƒ¬ãƒ“ãƒ¥ãƒ¼æ™‚ã«åä¾‹ã‚’æŒ™ã’ã¦ reject ã—ã¦ãã‚‹ãˆã³ã¡ã‚ƒã‚“æ¦‚å¿µã€æ€–ãã¦å«Œã§ã™ã*3ã€‚ã‚ã‚‹ã„ã¯ã€Œè¨¼æ˜Žæ•™ãˆã¦ãã ã•ã„ã€ã¨ã‹è¨€ã‚ã‚Œã¦ã‚‚å«Œã ãªã€‚

æ‰€æ„Ÿ

ä»Šã¾ã§ã®ã‚‚å…¨éƒ¨æ‰€æ„Ÿã ã‚ã¨ã„ã†ã®ã¯æ£ã—ã„ã§ã™ãã€‚ãƒ¡ã‚¿æ‰€æ„Ÿï¼Ÿ

ãƒãƒƒãƒˆä¸Šã§è¦‹ã‹ã‘ãŸæ€ªã—ã„è¨€èª¬ã‚„ã€æµ…ã„ç†è§£ã®è§£èª¬ãƒ–ãƒã‚°ãªã©ã®å°è±¡ã«å¼•ã£å¼µã‚‰ã‚Œã™ãŽã¦ã€ã€Œå¤§åŠã®äººé¡žã¯ã¾ã¨ã‚‚ã«ç†è§£ã—ã¦ãªã„ã‚“ã˜ã‚ƒãªã„ï¼Ÿã€ã¨æ€ã£ã¦ã„ã‚‹ã ã‘ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚æ›¸ããªãŒã‚‰ãã†ã„ã†è‡ªè¦šã¯èŠ½ç”Ÿãˆã¦ãã¾ã—ãŸã€‚éŒ¯è¦šã ã£ãŸã‚‰ã†ã‚Œã—ã„ã§ã™ã€‚

ãªã«ã‹ã—ã‚‰ã‚’è¦‹ã‚‹ãŸã³ã«ã‚‚ã‚„ã‚‚ã‚„ã™ã‚‹ã®ã«é£½ããŸã®ã§ã€ä½•åº¦ã‚‚æ€ã£ãŸã‚ˆã†ãªã“ã¨ã‚’ã°ãƒ¼ã£ã¨æ›¸ãæ®´ã£ãŸã¨ã„ã†æ„Ÿã˜ã§ã™ã€‚

æ•°å€¤è¨ˆç®—ã®ã‚¨ã‚ã‚¹ãƒ‘ãƒ¼ãƒˆã¿ãŸã„ãªäººè‡ªä½“ã¯ã”ã‚ã”ã‚ã„ã‚‹ã¯ãšã§ã™ã‹ã‚‰ã€ãˆã³ã¡ã‚ƒã‚“ã‚‚ãã†ã„ã†äººã«ãªã‚ŠãŸã„ã§ã™ãã€‚ éŽåŽ»ä½•åº¦ã‹æŒ«æŠ˜ã—ã¦ã„ã¾ã™ãŒã€æœ€è¿‘ã¯æ•°å¦é–¢æ•°ã® correct rounding ãªå®Ÿè£…ã«ã¤ã„ã¦èª¿ã¹ã¦ã„ã¾ã™ã€‚ correct rounding ãªæ•°å¦é–¢æ•°ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã«é–¢ã—ã¦ã¯ã€ã™ã§ã«ãƒ¡ãƒ³ãƒ†ãŒçµ‚äº†ã—ãŸãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆãŒè¤‡æ•°ã‚ã£ã¦ã‹ãªã—ã„æ°—æŒã¡ã§ã™ã€‚ ã‚µãƒ¼ãƒ™ã‚¤è«–æ–‡ ãŒ 2025 å¹´ 2 æœˆã«æ›´æ–°ã•ã‚Œã¦ã„ãŸã‚Šã—ã¦ã€ã¾ã ã¾ã å‹•ãã®ã‚ã‚‹åˆ†é‡Žãªã®ã‹ãªï¼Ÿã¨æ€ã£ãŸã‚Šã—ã¦ã„ã¾ã™ã€‚ ãã‚Œãªã‚Šã«å¤ãã‹ã‚‰ï¼ˆãŸã¨ãˆã°ç«¶ãƒ—ãƒç•Œéšˆã§ã¯ã‚ã¾ã‚Šæœ‰åã§ãªã„ã‚ˆã†ãªï¼‰ã•ã¾ã–ã¾ãªã“ã¨ãŒç ”ç©¶ã•ã‚Œã¦ã„ãã†ãªã®ã§ã€ãŒã‚“ã°ã‚‰ãªãã‚ƒã¨ã„ã†ã¨ã“ã‚ã§ã™ã€‚

ã€Œç«¶ãƒ—ãƒç•Œéšˆã§æœ‰åã€ã£ã¦ãªã‚“ã ã‚ˆã¨ã„ã†æŒ‡æ‘˜ã¯ã‚ã‚Šã¾ã™ãã€‚ç«¶ãƒ—ãƒç•Œéšˆã§æœ‰åãªã‚‚ã®ã¯ã‚»ã‚°æœ¨ã¨ union-find ã—ã‹ãªã„ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

ãŠã‚ã‚Š

æ˜Žæ—¥ã‹ã‚‰ãŒã‚“ã°ã‚Šã¾ã™ã€‚

*1:éŽæ¿€ç™ºè¨€ã™ãŽã‚‹ã€‚

*2:æ¯Žå›žåŽ³å¯†ãªè¨¼æ˜Žã‚’ã—ã¾ã—ã‚‡ã†ã¨ã„ã†ã‚ˆã‚Šã¯ã€ã€Œã“ã†ã„ã†æ ¹æ‹ ãŒã‚ã‚‹ã‹ã‚‰ã„ã‘ã‚‹ã‚ˆãã€ãã‚‰ã„ã®è€ƒæ…®ã™ã‚‰ã—ãªã„æ…‹åº¦ã¯ã ã‚ã ã‚ˆãã€ãã‚‰ã„ã®æ°—æŒã¡ã«è¿‘ã„ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

*3:ã§ã‚‚ãƒ¬ãƒ“ãƒ¥ã‚¢ãƒ¼ã¨ã—ã¦ã™ã‚‹ã¹ãã§ã¯ã‚ã‚Šãã†ã€‚å®Ÿè£…ã®ä»£æ›¿æ¡ˆã¯å‡ºã•ãšã«åä¾‹ã ã‘æŒ™ã’ã‚‰ã‚ŒãŸã‚‰å«Œã€‚

2025-03-19

u64 ã®å¹³æ–¹æ•°åˆ¤å®šã‚’ f64 ã® sqrt ã§ã‚„ã‚‹ã‚„ã¤ã®æ£å½“æ€§

Rust ã§è¨€ã†ã¨ã“ã‚ã®ä¸‹è¨˜ã®ã‚ˆã†ãªé–¢æ•°ã§ã™ã€‚

fn is_square(nn: u64) -> bool {
    let n = (nn as f64).sqrt() as u64;
    n.wrapping_mul(n) == nn
}

fn is_square(nn: u64) -> bool {
    ((nn as f64).sqrt() as u64).wrapping_pow(2) == nn
}

ã“ã‚ŒãŒå•é¡Œãªã„ã¨ã„ã†ã“ã¨ã‚’ç¤ºãã†ãã¨ã„ã†ã®ãŒä»Šå›žã®ãŠè©±ã§ã™ã€‚

åŠ›æŠ€

u64 ã®ç¯„å›²ã®å¹³æ–¹æ•°ãªã‚“ã¦ã®ã¯ $2^{32}$ å€‹ã—ã‹ãªã„ã®ã§ã€ãã‚Œã‚‰ã¨ãã® off-by-one ã‚’å…¨éƒ¨ãƒ†ã‚¹ãƒˆã™ã‚‹ã“ã¨ã¯æ•°ç§’ã§å¯èƒ½ã§ã™ã€‚

#[test]
fn boundaries() {
    assert!(is_square(0));
    assert!(is_square(1));
    assert!(!is_square(2));
    for i in 2..=u32::MAX as u64 {
        let ii = i * i;
        assert!(is_square(ii));
        assert!(!is_square(ii - 1));
        assert!(!is_square(ii + 1));
    }
    assert!(!is_square(u64::MAX));
}

æ•°å¦

æ•°å¼ã§ã®è¨¼æ˜Žã‚‚ã—ã¾ã—ã‚‡ã†ã€‚

IEEE 754 ã‚’å‰æã¨ã—ã¦ã€sqrt ã¯ correctly-rounded ã§è¨ˆç®—ã§ãã‚‹ã¨ã—ã¾ã™*1ã€‚ ãªã®ã§ sqrt ã¯å•é¡Œãªã„ã®ã§ã™ãŒã€æ•´æ•°åž‹ã‹ã‚‰ã®å¤‰æ› (as f64) ã®éƒ¨åˆ†ã§èª¤å·®ãŒç”Ÿã˜ã¾ã™ã€‚ ãã‚Œã‚’è€ƒæ…®ã—ãŸä¸Šã§ã€å•é¡Œãªãè¨ˆç®—ã§ãã‚‹ã¨ã„ã†ã®ãŒé¢ç™½ã„ã¨ã“ã‚ã§ã™ãã€‚

double (binary64) ã‚’å‰æã¨ã—ã¦ã€$p = 53$ ã¨ã—ã¾ã™ã€‚

Observation 1: $\roundp{\sqrt{94906267^2}} = 94906267$.

ã“ã“ã§ã€$94906265^2\lt 2^p\lt 94906267^2$ ã§ã™ã€‚

>>> 94906267**2
9007199515875289
>>> 9007199515875289.0
9007199515875288.0
>>> math.sqrt(9007199515875289.0)
94906267.0

$$ \begin{aligned} \roundp{94906267^2} &= 94906267^2-1 \\ \sqrt{94906267^2-1} &= 94906266.{\footnotesize 999999994731644}{\scriptsize 012507624877103}{\tiny 348660069207956{\dots}} \\ \roundp{\sqrt{94906267^2-1}} &= 94906267. \end{aligned} $$

Lemma 2: å®Ÿæ•° $x\gt 0$ ã«å¯¾ã—ã¦ã€$1+\tfrac12x \gt \sqrt{1+x}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

$f(x) = (1+\tfrac12x)-(1+x)^{1/2}$ ã¨ã™ã‚‹ã€‚$f(0) = 0$ ãªã®ã§ã€$x\gt 0 \implies f'(x)\gt 0$ ã‚’ç¤ºã›ã°ååˆ†ã€‚

ä¸¡è¾ºã®å·®ã‚’å¾®åˆ†ã—ã¦ã€ $$ \begin{aligned} f'(x) &= \tfrac12-\tfrac12(1+x)^{-1/2} \\ &= \tfrac12(1-(1+x)^{-1/2}). \end{aligned} $$ $x\gt 0$ ã®ã¨ã $(1+x)^{-1/2} \lt 1$ ã‚ˆã‚Šå¾“ã†ã€‚$\qed$

note (fact): $\sqrt{1+x} = 1 + {\small 0.5}x - {\small 0.125}x^2 + {\small 0.0625}x^3 - {\small 0.0390625}x^4 + O(x^5)$.

Lemma 3: å®Ÿæ•° $0\lt x\lt 1$ ã«å¯¾ã—ã¦ã€$1-x\lt\sqrt{1-x}$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

$0\lt 1-x \lt 1$ ã§ã‚ã‚‹ã‹ã‚‰ã€$(1-x)^1 \lt (1-x)^{1/2}$ ã¯æ˜Žã‚‰ã‹ã€‚$\qed$

Lemma 4: $f(x)$ ã‚’æ¬¡ã§å®šç¾©ã™ã‚‹ã€‚ $$ f(x) = \frac{\tfrac x2}{(1-\tfrac x2)-\sqrt{1-x}}. $$ ã“ã®ã¨ãã€ä»»æ„ã® $0\lt x\lt 1$ ã«å¯¾ã—ã¦ $f(x) \gt \tfrac 4x-3$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

$$ \begin{aligned} f(x) &= \frac{\tfrac x2}{(1-\tfrac x2)-\sqrt{1-x}} \\ &= \frac{\tfrac x2}{(1-\tfrac x2)^2-(1-x)}\cdot( (1-\tfrac x2)+\sqrt{1-x}) \\ &= \frac{\tfrac x2}{\tfrac{x^2}4}\cdot( (1-\tfrac x2)+\sqrt{1-x}) \\ &\gt \tfrac2x\cdot( (1-\tfrac x2)+(1-x) ) \\ &= \tfrac2x\cdot(2-\tfrac32x) \\ &= \tfrac4x-3.\quad\qed \end{aligned} $$

note (fact): $f(x) = \tfrac4x-2-{\small 0.25}x-{\small 0.125}x^2-{\small 0.078125}x^3-{\small 0.0546875}x^4+O(x^5)$.

Therorem 5: æ•´æ•° $2^{p/2}\le n\le 2^p$ ã«å¯¾ã—ã€$\roundp{\sqrt{\roundp{n^2}}} = n$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

ã“ã®ç¯„å›²ã«ãŠã„ã¦ $\roundp{n}=n$ ã§ã‚ã‚‹ã“ã¨ã«æ³¨æ„ã™ã‚‹ã€‚ $\roundp{\sqrt{\roundp{n^2}}}\le n$ ã‹ã¤ $\roundp{\sqrt{\roundp{n^2}}}\ge n$ ã‚’ç¤ºã›ã°ã‚ˆã„ã€‚

( $\le$ ): $\sqrt{\roundp{n^2}} \lt n + \hfloor{n}\cdot 2^{-p}$ ã‚’ç¤ºã™ã€‚

$$ \begin{aligned} \sqrt{\roundp{n^2}} &\le \sqrt{n^2(1+2^{-p})} \\ &= n\sqrt{1+2^{-p}} \\ &\lt n\cdot(1+2^{-(p+1)}) \\ &\lt n+\hfloor{n}\cdot 2^{-p}. \end{aligned} $$

( $\ge$ ):

Case 1: $\hfloor n=n \implies \sqrt{\roundp{n^2}} \ge n - \hfloor{n}\cdot 2^{-(p+1)}$ ã‚’ç¤ºã™ã€‚

$\hfloor n=n$ ã‚ˆã‚Šã€ã‚ã‚‹æ•´æ•° $k$ ã«å¯¾ã—ã¦ $n=2^k$ ã¨ãªã‚‹ã€‚ ã™ãªã‚ã¡ã€$\roundp{n^2} = \roundp{2^{2k}} = 2^{2k}$ ã§ã‚ã‚Šã€$\sqrt{\roundp{n^2}} = n$ ã‹ã‚‰ã€æ˜Žã‚‰ã‹ã«å¾“ã†ã€‚

Case 2: $\hfloor n\lt n \implies \sqrt{\roundp{n^2}} \gt n - \hfloor{n}\cdot 2^{-p}$ ã‚’ç¤ºã™ã€‚

$$ \begin{aligned} \sqrt{\roundp{n^2}} &\ge \sqrt{n^2(1-2^{-p})} \\ &= n\sqrt{1-2^{-p}}. \end{aligned} $$

$n\le 2\hfloor{n}-1$ ã‚ˆã‚Š $\hfloor{n}\ge \tfrac{n+1}2$ ãªã®ã§ã€ $$ \begin{aligned} n-\hfloor n\cdot2^{-p} &\le n-\tfrac{n+1}2\cdot 2^{-p} \\ &= n\cdot(1-2^{-(p+1)})-2^{-(p+1)}. \end{aligned} $$ ã‚ˆã£ã¦ã€ä¸‹è¨˜ã‚’ç¤ºã›ã°ååˆ†ã€‚ $$ n\sqrt{1-2^{-p}} - \left(n\cdot(1-2^{-(p+1)})-2^{-(p+1)}\right) \gt 0. $$

ã“ã‚Œã¯ã€ $$ n \le 2^p \lt 2^{p+2}-3 \lt f(2^{-p}) = \frac{2^{-(p+1)}}{(1-2^{-(p+1)})-\sqrt{1-2^{-p}}} $$ ã‚ˆã‚Šå¾“ã†ã€‚$\qed$

Corollary 6: æ•´æ•° $0\le n\le 2^p$ ã«å¯¾ã—ã€$\roundp{\sqrt{\roundp{n^2}}} = n$ ãŒæˆã‚Šç«‹ã¤ã€‚

Proof

$0\le n\lt 2^{p/2}$ ã®ã¨ãã¯ã€$\roundp{n^2} = n^2$ ã‚ˆã‚Šæ˜Žã‚‰ã‹ã€‚Theorem 5 ã‚ˆã‚Šå¾“ã†ã€‚

note: $n=2^p+1$ ã®ã¨ãã«æˆã‚Šç«‹ãŸãªã„ã®ã¯æ˜Žã‚‰ã‹ã€‚

>>> 2**53+1
9007199254740993
>>> sqrt((2**53+1)**2)
9007199254740992.0

wrapping ã«é–¢ã—ã¦

ã“ã“è¿½è¨˜ã§ã™ã€‚

n.wrapping_mul(n) ã®éƒ¨åˆ†ã§å¤‰ãªã“ã¨ã«ãªã‚‰ãªã„ã“ã¨ã‚’ç¤ºã—ã¦ãŠãã¾ã™ã€‚ n.wrapping_mul(n) ãŒ wrap ã™ã‚‹ã®ã¯ n ãŒ$2^{32}$ ä»¥ä¸Šã®ã¨ãã§ã™ã€‚ä¸€æ–¹ã€å…¥åŠ› nn ã¯ $2^{64}-1$ ä»¥ä¸‹ãªã®ã§ã€n ã¯ $2^{32}$ ä»¥ä¸‹ã«ãªã‚Šã¾ã™ï¼ˆ$\sqrt{2^{64}-1}\le 2^{32}$ ã‹ã¤ $\roundp{2^{32}} = 2^{32}$ ã‚ˆã‚Šï¼‰ã€‚

ãã®ãŸã‚ã€n ãŒ $2^{32}$ ã¨ãªã‚‹å ´åˆã®ã¿è€ƒãˆã‚Œã°ã‚ˆã„ã§ã™ã€‚

n ãŒ $2^{32}$ ã®ã¨ãã¯ n.wrapping_mul(n) == 0 ã§ã™ãŒã€nn == 0 ã¨ä¸¡ç«‹ã™ã‚‹ã“ã¨ã¯ãªã„ã®ã§ã€èª¤ã£ã¦ true ã‚’è¿”ã™ã“ã¨ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚ ã¾ãŸã€nn ãŒ $2^{64}$ ã¨ãªã‚‹ã“ã¨ã¯ï¼ˆu64 ã®ç¯„å›²ã‹ã‚‰ï¼‰ãªã„ã®ã§ã€èª¤ã£ã¦ false ã‚’è¿”ã™ã“ã¨ã‚‚ã‚ã‚Šã¾ã›ã‚“ã€‚$\qed$

ã‚ã¨ãŒã

ã“ã‚Œã§å®‰å¿ƒã—ã¦ sqrt ã‚’ä½¿ã£ã¦å¹³æ–¹æ•°åˆ¤å®šã‚’ã—ã¦ç”Ÿãã¦ã„ã‘ã¾ã™ã€‚ çµæžœãŒæ‰€æœ›ã®æ•´æ•°ã«ãªã£ã¦ãã‚Œã‚‹ãŸã‚ã€ã€Œå¿µã®ãŸã‚ round ã—ã¦ãŠãã€ã®ã‚ˆã†ãªå‡¦ç†ã‚‚ä¸è¦ã§ã‚ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚

ï¼Ÿï¼Ÿã€Œu64::isqrt ã¯ stabilize ã•ã‚Œã¦ã¾ã™ã‚ˆç¬‘ã€

ã¨ã“ã‚ã§ã€Theorem 5 ã® ( $\ge$ ) ã® Case 2 ã‚’ç¤ºã™ã®ã«è‹¦æˆ¦ã—ã¾ã—ãŸã€‚ä»¥å‰è‡ªåˆ†ã§æ›¸ã„ãŸè¨˜äº‹ã‚’è¦‹ã¦ã€Œãªã‚‹ã»ã©ãªã€œã€ã¨ãªã‚Šã¾ã—ãŸã€‚è¡°ãˆã‚’æ„Ÿã˜ã¾ã™ã€‚æ‚”ã—ã‹ã£ãŸã®ã§å°‘ã—é•ã†æ–¹é‡ã§ç¤ºã—ã¾ã—ãŸã€‚

rsk0315.hatenablog.com

fact ã®éƒ¨åˆ†ã® Taylor å±•é–‹ã¯ sympy.series ãªã©ã§æ±‚ã‚ã¦ã„ã¾ã™ã€‚ã€Œã“ã‚“ãªä¸ç‰å¼æˆã‚Šç«‹ã¤ã®ï¼Ÿã€ã¨ã„ã†æ°—æŒã¡ã«ãªã£ãŸã¨ãã«ã€ã¨ã‚Šã‚ãˆãšã‚°ãƒ©ãƒ•ã‚„ Taylor å±•é–‹ã‚’è¦‹ã¦ã€ŒãŸã—ã‹ã«æˆã‚Šç«‹ã¡ãã†ãƒ»ç¤ºã›ãã†ã‹ã€œã€ã¨ã‚„ã£ã¦ã„ã¾ã—ãŸã€‚ç”˜ãˆã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚

Gappa ã‚„ Sollya ã‚„ SageMath ã¨ã‚‚ãŠå‹ã ã¡ã«ãªã‚ã†ã¨ã—ã¦ã„ã‚‹ã¨ã“ã‚ã§ã™ã€‚

ãŠã‚ã‚Š

ãŠã‚ã‚Šã§ã™ã€‚

*1:IEEE 754 ã§ã¯ã€å››å‰‡æ¼”ç®—ã‚„å¹³æ–¹æ ¹ãªã©ã‚’ã¯ã˜ã‚ã¨ã™ã‚‹å„æ¼”ç®—ã¯ correctly-rounded ã§ã‚ã‚‹ã“ã¨ãŒè¦æ±‚ã•ã‚Œã¦ (shall) ã„ã¾ã™ã€‚ä¸€æ–¹ã€C ã®è¦æ ¼ã§ã¯å››å‰‡æ¼”ç®—ã‚’å«ã‚€å„æ¼”ç®—ã®ç²¾åº¦ã¯å‡¦ç†ç³»å®šç¾©ã¨ã„ã†ã“ã¨ã«ãªã£ã¦ã„ã¾ã™ã€‚ã‚‚ã—ã‹ã—ã¦è§£æ•£ã§ã™ã‹ï¼Ÿ GCC ã‚„ LLVM ã«ãŠã„ã¦ã¯å•é¡Œãªã„ã‚ˆã†ãªæ°—ã‚‚ã—ã¾ã™ãŒã€‚

2025-03-02

cbrt ã‚’æ±‚ã‚ã‚ˆã† (with glibc)

æµ®å‹•å°æ•°ç‚¹æ•°

ã€Œãã‚ãã‚å››å‰‡æ¼”ç®—ã®èª¤å·®è©•ä¾¡ã‚‚é£½ããŸãªã€œã€ã€Œæ•°å¦é–¢æ•°ã®è¨ˆç®—ã¨ã‹ã‚‚ã‚„ã£ã¦ã¿ã¦ã‚ˆã€ã¨ã„ã†å£°ãŒèžã“ãˆã¦ããŸ*1ã®ã§ã€ä»Šæ—¥ã¯ãã‚Œã‚’ã—ã¾ã™ã€‚

å°Žå…¥

ã‚ˆãè¨€ã‚ã‚Œã¦ã„ã‚‹ã‚ˆã†ãªå‹˜é•ã„ã«ã¤ã„ã¦ã€ä¸€æ—¦è§¦ã‚Œã¦ãŠãã¾ã™ã€‚

cbrt(x) ã£ã¦ pow(x, 1.0/3.0) ã§ã‚ˆããªã„ï¼Ÿ

IEEE Std 754-2019 ã® 9.2.1 Special values ã«ã¯ã€ä¸‹è¨˜ã®è¨˜è¿°ãŒã‚ã‚Šã¾ã™ã€‚

$\mathrm{pow}(x, y)$ signals the invalid operation exception for finite $x\lt 0$ and finite non-integer $y$.

å®Ÿéš›ã€pow(-1.0, 1.0/3.0) ã‚’è¨ˆç®—ã—ã¦ã¿ã‚‹ã¨ã€C ã§ã¯ NaN ã«ãªã‚Šã€Python ã§ã¯ ValueError: math domain error ãŒå‡ºã¾ã—ãŸã€‚

ã¾ãŸã€ç²¾åº¦ã«ãŠã„ã¦ã‚‚é•ã„ãŒã‚ã‚Šã¾ã™ã€‚ 1.0/3.0 ã¨ã„ã†ã®ã¯ã€$\tfrac13$ ã¨ã¯ç•°ãªã‚‹å€¤ã§ã™ã€‚ $$ \begin{aligned} 1\oslash3 &= 0.{\small 333333333333333}{\footnotesize 314829616256247}{\scriptsize 390992939472198}{\tiny 486328125} \\ &= \tfrac13\cdot(1-2^{-54}). \end{aligned} $$ $\tfrac13\cdot 2^{-54}$ ã®èª¤å·®ã®ã›ã„ã§ã€ï¼ˆcbrt ãŒ correctly-rounded ãªå€¤ã‚’è¿”ã™ã¨ã—ã¦å®Ÿè£…ã•ã‚Œã¦ã„ãŸã¨ã—ã¦ã‚‚ï¼‰æ‰€æœ›ã®å€¤ã«ãªã£ã¦ãã‚Œãªã„ã‚±ãƒ¼ã‚¹ãŒã—ã°ã—ã°ç™ºç”Ÿã—ã¾ã™ã€‚ $$ \begin{aligned} 64^{\tfrac13\cdot(1-2^{-54})} &= 3.{\small 999999999999999}{\footnotesize 692180816275335}{\scriptsize 216604455276753}{\tiny 748400773143551{\dots}}, \\ \roundp{64^{\tfrac13\cdot(1-2^{-54})}} &= 3.{\small 999999999999999}{\footnotesize 555910790149937}{\scriptsize 383830547332763}{\tiny 671875} \\ &= 4-2^{-51}. \end{aligned} $$

ãã†ã„ã†ã‚ã‘ã§ã€å°‚ç”¨ã®é–¢æ•°ã‚’ä½¿ã†å¿…è¦ãŒã‚ã‚‹ã‚ã‘ã§ã™ãã€‚

note: 1.0 / 3.0 ã‚’æ¸¡ã•ã‚ŒãŸ pow é–¢æ•°å´ã«ã€Œã‚ªãƒƒ cbrt ã‚’è¨ˆç®—ã—ãŸã„ã‚“ã‚„ãªã€æ°—ã‚£åˆ©ã‹ã›ã¦è£œæ£ã—ã¨ã„ãŸã‚ï½—ã€ã¨ã•ã‚Œã‚‹ã¨ã€ãã‚Œã¯ãã‚Œã§ã‚ã¡ã‚ƒãã¡ã‚ƒã«ãªã‚Šã¾ã™ã*2ã€‚

glibc å®Ÿè£…

ç²¾åº¦ï¼Ÿ

cbrt(3375.0) ã‚’è¨ˆç®—ã—ã¦ã¿ã‚‹ã¨ã€14.9999999999999982236431605997495353221893310546875 ã«ãªã‚Šã¾ã—ãŸã€‚ã‚¦ã€œãƒ³ãƒ ã€‚ $3375 = 15^3$ ã§ã™ãŒã€$15-2^{-49}$ ãŒè¿”ã£ã¦ãã¦ã„ã¦å«Œãªæ°—æŒã¡ã«ãªã‚Šã¾ã™ãã€‚

note: GCC ã§å˜ã« cbrt(3375.0) ã¨æ›¸ãã¨ 15.0 ãŒå‡ºåŠ›ã•ã‚Œã‚‹å ´åˆãŒã‚ã‚Šã¾ã™ãŒã€ã“ã‚Œã¯ã‚³ãƒ³ãƒ‘ã‚¤ãƒ«æ™‚ã«è¨ˆç®—ã—ã¦ã„ã‚‹ãŸã‚ã§ã™ï¼ˆã‚¢ã‚»ãƒ³ãƒ–ãƒªã‚’è¦‹ãŸã‚Šã™ã‚‹ã¨ã‚ã‹ã‚Šã¾ã™ï¼‰ã€‚C ã®è¦æ ¼çš„ã«ã¯ã€ã‚³ãƒ³ãƒ‘ã‚¤ãƒ«æ™‚ã®è¨ˆç®—ã¨å®Ÿè¡Œæ™‚ã®è¨ˆç®—ã§ç²¾åº¦ãªã©ã«é•ã„ãŒã‚ã‚‹ã“ã¨ã¯è¨±å®¹ã•ã‚Œã¦ã„ã¾ã™ã€‚cbrt(strtod("15", NULL)) ãªã©ã¨ã™ã‚‹ã¨ã€ãã†ã„ã†æœ€é©åŒ–ã‚’é˜²ã’ãã†ã§ã™ã€‚ãã‚Œã§ã‚‚é˜²ã’ãªã‹ã£ãŸå ´åˆã¯ã€å®Ÿè¡Œæ™‚ã«ä¸Žãˆã‚‹ã‚ˆã†ã«ã™ã‚‹ã¨ã‚ˆã„ã§ã™ãã€‚

N2347 ã‹ã‚‰ã®å¼•ç”¨

6.6/5

An expression that evaluates to a constant is required in several contexts. If a floating expression is evaluated in the translation environment, the arithmetic range and precision shall be at least as great as if the expression were being evaluated in the execution environment.

5.2.4.2.2/8

The accuracy of the floating-point operations (+, -, *, /) and of the library functions in <math.h> and <complex.h> that return floating-point resuls is implementation-defined, as is the accuracy of the conversion between floating-point internal representations and string representations performed by the library functions in <stdio.h>, <stdlib.h>, and <wchar.h>. The implementation may state that the accuracy is unknown.

ãã‚“ãªç„¡è²¬ä»»ãªã‚ã€‚$\eod$

19.7 Known Maximum Errors in Math Functions ã«ã¯ã€glibc ãŒ correct rounding ãªçµæžœã‚’ç›®æŒ‡ã—ã¦ã„ã‚‹ã‚ã‘ã§ã¯ãªã„æ—¨ã‚„ã€crsin ã®ã‚ˆã†ã« correct rounding ç‰ˆã‚’ç”¨æ„ã™ã‚‹ã‹ã‚‚ã—ã‚Œãªã„æ—¨ã‚„ã€æ—¢çŸ¥ã®èª¤å·®ã®è¡¨ãªã©ãŒè¨˜è¼‰ã•ã‚Œã¦ã„ã¾ã™ã€‚

note: GCC (the GNU Compiler Collection) ã¨ glibc (the GNU C Library) ã¯åˆ¥ç‰©ã§ã€ã“ã†ã—ãŸæ¨™æº–é–¢æ•°ã¯ GCC ã§ã¯ãªã glibc ãŒæä¾›ã—ã¦ã„ã‚‹ã‚‚ã®ã§ã™ã€‚GCC ã¯ã‚ãã¾ã§ã€ï¼ˆåˆ¥é€”ç”¨æ„ã•ã‚Œã¦ã„ã‚‹ã¨ã“ã‚ã®ï¼‰glibc ã®é–¢æ•°ã‚’å‘¼ã³å‡ºã™å®Ÿè¡Œãƒ•ã‚¡ã‚¤ãƒ«ã‚’ä½œã£ã¦ã„ã‚‹ã ã‘ã§ã™ã (cf. 4.14 Library Functions)ã€‚

ã¾ãˆãŠã

ã•ã¦ã€correctly-rounded ã§ã¯ãªã„ã¨çŸ¥ã£ã¦ã‚„ã‚‹æ°—ã‚’å¤±ãã—ã¦ã„ã‚‹äººã‚‚ã„ã‚‹ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒã€ä¸€å¿œå®Ÿè£…ã‚’è¦‹ã«è¡Œãã¾ã—ã‚‡ã†ã€‚ èªè€…ã®äººã€…ï¼ˆã‚„ã€æ˜”ã®ãˆã³ã¡ã‚ƒã‚“ï¼‰ã¯æ•°å€¤è¨ˆç®—ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã«æ˜Žã‚‹ããªã„ã®ã§ã€ã€Œã©ã†ã› Taylor å±•é–‹ã¨ã‹ã‚’ã—ã¦ã‚‹ã‚“ã§ã—ã‚‡ï¼Ÿã€ã®ã‚ˆã†ãªã¼ã‚„ã¼ã‚„ã£ã¨ã—ãŸã‚¤ãƒ¡ãƒ¼ã‚¸ã‚’ã—ã¦ã„ã‚‹ã“ã¨ã¨æ€ã„ã¾ã™ãŒã€ãã†ã§ã¯ãªã„ã§ã™ã€‚

sysdeps/ieee754/dbl-64/s_cbrt.c (glibc-2.41) ã‚’èªã‚“ã§ã„ãã¾ã™ã€‚

disclaimer: sysdeps é…ä¸‹ã®æ§‹é€ ã‚’ã„ã¾ã„ã¡ã‚ã‹ã£ã¦ã„ãªã„ã§ã™ã€‚ã¾ãŸã€æ•°å¦é–¢æ•°ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®ãƒ•ã‚¡ã‚¤ãƒ«åã«ã¯ e_ k_ s_ t_ v_ w_ ãªã©ã® prefix ãŒã¤ã„ã¦ã„ã‚‹ã®ã§ã™ãŒã€ã“ã‚ŒãŒãªã«ã‚’æ„å‘³ã™ã‚‹ã®ã‹ã‚‚ã‚ã‹ã£ã¦ã„ãªã„ã§ã™ã€‚glibc ä»¥å¤–ã®æ•°å¦é–¢æ•°ã®ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã§ã‚‚ã“ã†ã—ãŸåå‰ã«ãªã£ã¦ãŠã‚Šã€ãã†ã—ãŸæ…£ç¿’ãŒã‚ã‚‹ï¼ˆor æ˜”ã®ãˆã‚‰ã„ãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆãŒãã†ã—ã¦ã„ãŸï¼Ÿï¼‰ã¨ã‹ãªã®ã‹ãªãã¨æ€ã£ã¦ã„ã¾ã™ã€‚w_ ã¯ wrapper ãªã®ã‹ãªã¨ã„ã†é›°å›²æ°—ã¯æ„Ÿã˜ã¦ã„ã¾ã™ã€‚k_ ã¯ kernel ã‚’æ„å‘³ã—ã¦ã„ãã†ãªã®ã‚’è¦‹ãŸè¨˜æ†¶ã¯ã‚ã‚Šã¾ã™*3ã€‚

æ–¹é‡

å¤§ã¾ã‹ãªæ–¹é‡ã¯æ¬¡ã®é€šã‚Šã§ã™ã€‚

$\gdef\quot{\operatorname{quot}}$ $\gdef\rem{\operatorname{rem}}$

${|x|} = x_m\times 2^{x_e}$ ã¨ã—ã¦åˆ†è§£ã™ã‚‹ã€‚ã“ã“ã§ã€$x_m\in[0.5\lldot 1)$ ã§ã€$x_e$ ã¯æ•´æ•°ã§ã‚ã‚‹ã€‚
$\sqrt[3]{|x|} = x_m^{1/3}\times 2^{x_e/3} = (x_m^{1/3}\cdot 2^{(x_e\rem 3)/3})\times 2^{x_e \quot 3}$ ã¨å¤‰å½¢ã—ã€ãã‚Œãžã‚Œã®éƒ¨åˆ†ã‚’æ±‚ã‚ã‚‹ã€‚
- $\quot$ ã¨ $\rem$ ã¯ãã‚Œãžã‚Œ C ã® / ã¨ % ã«å¯¾å¿œã™ã‚‹é™¤ç®—ã¨å‰°ä½™ç®—ã€‚å•†ã‚’ $0$ æ–¹å‘ã«ä¸¸ã‚ã‚‹ãŸã‚ã€ã‚ã¾ã‚ŠãŒè² ã«ãªã‚‹ã“ã¨ã‚‚ã‚ã‚‹ã€‚

$(x_m, x_e)$ ã‚’æ±‚ã‚ã‚‹éƒ¨åˆ†ã¯ã€frexp ã¨ã„ã†æ¨™æº–é–¢æ•°ã«ã‚ˆã£ã¦è¡Œã„ã¾ã™ã€‚ã“ã‚Œã¯ã€å†…éƒ¨ã®ãƒ“ãƒƒãƒˆè¡¨ç¾ã®æ“ä½œã«ã‚ˆã‚‹ã‚‚ã®ãªã®ã§ã€èª¤å·®ãªã—ã§å¯èƒ½ã§ã™ã€‚ ã“ã®éš›ã«ã€$0_{\pm}$, $\pm\infty$ ã‚„ NaN ã§ã‚ã‚‹ã“ã¨ã®åˆ¤å®šã‚‚å¯èƒ½ãªã®ã§ã€ãã‚Œã‚‰ã®å ´åˆã¯ãã®ã¾ã¾è¿”ã—ã¦ã—ã¾ã„ã¾ã™ã€‚

å®šæ•°ã®è¨ˆç®—

ã•ã¦ã€æœ¬é¡Œã¨ãªã‚‹ä¸‹è¨˜ã«ã¤ã„ã¦è€ƒãˆã¦ã„ãã¾ã™ã€‚ $$ \sqrt[3]{|x|} = (x_m^{1/3}\cdot 2^{(x_e\rem 3)/3})\times 2^{x_e \quot 3}. $$ ã¾ãšã€$2^{(x_e\rem 3)/3}$ ã®éƒ¨åˆ†ã¯ $2^{-2/3}$, $2^{-1/3}$, $2^{0/3}$, $2^{1/3}$, $2^{2/3}$ ã® 5 é€šã‚Šã—ã‹ãªã„ãŸã‚ã€å®šæ•°ã¨ã—ã¦ç”¨æ„ã—ã¦ãŠãã¾ã™ã€‚ $$ \begin{aligned} r_{-2} &= 0.{\small 629960524947436}{\footnotesize 484310969717625}{\scriptsize 994235277175903}{\tiny 3203125}, \\ r_{-1} &= 0.{\small 793700525984099}{\footnotesize 680698591328109}{\scriptsize 614551067352294}{\tiny 921875}, \\ r_0 &= 1, \\ r_1 &= 1.{\small 259921049894873}{\footnotesize 190666544360283}{\scriptsize 296555280685424}{\tiny 8046875}, \\ r_2 &= 1.{\small 587401051968199}{\footnotesize 583441787581250}{\scriptsize 537186861038208}{\tiny 0078125}. \end{aligned} $$

$\angled{r_1, r_2} = \angled{\roundp{\sqrt[3]{2}}, \roundp{\sqrt[3]{4}}}$ ã§ã™ãŒã€$\angled{r_{-2}, r_{-1}} = \angled{1\oslash r_2, 1\oslash r_1} \ne \angled{\roundp{\sqrt[3]{0.25}}, \roundp{\sqrt[3]{0.5}}}$ ã¨ãªã£ã¦ã„ã¾ã™ã€‚

ã“ã‚Œã‚‰ã®å€¤ã«é–¢ã—ã¦

sysdeps/i386/fpu/s_cbrt.S ã§ã‚‚åŒæ§˜ã®ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ãŒã‚¢ã‚»ãƒ³ãƒ–ãƒªã§æ›¸ã‹ã‚Œã¦ã„ã¾ã™ãŒã€ã“ã¡ã‚‰ã§ã¯ $\angled{r_{-2}, r_{-1}} = \angled{\roundp{\sqrt[3]{0.25}}, \roundp{\sqrt[3]{0.5}}}$ ã¨ãªã£ã¦ãŠã‚Šã€æ„å›³ã—ãŸå®šç¾©ã«ãªã£ã¦ã„ã‚‹ã®ã‹ã¯å¾®å¦™ãªæ°—ãŒã—ã¾ã™ã€‚ã‚³ãƒ³ãƒ‘ã‚¤ãƒ«æ™‚è¨ˆç®—ãªã©ã§å®Ÿã¯ correctly-rounded ã®å€¤ã«ãªã‚‹å¯èƒ½æ€§ã‚‚å¦å®šã¯ã§ãã¾ã›ã‚“ãŒã€æ‰‹å…ƒã®ç’°å¢ƒã§ã¯ãã†ã¯ãªã£ã¦ã„ãªã„ã‚ˆã†ã§ã—ãŸã€‚

volatile double x = 0.125; // ã‚³ãƒ³ãƒ‘ã‚¤ãƒ«æ™‚ã«è¨ˆç®—ã•ã‚Œã‚‹ã®ã‚’é˜²ã
cbrt(x);

ã¨ã—ã¦ã€$0.5$ ã«ãªã‚Œã° $r_{-2} = \roundp{\sqrt[3]{0.25}}$ ã¨ãªã£ã¦ã„ã¾ã™ã€‚

volatile double x = 0.25;
cbrt(x);

ã“ã¡ã‚‰ã¯ã€$0.{\small 629960524947436}{\footnotesize 706355574642657}{\scriptsize 302320003509521}{\tiny 484375}$ ã«ãªã‚Œã° $r_{-1} = \roundp{\sqrt[3]{0.5}}$ ã¨ãªã£ã¦ã„ã¾ã™ã€‚ãªãŠã€ã“ã®ã¨ãã® cbrt(0.25) ã®å€¤ã¯ $\roundp{\sqrt[3]{0.25}}$ ã¨ã¯ç•°ãªã£ã¦ã„ã‚‹ã“ã¨ã«æ³¨æ„ã—ã¦ãã ã•ã„ ðŸ¥²ã€‚

$$ \begin{aligned} \roundp{\sqrt[3]{0.5}} &= 0.{\small 793700525984099}{\footnotesize 791720893790625}{\scriptsize 268593430519104}{\tiny 00390625}, \\ \roundp{\sqrt[3]{0.25}} &= 0.{\small 629960524947436}{\footnotesize 595333272180141}{\scriptsize 648277640342712}{\tiny 40234375}. \quad\eod \end{aligned} $$

è¿‘ä¼¼å¤šé …å¼

ã•ã¦ã€æ®‹ã‚Šã¯ $x_m^{1/3}$ ã‚’æ±‚ã‚ã‚‹ãƒ‘ãƒ¼ãƒˆã§ã™ã€‚ å®šç¾©ã‹ã‚‰ $x_m\in[0.5\lldot1)$ ã§ã™ã€‚ ã“ã®ã‚ˆã†ã«ã€å…¥åŠ›ãŒç‰¹å®šã®åŒºé–“ã«å«ã¾ã‚Œã‚‹ã‚±ãƒ¼ã‚¹ã«å¸°ç€ã™ã‚‹æ‰‹æ³•ã¯ã€ã“ã‚Œä»¥å¤–ã®æ•°å¦é–¢æ•°ã«ãŠã„ã¦ã‚‚ã—ã°ã—ã°è¦‹ã‚‰ã‚Œã¾ã™ã€‚

ä»¥ä¸‹ã§å®šç¾©ã•ã‚Œã‚‹å¤šé …å¼ $f$ ã‚’è€ƒãˆã¾ã™ã€‚ $$ \begin{aligned} f(x) &= 0.{\small 354895765043919}{\footnotesize 841907893442112}{\scriptsize 253978848457336}{\tiny 42578125} \\ &\qquad {}+ 1.{\small 508191937815849}{\footnotesize 037463067361386}{\scriptsize 492848396301269}{\tiny 53125}\,x \\ &\qquad {}- 2.{\small 114994941673713}{\footnotesize 046981220031739}{\scriptsize 212572574615478}{\tiny 515625}\,x^2 \\ &\qquad {}+ 2.{\small 446931225635344}{\footnotesize 375746171863283}{\scriptsize 962011337280273}{\tiny 4375}\,x^3 \\ &\qquad {}- 1.{\small 834692774836130}{\footnotesize 801929812150774}{\scriptsize 523615837097167}{\tiny 96875}\,x^4 \\ &\qquad {}+ 0.{\small 784932344976639}{\footnotesize 218003811038215}{\scriptsize 644657611846923}{\tiny 828125}\,x^5 \\ &\qquad {}- 0.{\small 145263899385486}{\footnotesize 366933051272098}{\scriptsize 964545875787734}{\tiny 9853515625}\,x^6. \end{aligned} $$

ã“ã® $f$ ã«å¯¾ã—ã¦ $x_m^{1/3} \approx f(x_m)$ ãŒæˆã‚Šç«‹ã¡ã¾ã™ã€‚ $f(x_m)$ ã®è¨ˆç®—ã®éš›ã«ã¯ Hornerâ€™s method ã‚’ç”¨ã„ã¾ã™*4ã€‚$f$ ã®è¨ˆç®—ã«ã‚‚èª¤å·®ãŒå‡ºã‚‹ãŸã‚ã€Hornerâ€™s method ã«ã‚ˆã‚‹ $f(x_m)$ ã®å€¤ã¯ $\hat f(x_m)$ ã¨è¡¨è¨˜ã™ã‚‹ã“ã¨ã«ã—ã¾ã—ã‚‡ã†ã€‚

ã“ã®å¤šé …å¼ã¯ã€ãŠãã‚‰ãã¯ Remez algorithm ãªã©ã§æ±‚ã‚ãŸã®ã ã‚ã†ã¨æŽ¨æ¸¬ã—ã¦ã„ã¾ã™ã€‚ç‰¹å®šã®åŒºé–“ã«ãŠã‘ã‚‹èª¤å·®ã®æœ€å¤§å€¤ã‚’æœ€å°åŒ–ã™ã‚‹ã‚ˆã†ãªï¼ˆäºˆã‚æ±ºã‚ãŸæ¬¡æ•°ä»¥ä¸‹ã®ï¼‰è¿‘ä¼¼å¤šé …å¼ã‚’æ±‚ã‚ã‚‹ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã§ã™ã€‚ $x_m\in[0.5\lldot 1)$ ã¨ã—ã¦ã„ã‚‹ã®ã§ã€$[0.5\lldot 1)$ ã§ã®ã‚ˆã„è¿‘ä¼¼ãŒå¾—ã‚‰ã‚Œã¦ã„ã‚Œã°ã‚ˆã„ã§ã™ãã€‚

ç‚¹ç·šãŒãã®å¢ƒç•Œã€ç ´ç·šãŒè¿‘ä¼¼ã•ã‚Œã‚‹ã¹ãçœŸã®å€¤ $y=x^{1/3}$ ã§ã€èµ¤ã®å®Ÿç·šãŒä¸Šè¨˜ã®å¤šé …å¼ $y=\hat f(x)$ ã§ã™ã€‚ã‚ˆã•ãã†ãªè¦‹ãŸç›®ã‚’ã—ã¦ã„ã¾ã™ãã€‚

å¿µã®ãŸã‚ã‚‚ã†å°‘ã—è¿‘ã¥ã‘ã¦ãŠã

$\gdef\signum{\operatorname{sgn}}$

ã•ã¦ã€ã‚‚ã†å°‘ã—ã ã‘ç¶šãã¾ã™ã€‚$\signum(x)\times(\hat f(x_m)\otimes r_{x_e\rem 3})\times 2^{x_e\quot 3}$ ã‚’è¿”ã™ã‚ã‘ã§ã¯ãªã„ã§ã™ã€‚

è¿”ã™ã®ã¯ã€$u = \hat f(x_m)$ ãŠã‚ˆã³ $t_2 = u\otimes u\otimes u$ ã¨ã—ã¦ã€æ¬¡ã®å€¤ã§ã™ã€‚ $$ \signum(x)\times (u \otimes (t_2 \oplus 2x_m)\oslash(2t_2\oplus x_m)\otimes r_{x_e\rem 3})\times 2^{x_e\quot 3} $$

ã‚„ã£ã±ã‚Š $\circledast$ ã®è¡¨è¨˜ã ã¨åˆ†æ•°ãŒä½¿ãˆãªã„ã®ã§èªã¿ã«ãã„ ðŸ¥²ã€‚ è¨ˆç®—ã›ã‚“ã¨ã—ã¦ã„ã‚‹å¼ã®çµ¶å¯¾å€¤ã¯æ¬¡ã®é€šã‚Šã§ã™ï¼ˆ$\signum(x)$ ã®éƒ¨åˆ†ã¯ç…©é›‘ã«ãªã‚‹ã®ã§çœããŸã„ã§ã™ï¼‰ã€‚ $$ u\cdot\frac{u^3+2x_m}{2u^3+x_m}\cdot r_{x_e\rem 3}\times 2^{x_e\quot 3} $$

$u \xgets{\times} \tfrac{u^3+2x_m}{2u^3+x_m}$ ã§æ›´æ–°ã—ã€$u\cdot r_{x_e\rem 3}\times 2^{x_e\quot 3}$ ã‚’è¿”ãã†ã¨ã—ã¦ã„ã‚‹ã¨ã„ã†è¦‹æ–¹ã‚‚ã§ãã¾ã™ã€‚ã¨ã„ã†ã‚ã‘ã§ã€ã“ã®æ›´æ–°ã«ã¤ã„ã¦è¦‹ã¦ã„ãã¾ã™ã€‚

ã“ã‚Œã¯ã€Newtonâ€™s method ã§ã¯ãªã Halleyâ€™s method ã¨å‘¼ã°ã‚Œã‚‹åå¾©ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã®æ›´æ–°ã‚¹ãƒ†ãƒƒãƒ—ã§ã™ã€‚æ¬¡ã®ã‚ˆã†ãªæ›´æ–°ã‚’ã—ã¾ã™ã€‚ $$ x_{n+1} = x_n - \frac{2g(x_n)g'(x_n)}{2g'(x_n)^2-g(x_n)g''(x_n)} $$ ã“ã®åå¾©ã«ã‚ˆã‚Šã€$g(x) = 0$ ã®æ ¹ã‚’æ±‚ã‚ã¾ã™ã€‚ ãŸã¨ãˆã° $a$ ã® 3 ä¹—æ ¹ã‚’æ±‚ã‚ãŸã„ã¨ãã¯ $g(x) = x^3-a$ ã¨ã—ã¦è¡Œãˆã°ã‚ˆã„ã§ã™ãã€‚ $g'(x) = 3x^2$, $g''(x) = 6x$ ã§ã™ã€‚

$$ \begin{aligned} x_{n+1} &= x_n - \frac{2\cdot(x_n^3-a)\cdot 3x_n^2}{2\cdot(3x_n^2)^2-(x_n^3-a)\cdot 6x_n} \\ &= x_n - \frac{6x_n^5 - 6ax_n^2}{18x_n^4 - 6x_n^4+6ax_n} \\ &= x_n - \frac{x_n^4 - ax}{2x_n^3+a} \\ &= \frac{2x_n^4+ax_n-x^4+ax_n}{2x_n^3+a} \\ &= x_n\cdot \frac{x_n^3+2a}{2x_n^3+a} \end{aligned} $$ $(x_n, a) = (u, x_m)$ ã¨ã™ã‚‹ã“ã¨ã§ã€ä¸Šã§è¦‹ãŸå¼ã¨ä¸€è‡´ã—ã¾ã™ã€‚

$u^3$ ã‚’ t2 ã¨ã„ã†åå‰ã«ã—ãŸæ„å›³ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚ä½•ã‚‰ã‹ã®ä¸€èˆ¬çš„ãªæ‰‹æ³•ã§ä½¿ã‚ã‚Œã¦ã„ãŸè¨˜å·ã‚’æµç”¨ã—ãŸã¨ã‹ã§ã—ã‚‡ã†ã‹ã€‚

å®Œæˆ

$\signum(x)\times u\cdot r_{x_e\rem 3}\times 2^{x_e\quot 3}$ ã‚’è¿”ã—ã¾ã™ã€‚

æœ€å¾Œã® $2^{x_e\quot 3}$ ã‚’æŽ›ã‘ã‚‹ãƒ‘ãƒ¼ãƒˆã¯ã€ldexp ã¨ã„ã†æ¨™æº–é–¢æ•°ã«ã‚ˆã‚Šè¡Œã„ã¾ã™ã€‚

ä½™è«‡

ã ã£ãŸã‚‰ $f$ ãªã‚“ã¦ä½¿ã‚ãšã«æœ€åˆã‹ã‚‰ Halleyâ€™s method ã‚’ä½¿ãˆã°ã„ã„ã‚“ã˜ã‚ƒã‚“ã¨ã„ã†å£°ã‚‚èžã“ãˆã¾ã™ã€‚ ãŠãã‚‰ãã¯é™¤ç®—ãŒé‡ã„ãŸã‚é¿ã‘ã¦ã„ã‚‹ã®ã§ã¯ãªã„ã‹ãªã¨æŽ¨æ¸¬ã™ã‚‹ã¨ã“ã‚ã§ã™ã€‚

(xm, xe) = math.frexp(x)
yi = math.ldexp(xm, xe // 3)
for _ in range(4):
    yi3 = yi * yi * yi
    yi *= (yi3 + 2 * xi) / (2 * yi3 + xi)

    # yi3 = yi * yi * yi
    # yi3_xi = yi3 + xi
    # yi *= (yi3_xi + xi) / (yi3_xi + yi3)

$(0\lldot 2]$ ã®ç¯„å›²ã§ $10^{-5}$ åˆ»ã¿ã§è©¦ã—ãŸã¨ã“ã‚ã€4 å›žã®åå¾©ã§ã ã„ãŸã„ $5\times 10^{-16}$ ç¨‹åº¦ã®ç›¸å¯¾èª¤å·®ã«åŽã¾ã£ã¦ã„ãã†ã§ã—ãŸã€‚ åå¾©ãŒ 3 å›žã®ã¨ãã¯ $6\times 10^{-6}$ ãã‚‰ã„ã§ã—ãŸã€‚3 æ¬¡åŽæŸã‚‰ã—ã„ã®ã§ã€1 å›žã®åå¾©ã§ã ã„ã¶å·®ãŒå‡ºã¾ã™ãã€‚

åå¾© 1 å›žã‚ãŸã‚Š +, *, / ãŒãã‚Œãžã‚Œ 2, 5, 1 å›žï¼ˆè¨ˆç®—é †åºã‚’å¤‰ãˆã¦ yi3 + xm å…ˆã«è¨ˆç®—ã™ã‚‹ã“ã¨ã«ã—ã¦ã‚‚ 3, 3, 1 å›žï¼‰ã§ã™ã€‚ Hornerâ€™s method ã«ã‚ˆã‚‹ $\hat f$ ã®è¨ˆç®—å›žæ•°ã¯ãã‚Œãžã‚Œ 6, 6, 0 å›žï¼ˆ- ã‚‚ + ã¨ã—ã¦è¨ˆä¸Šï¼‰ãªã®ã§ã€Halleyâ€™s method 2 å›žåˆ†ã‚ˆã‚Šã‚‚ãŠå¾—ã§ã™ãã€‚é©å½“ãªåˆæœŸå€¤ã‹ã‚‰åå¾©ã™ã‚‹ã‚ˆã‚Šã‚‚ã€å¤šé …å¼ã‚’ç”¨ã„ã¦è¨ˆç®—ã™ã‚‹æ–¹ãŒãŠå¾—ã§ã™ã€‚

Halleyâ€™s method ã§åŽæŸã—ãŸå¾Œã®å€¤ã«å¯¾ã—ã¦ $r_{x_e\rem 3}$ ã‚’æŽ›ã‘ã‚‹ã®ã¯ã€æã—ã¦ã„ã‚‹ã‚ˆã†ãªæ°—ãŒã—ãªã„ã§ã‚‚ãªã„ã‚ˆã†ãªæ°—ã‚‚ã—ã¾ã™ã€‚

ã¾ãŸã€Newtonâ€™s method ã§ yi *= (2 * yi3 + xi) / (3 * yi3) ã‚’ç”¨ã„ãŸå ´åˆã¯ã€åå¾©ã‚’ 7 å›žã—ã¦ã‚‚ $4\times 10^{-12}$ ç¨‹åº¦ã®èª¤å·®ãŒã‚ã‚Šã¾ã—ãŸã€‚

å‚è€ƒæ–‡çŒ®

æ„Ÿæƒ³

ä»Šå›žã¯ glibc ã® cbrt ã‚’è¦‹ã¾ã—ã‚‡ã†ã¨ã„ã†ã ã‘ã®å›žã§ã—ãŸãŒã€ã‚„ã£ã±ã‚Šãã‚Œã ã‘ã˜ã‚ƒæº€è¶³ã§ããªãã¦ã€ï¼ˆ~~ä½¿ã„é“ãŒã©ã®ç¨‹åº¦ã‚ã‚‹ã‹ãªã‚“ã¦ã®ã¯ã•ã¦ãŠã~~ï¼‰correctly-rounded ãªå€¤ã‚’è¨ˆç®—ã§ãã‚‹ã“ã¨ã«æ†§ã‚Œã¾ã™ã‚ˆãã€‚ ç«¶ãƒ—ãƒç•Œéšˆã«ãŠã„ã¦ã¯ï¼ˆã¨ã„ã†ã‹äººé–“ç•Œã«ãŠã„ã¦ã¯ï¼‰ã€ã€Œãã‚“ãªæ¨™æº–é–¢æ•°ã®ç²¾åº¦ã‚’æ°—ã«ã™ã‚‹ã‚ˆã‚Šã€æ™®é€šã®å››å‰‡æ¼”ç®—ã§ catastrophic cancellation ã‚’èµ·ã“ã•ãªã„ã‚ˆã†ã«æ°—ã‚’ã¤ã‘ã‚‹æ–¹ãŒå…ˆã§ã™ã‚ˆã€ã¨ã„ã†ã‚±ãƒ¼ã‚¹ã®æ–¹ãŒå¤šã„ã®ã§ã€correctly-rounded ãªã‚“ã¦ã®ã¯ã¾ã å…ˆã®å…ˆã®è©±ã‹ã‚‚ã—ã‚Œãªã„ã§ã™ãŒã€äººé–“ç•Œã®äº‹æƒ…ãªã‚“ã¦ãˆã³ã¡ã‚ƒã‚“ã®çŸ¥ã£ãŸã“ã¨ã§ã¯ãªã„ã§ã™ãã€‚

è¿‘ä¼¼å¤šé …å¼ $f$ ã‚‚å¤©ä¸‹ã‚Šã§ä¸ŽãˆãŸã‚‚ã®ã‚’ä½¿ã£ãŸã ã‘ãªã®ã§ã€ã¡ã‚‡ã£ã¨ç‰©è¶³ã‚Šãªã•ã¯ã‚ã‚Šã¾ã™ã€‚ Remez algorithm ã«ã¤ã„ã¦ã‚‚æ·±æŽ˜ã‚Šã§ããŸã‚‰ã„ã„ãªã¨æ€ã£ã¦ã„ã¾ã™ã€‚

C ã‚„ IEEE 754ã€POSIX ã« C++ ã¨ã€ã•ã¾ã–ã¾ãªè¦æ ¼ã§æ€ã„æ€ã„ã®æ•°å¦é–¢æ•°ã‚’å®šç¾©ã—ã¦ãŠã‚‰ã‚Œã‚‹ã®ã§ã€ã‚ã¡ã‚ƒãã¡ã‚ƒãªå€‹æ•°ã®æ•°å¦é–¢æ•°ãŒã‚ã‚Šã¾ã™ã€‚ç‰¹ã« C++ ã¯ã‚‚ã†ã‚ã¡ã‚ƒãã¡ã‚ƒã§ã™ã€‚

æ•°å¦é–¢æ•°ãŸã¡

C ã®è¦æ ¼ã§å®šç¾©ã•ã‚Œã¦ã„ã‚‹æ•°å¦é–¢æ•°ã«ã¯ä¸‹è¨˜ãŒã‚ã‚Šã¾ã™ã€‚ãƒ“ãƒƒãƒˆæ“ä½œã‚„ãã‚Œã«é¡žã™ã‚‹ã‚‚ã®ãªã©ã¯é™¤å¤–ã—ã¦ã„ã¾ã™ã€‚

trigonometric functions
- cos $\cos(x)$, sin $\sin(x)$, tan $\tan(x)$
- acos $\arccos(x)$, asin $\arcsin(x)$, atan $\arctan(x)$
- atan2
hyperbolic functions
- acosh $\arcosh(x)$, asinh $\arsinh(x)$, atanh $\artanh(x)$
exponential and logarithmic functions
- exp $e^x$, exp2 $2^x$, expm1 $e^x-1$
- log $\ln(x)$, log10 $\log_{10}(x)$, log1p $\ln(1+x)$, log2 $\log_2(x)$
power and absolute-value functions
- cbrt $x^{1/3}$
- fabs $|x|$
- hypot $\sqrt{x^2+y^2}$
- pow $x^y$
- sqrt $\sqrt x$
error and gamma functions
- erf $\operatorname{erf}(x) = \displaystyle\frac2{\sqrt\pi}\int_0^x e^{-t^2}\,\mathrm{d}t$
- erfc $\operatorname{erfc}(x) = 1 - \operatorname{erf}(x)$
- lgamma $\ln(|\Gamma(x)|)$
- tgamma $\Gamma(x)$
nearest integer functions
- ceil $\ceil{x}$
- floor $\floor{x}$
- round, roundeven, trunc
floating multiply-add
- fma $(x\times y)+z$

IEEE Std 754-2019 ã® additional mathematical operations ã«ã¯ã€ä¸‹è¨˜ã®ã‚ˆã†ãªé–¢æ•°ã‚‚ã‚ã‚Šã¾ã™ã€‚

exp2m1 $2^x-1$, exp10 $10^x$, exp10m1 $10^x-1$
log2p1 $\log_2(1+x)$, log10p1 $\log_10(1+x)$
rSqrt $1/\sqrt{x}$
compound $(1+x)^n$
rootn $x^{1/n}$
sinPi $\sin(\pi x)$, cosPi $\cos(\pi x)$, tanPi $\tan(\pi x)$
asinPi $\arcsin(x)/\pi$, acosPi $\arccos(x)/\pi$, atanPi $\arctan(x)/\pi$
atan2Pi

POSIX ã«ã¯æ¬¡ã®é–¢æ•°ã‚‚ã‚ã‚Šã¾ã™ã€‚

C++ ã«ã‚‚ãŸãã•ã‚“ã‚ã‚Šã¾ã™ (cf. [cmath.syn])ã€‚åˆ—æŒ™ã‚’è«¦ã‚ã¾ã—ãŸã€‚ã¨ã“ã‚ã§ã“ã‚Œã„ã¤ä½¿ã†ã‚“ã§ã™ã‹ï¼Ÿ $\eod$

ãˆã€ã“ã‚Œå…¨éƒ¨ã® correctly-rounded ç‰ˆã‚’å®Ÿè£…ã•ã›ã‚‰ã‚Œã‚‹ã‚“ã§ã™ã‹...ï¼Ÿ ðŸ˜ï¼ˆcorrectly-rounded ã®æœ¬è³ªã¯ã€å®Ÿè£…ã§ã¯ãªãè¨¼æ˜Žãƒ‘ãƒ¼ãƒˆã¨ã„ã†è©±ã‚‚ã‚ã‚Šã¾ã™ã€‚ï¼‰

ãŠã‚ã‚Š

ãŠã‚ã‚Šã§ã™ã€‚

*2:ç¾å®Ÿã¨ã—ã¦ã¯ã€ãã†ã„ã†ã‚ã¡ã‚ƒãã¡ã‚ƒãªä½¿ã„æ–¹ã‚’ã—ãŸã„äººãŒå¤šãã†ãªã®ã§ã€ãã†ã„ã†ä»•æ§˜ã®æ–¹ãŒã€Œå¹¸ç¦åº¦ã€ãŒé«˜ããªã‚‹ã®ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒ...ã€‚ãã†ã„ã† ad hoc ãªæ„å‘³ä¸æ˜Žä»•æ§˜ã«ã¯ãªã£ã¦ã»ã—ããªã„ã§ã™ãã€‚

*3:ãŸã¶ã‚“ Linux kernel ã¨ã‹ã® kernel ã¨ã¯é•ã†æ–‡è„ˆã§ã€ã€Œæ ¸ã¨ãªã‚‹éƒ¨åˆ†ã ã‚ˆã€œã€ãã‚‰ã„ã ã¨è§£é‡ˆã—ã¦ã„ã¾ã™ã€‚

*4:$a_0+a_1x+a_2x^2+\cdots$ ã‚’è¨ˆç®—ã™ã‚‹éš›ã«ã€$a_0\oplus (a_1\otimes x)\oplus(a_2\otimes x\otimes x) \oplus \cdots$ ã¨ã™ã‚‹ã®ã§ã¯ãªãã€$( (\cdots\oplus a_2)\otimes x\oplus a_1)\otimes x\oplus a_0$ ã¨ã™ã‚‹æ‰‹æ³•ã€‚

ãŠã‚ã‚Š

ç´¹ä»‹

å®Ÿè£…

è³‡æ–™

ãƒ„ãƒ¼ãƒ«

ãŠã‚ã³

æœ¬é¡Œ

è€ƒå¯Ÿ

æ‰‹é †

ãŠã¾ã‘

æ‰€æ„Ÿ

ãŠã‚ã‚Š

å‰æ

ç«‹å ´

åž‹

ãƒ—ãƒªãƒŸãƒ†ã‚£ãƒ–æ¼”ç®—

æœ¬é¡Œ

frexp

ldexp

sqrt

range reduction

approximation

reconstruction

æ¬¡å›žäºˆå‘Š

ãŠã¾ã‘

æ‰€æ„Ÿ

ãŠã‚ã‚Š

å‡ºä¼šã„

æ•´æ•°åž‹ã¨ã®å¯¾æ¯”

å›ºå®šå°æ•°ç‚¹åž‹ã‚„åé€²æµ®å‹•å°æ•°ç‚¹åž‹ãªã©

èª¤å·®

æ¯”è¼ƒ

æ•°å¼ã§ã®è¨¼æ˜Ž

æ•°å­¦é–¢æ•°ãŸã¡ã«ã¤ã„ã¦

å®Ÿå‹™ï¼Ÿ

æ‰€æ„Ÿ

ãŠã‚ã‚Š

åŠ›æŠ€

æ•°å­¦

wrapping ã«é–¢ã—ã¦

ã‚ã¨ãŒã

ãŠã‚ã‚Š

å°Žå…¥

glibc å®Ÿè£…

ç²¾åº¦ï¼Ÿ

ã¾ãˆãŠã

æ–¹é‡

å®šæ•°ã®è¨ˆç®—

è¿‘ä¼¼å¤šé …å¼

å¿µã®ãŸã‚ã‚‚ã†å°‘ã—è¿‘ã¥ã‘ã¦ãŠã

å®Œæˆ

ä½™è«‡

å‚è€ƒæ–‡çŒ®

æ„Ÿæƒ³

ãŠã‚ã‚Š

ãŠã‚ã‚Š

ãŠã‚ã³

ãŠã¾ã‘

ãŠã‚ã‚Š

å‰æ

ãŠã¾ã‘

ãŠã‚ã‚Š

å‡ºä¼šã„

æ•´æ•°åž‹ã¨ã®å¯¾æ¯”

å›ºå®šå°æ•°ç‚¹åž‹ã‚„åé€²æµ®å‹•å°æ•°ç‚¹åž‹ãªã©

æ•°å¼ã§ã®è¨¼æ˜Ž

æ•°å¦é–¢æ•°ãŸã¡ã«ã¤ã„ã¦

ãŠã‚ã‚Š

æ•°å¦

wrapping ã«é–¢ã—ã¦

ã‚ã¨ãŒã

ãŠã‚ã‚Š

ã¾ãˆãŠã

æ–¹é‡

å®šæ•°ã®è¨ˆç®—

è¿‘ä¼¼å¤šé …å¼

å¿µã®ãŸã‚ã‚‚ã†å°‘ã—è¿‘ã¥ã‘ã¦ãŠã

å®Œæˆ

å‚è€ƒæ–‡çŒ®

ãŠã‚ã‚Š