Rustè£½ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ãƒžã‚·ãƒ³Daachorseã‚’ä½¿ã£ã¦Pythonãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã‚’é«˜é€ŸåŒ–ã™ã‚‹è©±

ã‚¨ãƒ ã‚¹ãƒªãƒ¼ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒªãƒ³ã‚°ã‚°ãƒ«ãƒ¼ãƒ— AIãƒ»æ©Ÿæ¢°å¦ç¿’ãƒãƒ¼ãƒ ã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã‚’ã—ã¦ã„ã‚‹ä¸æ‘(po3rin) ã§ã™ã€‚æ¤œç´¢ã¨GoãŒå¥½ãã§ã™ã€‚

ä»Šå›žã¯æ–‡å—åˆ—ç•Œéšˆã‚’è³‘ã‚ã›ã¦ã„ã‚‹é«˜é€ŸãªRustè£½ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ãƒžã‚·ãƒ³Daachorseã‚’Pythonã§å‘¼ã³å‡ºã—ã¦æ—¢å˜ã®æ–‡å—åˆ—ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒã‚¸ãƒƒã‚¯ã‚’é«˜é€ŸåŒ–ã—ãŸãŠè©±ã‚’ã—ã¾ã™ã€‚

Daachorseã¨ã¯

Daachorseã¯LegalForceã•ã‚“ã§é–‹ç™ºé‹ç”¨ã•ã‚Œã¦ã„ã‚‹æ–‡å—åˆ—ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒã‚’è¡Œã†Rustè£½ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã§ã™ã€‚

github.com

æŠ€è¡“çš„ãªãƒˆãƒ”ãƒƒã‚¯ã«é–¢ã—ã¦ã¯LegalForceã•ã‚“ã®è¨˜äº‹ãŒå…¨ã¦è§£èª¬ã—ã¦ã„ã‚‹ã®ã®ã§ãã¡ã‚‰ã‚’å‚ç…§ã—ã¦ãã ã•ã„ã€‚

tech.legalforce.co.jp

ãªãœPythonã‹ã‚‰å‘¼ã³å‡ºã—ãŸã„ã®ã‹

ã¨ã‚ã‚‹ç”¨é€”ã§æ–‡å—åˆ—ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒã®ãƒã‚¸ãƒƒã‚¯ã‚’Pythonã§çµ„ã‚“ã§ã„ãŸã®ã§ã™ãŒã€ã„ã¾ã„ã¡ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãŒæ‚ªãã€é«˜é€ŸåŒ–ã§ããšã«è‹¦ã—ã‚“ã§ã„ãŸã¨ã“ã‚Daachorseã®ãƒªãƒªãƒ¼ã‚¹ãŒã‚ã‚Šã€æ˜¯éžã¨ã‚‚ä½¿ã£ã¦ã¿ãŸã„ã¨æ€ã„ã¾ã—ãŸã€‚

ã—ã‹ã—ã€AIãƒ»æ©Ÿæ¢°å¦ç¿’ãƒãƒ¼ãƒ ã§ã¯ãƒ‡ãƒ¼ã‚¿å‡¦ç†ã‚„ãƒ¢ãƒ‡ãƒ«å¦ç¿’ã®ãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã«Pythonã®gokartã¨ã„ã†ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã‚’å…¨é¢çš„ã«åˆ©ç”¨ã—ã¦ãŠã‚Šã€åŸºæœ¬çš„ã«ä½•ã‹ã‚’å®Ÿè£…ã™ã‚‹ã¨ãã¯Pythonã§é–‹ç™ºã•ã‚Œã‚‹ã“ã¨ãŒå¤šã„ã§ã™ã€‚gokartã«ç¾è¡Œã®ãƒ‡ãƒ¼ã‚¿å‡¦ç†ãƒã‚¸ãƒƒã‚¯ãŒä¹—ã£ã¦ã„ã‚‹ä»¥ä¸Šã€å…¨ã¦ã‚’Rustã§æ›¸ãæ›ãˆã‚‹ã®ã¯ã‹ãªã‚Šã®å¤§å·¥äº‹ã§ã™ã€‚ãã“ã§ãƒã‚¸ãƒƒã‚¯éƒ¨åˆ†ã ã‘Rustã§æ›¸ãç›´ã—ã¦é«˜é€ŸåŒ–ã§ããªã„ã‹ã¨è€ƒãˆã¾ã—ãŸã€‚

ãã—ã¦èª¿ã¹ã¦ã¿ã‚‹ã¨Daachorseã®Pythonãƒã‚¤ãƒ³ãƒ‡ã‚£ãƒ³ã‚°å…¬é–‹ã•ã‚Œã¦ã„ãŸã®ã§ã€ã“ã¡ã‚‰ã‚’åˆ©ç”¨ã™ã‚‹ã“ã¨ã«ã—ã¾ã—ãŸã€‚

github.com

python-daachorseã§ã¯PyO3ã‚’åˆ©ç”¨ã—ã¦ã„ã‚‹ã‚ˆã†ãªã®ã§ã€ã‚‚ã—Pythonãƒã‚¸ãƒƒã‚¯ã‚’Rustã§æ›¸ãç›´ã—ãŸã„ã¨ã„ã†æ¬²æ±‚ãŒã‚ã‚‹å ´åˆã¯ä½¿ã£ã¦ã¿ã¦ãã ã•ã„ã€‚

github.com

åƒ•è‡ªèº«ã‚‚Pythonã§Rustã®å‡¦ç†ã‚’å‘¼ã¶æ–¹æ³•ã‚’å‹‰å¼·ã—ãŸã‹ã£ãŸã®ã§ã€å®Ÿéš›ã«Daachorseã‚’PyO3çµŒç”±ã§å‘¼ã³å‡ºã™ã‚·ãƒ³ãƒ—ãƒ«ãªã‚µãƒ³ãƒ—ãƒ«å®Ÿè£…ã‚’è©¦ã—ã¦ã¿ã¾ã—ãŸã€‚PyO3ã®å…¥é–€ã®å‚è€ƒã«ãªã‚Œã°ã€‚

github.com

ä»Šå›žã¯python-daachorseã‚’ä½¿ã„ã€å®Ÿéš›ã«ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’å–ã‚Šã€å®Ÿæˆ¦æŠ•å…¥ã§ãã‚‹ã‹ã‚’èª¿æŸ»ã—ã¾ã—ãŸã€‚

ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ã®ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

å¼Šç¤¾ã®å®Ÿéš›ã«ACãƒžã‚·ãƒ³ãŒä½¿ã‚ã‚Œã¦ã„ã‚‹å‡¦ç†ã‚’å¯¾è±¡ã«python-daachorseãŒæˆ‘ã€…ã®æ¡ä»¶ä¸‹ã§ã‚‚ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãŒå‡ºã›ã‚‹ã‹ã‚’ç¢ºèªã—ã¾ã™ã€‚Daachorseã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã¯Word100K/UniDicãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆä¸¡æ–¹ã§ã™ã§ã«å…¬é–‹ã•ã‚Œã¦ã„ã¾ã™ãŒã€ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’æ”¹ã‚ã¦ã¨ã£ãŸç†ç”±ã¨ã—ã¦ã¯ä¸‹è¨˜ãŒæŒ™ã’ã‚‰ã‚Œã¾ã™ã€‚

Pythonãƒ©ãƒƒãƒ‘ãƒ¼çµŒç”±ã®å‘¼ã³å‡ºã—ã‚‚å«ã‚ãŸãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãŒçŸ¥ã‚ŠãŸã‹ã£ãŸ
å®Ÿéš›ã®å¼Šç¤¾ã®ãƒ‘ã‚¿ãƒ¼ãƒ³é›†åˆã§ã‚‚ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãŒå‡ºã›ã‚‹ã‹çŸ¥ã‚ŠãŸã‹ã£ãŸ
ç¾åœ¨ä½¿ã£ã¦ã„ã‚‹pyahocorasickã¨ã®æ¯”è¼ƒãŒçŸ¥ã‚ŠãŸã‹ã£ãŸ

ãƒ™ãƒ¼ã‚¹ãƒ©ã‚¤ãƒ³ã¯å¼Šç¤¾ã®ç¾è¡Œãƒã‚¸ãƒƒã‚¯ã§åˆ©ç”¨ã•ã‚Œã¦ã„ã‚‹pyahocorasickã¨ã„ã†Pythonãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã¨ã€Pure Pythonå®Ÿè£…ã®ahocorapyã€ãã—ã¦Daachorseã¨åŒã˜Rust Crateã®Pythonãƒã‚¤ãƒ³ãƒ‡ã‚£ãƒ³ã‚°ã§ã‚ã‚‹ahocorasick_rsã§ã™ã€‚

pyahocorasick

github.com

ahocorapy

github.com

ahocorasick_rs

github.com

ä»Šå›žã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã§ã¯ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰ã¯å«ã‚ãšã€ç´”ç²‹ãªãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒã®ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’ã¨ã‚Šã¾ã—ãŸã€‚

ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ç’°å¢ƒ

platform darwin -- Python 3.9.0, pytest-7.1.1, pluggy-1.0.0
benchmark: 3.4.1 (defaults: timer=time.perf_counter disable_gc=False min_rounds=5 min_time=0.000005 max_time=1.0 calibration_precision=10 warmup=False warmup_iterations=100000)

ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã®ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã¯ã“ã¡ã‚‰

pyahocorasick = "^1.4.4"
daachorse = "^0.1.3"
ahocorapy = "^1.6.1"
ahocorasick-rs = "^0.12.2"

ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã¯ä¸‹è¨˜ã«ãªã‚Šã¾ã™ã€‚

è‡ªç¤¾ã§æŒã¤æ—¥æœ¬èªžã®åŒ»ç™‚ç³»ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆ
ãƒ‘ã‚¿ãƒ¼ãƒ³æ•°: 22948(å¼Šç¤¾ã®ã¨ã‚ã‚‹åŒ»ç™‚è¾žæ›¸)
ãƒ†ã‚ã‚¹ãƒˆæ•°: 5094(å¼Šç¤¾ã®ã¨ã‚ã‚‹æ–‡æ›¸ãƒ‡ãƒ¼ã‚¿)

ã¾ãŸã€ãƒ‘ã‚¿ãƒ¼ãƒ³ã¨ãƒ†ã‚ã‚¹ãƒˆæ•°ã¯ãã‚Œãžã‚Œä¸‹è¨˜ã®ã‚ˆã†ãªæ–‡å—åˆ—é•·ã®åˆ†å¸ƒã«ãªã£ã¦ã„ã¾ã™ã€‚

ãƒ‘ã‚¿ãƒ¼ãƒ³ã®æ–‡å—åˆ—é•·ã®ãƒ’ã‚¹ãƒˆã‚°ãƒ©ãƒ

ãƒ†ã‚ã‚¹ãƒˆã®æ–‡å—åˆ—é•·ãƒ’ã‚¹ãƒˆã‚°ãƒ©ãƒ

ãã—ã¦ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚³ãƒ¼ãƒ‰ã§ã™ã€‚

import daachorse
import ahocorasick
import ahocorasick_rs
from ahocorapy.keywordtree import KeywordTree


def get_data() -> (list[str], list[str]):
    // ä½•ã‹ã—ã‚‰ç´ æ•µãªãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’è¿”ã™


def substr_match_ahocorasick(automaton: any, haystacks: list[str]):
    for haystack in haystacks:
        x = list(automaton.iter(haystack))
    return x


def substr_match_ahocorapy(automaton: any, haystacks: list[str]):
    result = [automaton.search(t) for t in haystacks]
    return result


def substr_match_with_ahocorasick_rs(automaton: any, haystacks: list[str]):
    result = [automaton.find_matches_as_indexes(t) for t in haystacks]
    return result


def substr_match_with_daachorse(automaton: any, haystacks: list[str]):
    result = [automaton.find_overlapping(t) for t in haystacks]
    return result


def test_match_ahocorasick_benchmark(benchmark):
    patterns, haystacks = get_data()

    automaton = ahocorasick.Automaton()
    for idx, key in enumerate(patterns):
        automaton.add_word(key, (idx, key))
    automaton.make_automaton()

    ret = benchmark(substr_match_ahocorasick, automaton=automaton, haystacks=haystacks)
    assert len(ret)!=0


def test_match_ahocorapy_benchmark(benchmark):
    patterns, haystacks = get_data()

    automaton = KeywordTree(case_insensitive=True)
    for idx, key in enumerate(patterns):
        automaton.add(key)
    automaton.finalize()

    ret = benchmark(substr_match_ahocorapy, automaton=automaton, haystacks=haystacks)
    assert len(ret)!=0


def test_match_ahocorasick_rs_benchmark(benchmark):
    patterns, haystacks = get_data()

    automaton = ahocorasick_rs.AhoCorasick(patterns)

    ret = benchmark(substr_match_with_ahocorasick_rs, automaton=automaton, haystacks=haystacks)
    assert len(ret)!=0


def test_match_daachorse_benchmark(benchmark):
    patterns, haystacks = get_data()

    automaton = daachorse.Automaton(patterns)

    ret = benchmark(substr_match_with_daachorse, automaton=automaton, haystacks=haystacks)
    assert len(ret)!=0

çµæžœã¯ä¸‹è¨˜ã«ãªã‚Šã¾ã™ã€‚

-------------------------------------------------------------------------------------------------- benchmark: 4 tests -------------------------------------------------------------------------------------------------
Name (time in ms)                              Min                   Max                  Mean              StdDev                Median                 IQR            Outliers      OPS            Rounds  Iterations
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
test_match_daachorse_benchmark             80.8431 (1.0)        147.8423 (1.0)         93.7325 (1.0)       19.8576 (1.0)         86.4954 (1.0)       11.9653 (1.12)          1;1  10.6687 (1.0)          10           1
test_match_ahocorasick_rs_benchmark       123.6172 (1.53)       412.8799 (2.79)       179.8610 (1.92)     114.3097 (5.76)       136.1129 (1.57)      10.6961 (1.0)           1;1   5.5598 (0.52)          6           1
test_match_ahocorasick_benchmark          736.3777 (9.11)       901.6807 (6.10)       776.5008 (8.28)      70.4611 (3.55)       745.9376 (8.62)      54.7538 (5.12)          1;1   1.2878 (0.12)          5           1
test_match_ahocorapy_benchmark          1,339.0980 (16.56)    3,124.5482 (21.13)    1,908.8495 (20.36)    744.7254 (37.50)    1,565.3466 (18.10)    979.0138 (91.53)         1;0   0.5239 (0.05)          5           1
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Daachorseç´ æ•µã§ã™ã€‚Meanã§ã®æ¯”è¼ƒã§ã¯ç¾è¡Œã®pyahocorasickã‚ˆã‚Šã‚‚8å€é€Ÿã„ã§ã™ã€‚ã¾ãŸã€åŒã˜Rustå®Ÿè£…ã®Pythonãƒã‚¤ãƒ³ãƒ‡ã‚£ãƒ³ã‚°ã‚ˆã‚Šã‚‚é€Ÿã„ã¨ã„ã†çµæžœã«ãªã‚Šã¾ã—ãŸã€‚ã“ã®çµæžœã‹ã‚‰å®Ÿè·µæŠ•å…¥ã§ååˆ†æ´»èºã§ãã‚‹ã¨åˆ¤æ–ã—ã¾ã—ãŸã€‚

python-daachorseã ã‘ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰è¾¼ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

å¼Šç¤¾ã§ã¯gokartã§ãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã‚’æ§‹ç¯‰ã—ã¦ã„ã‚‹ã®ã§ã€1å›žæ§‹ç¯‰ã—ãŸã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³ã¯gokartã‚ãƒ£ãƒƒã‚·ãƒ¥(pickle)ã¨ã—ã¦ä¿å˜ã—ã¦ãŠããŸã„ã¨ã“ã‚ã§ã™ã€‚ã—ã‹ã—ã€builtins.Automatonã¯pickleã§ä¿å˜ãŒã§ãã¾ã›ã‚“ã€‚é–‹ç™ºè€…ã‹ã‚‰ã‚³ãƒ¡ãƒ³ãƒˆã‚’ã„ãŸã ã„ãŸé€šã‚Šã€serialize/deserializeã‚’python-daachorseãŒWrapã—ã¦ã„ãªã„ãŸã‚ã§ã™ã€‚

serialize/deserializeã¯unsafeãªã®ã§ãƒ©ãƒƒãƒ‘ãƒ¼ã‚’æ›¸ããŸããªã„ã‚“ã§ã™ã‚ˆãã€‚daachorseã®ä¸ã§ã¯æ‰€ã€…get_uncheckedã‚’ä½¿ã£ã¦ã„ã¦ã€ä¿¡é ¼ã§ããªã„ãƒ‡ãƒ¼ã‚¿ã‚’deserializeã—ãŸéš›ã«ä½•ãŒèµ·ã“ã‚‹ã‹åˆ†ã‹ã‚‰ãªã„ã®ã§ã€‚
— æ°´å…ˆæ¡ˆå†…äººï¼ æ±Ÿæˆ¸å· (@vbkaisetsu) 2022å¹´9æœˆ25æ—¥

unsafe Rustã«é–¢ã—ã¦ã¯ä¸‹è¨˜ã®The Rust Programming Language æ—¥æœ¬èªžç‰ˆã®ã‚¬ã‚¤ãƒ‰ãŒéžå¸¸ã«å‹‰å¼·ã«ãªã‚Šã¾ã™ã€‚

doc.rust-jp.rs

unsafeãªã‚³ãƒ¼ãƒ‰ã‚’ã§ãã‚‹ã ã‘åˆ†é›¢ã™ã‚‹ãŸã‚ã«ã€unsafeãªã‚³ãƒ¼ãƒ‰ã‚’å®‰å…¨ãªæŠ½è±¡ã®ä¸ã«é–‰ã˜è¾¼ã‚ã€å®‰å…¨ãªAPIã‚’æä¾›ã™ã‚‹ã®ãŒæœ€å–„ã§ã™ã€‚... æ¨™æº–ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®ä¸€éƒ¨ã¯ã€ æ¤œæŸ»ã•ã‚ŒãŸunsafeã‚³ãƒ¼ãƒ‰ã®å®‰å…¨ãªæŠ½è±¡ã¨ã—ã¦å®Ÿè£…ã•ã‚Œã¦ã„ã¾ã™ã€‚å®‰å…¨ãªæŠ½è±¡ã«unsafeãªã‚³ãƒ¼ãƒ‰ã‚’åŒ…ã‚€ã“ã¨ã§ã€ unsafeãŒã€ã‚ãªãŸã‚„ã‚ãªãŸã®ãƒ¦ãƒ¼ã‚¶ãŒunsafeã‚³ãƒ¼ãƒ‰ã§å®Ÿè£…ã•ã‚ŒãŸæ©Ÿèƒ½ã‚’ä½¿ã„ãŸãŒã‚‹å¯èƒ½æ€§ã®ã‚ã‚‹ç®‡æ‰€å…¨éƒ¨ã«æ¼ã‚Œå‡ºã‚‹ã“ã¨ã‚’é˜²ãŽã¾ã™ã€‚

unsafe Rustã®ã‚¬ã‚¤ãƒ‰ã®é€šã‚Šã€python-daachorseã§ã¯å®‰å…¨ãªAPIã‚’æä¾›ã™ã‚‹ãŸã‚ã«unsafeã‚’å®‰å…¨ãªæŠ½è±¡ã§åŒ…ã‚“ã§ã„ãã¨ã„ã†æ„å›³ãŒã‚ã‚‹ã‚ˆã†ã§ã™ã€‚

ã‚†ãˆã«python-daachorseã§ã¯ãƒ—ãƒã‚»ã‚¹ã‚’å®Ÿè¡Œã™ã‚‹ãŸã³ã«æ¯Žå›žã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³ã‚’æ§‹ç¯‰ã—ç›´ã™å¿…è¦ãŒã‚ã‚Šã¾ã™ã€‚ãã®ãŸã‚å®Ÿè·µæŠ•å…¥ã®ãŸã‚ã«ã¯ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰ã‚‚å«ã‚ãŸãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚‚å–ã‚‹å¿…è¦ãŒã‚ã‚Šã¾ã—ãŸã€‚

å…ˆã»ã©ã®ã‚³ãƒ¼ãƒ‰ã«ã‚‚ã†1ã¤ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’è¿½åŠ ã—ã¾ã™ã€‚ã“ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã§ã¯ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰ã‚‚å«ã‚“ã§ã„ã¾ã™ã€‚

def substr_match_with_daachorse_build_automaton(patterns: list[str], haystacks: list[str]):
    automaton = daachorse.Automaton(patterns)
    result = [automaton.find_overlapping(t) for t in haystacks]
    return result


def test_match_daachorse_with_build_automaton_benchmark(benchmark):
    patterns, haystacks = get_data()
    ret = benchmark(substr_match_with_daachorse_build_automaton, patterns=patterns, haystacks=haystacks)
    assert len(ret)!=0

çµæžœã§ã™ã€‚

----------------------------------------------------------------------------------------------------- benchmark: 5 tests ----------------------------------------------------------------------------------------------------
Name (time in ms)                                            Min                 Max                Mean             StdDev              Median                IQR            Outliers      OPS            Rounds  Iterations
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
test_match_daachorse_benchmark                           49.9756 (1.0)       66.1039 (1.0)       54.0174 (1.0)       5.1499 (7.58)      51.5605 (1.0)       5.7571 (15.38)         3;1  18.5126 (1.0)          16           1
test_match_ahocorasick_rs_benchmark                      66.9054 (1.34)      68.9367 (1.04)      67.4963 (1.25)      0.6794 (1.0)       67.3037 (1.31)      0.3743 (1.0)           2;2  14.8156 (0.80)         12           1
test_match_daachorse_with_build_automaton_benchmark     112.0056 (2.24)     144.7642 (2.19)     127.7381 (2.36)     13.8674 (20.41)    133.4831 (2.59)     25.1129 (67.09)         3;0   7.8285 (0.42)          7           1
test_match_ahocorasick_benchmark                        497.1756 (9.95)     501.2648 (7.58)     499.6143 (9.25)      1.8371 (2.70)     500.4676 (9.71)      3.1697 (8.47)          1;0   2.0015 (0.11)          5           1
test_match_ahocorapy_benchmark                          650.2134 (13.01)    652.2055 (9.87)     651.1910 (12.06)     0.8694 (1.28)     651.2392 (12.63)     1.5757 (4.21)          2;0   1.5356 (0.08)          5           1
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰è¾¼ã¿ã§ã‚‚ç¾åœ¨åˆ©ç”¨ã—ã¦ã„ã‚‹pyahocorasickã®ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰ã‚¹ã‚ãƒƒãƒ—ã‚ˆã‚Š3å€ä»¥ä¸Šé€Ÿã„ï¼å„ªç§€ã ï¼ã“ã®çµæžœã‹ã‚‰ã€ãƒ—ãƒã‚»ã‚¹ã‚’èµ·å‹•ã™ã‚‹ãŸã³ã«æ¯Žå›žã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰ã—ã¦ã‚‚ãŠé‡£ã‚ŠãŒæ¥ã‚‹ã®ã§ã€DaachorseæŽ¡ç”¨ã«èˆµã‚’å–ã‚Šã¾ã—ãŸã€‚

ã¾ã¨ã‚

ä»Šå›žã¯Daachorseã§æ—¢å˜ã®pyahocorasickã‚’ä½¿ã£ãŸãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒã‚’é«˜é€ŸåŒ–ã™ã‚‹è©±ã‚’ç´¹ä»‹ã—ã¾ã—ãŸã€‚ãƒ‡ãƒ¼ã‚¿ã«ã‚ˆã£ã¦ã¯ä»–ã®ãƒ¢ã‚¸ãƒ¥ãƒ¼ãƒ«ã®æ–¹ãŒé«˜é€Ÿã®å ´åˆã‚‚ã‚ã‚‹ã®ã§ã€å°Žå…¥å‰ã«ã¯ä»Šå›žã®ã‚ˆã†ã«ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ã‚’ã¨ã£ã¦èª¿ã¹ã¦ã¿ã‚‹ã¨è‰¯ã„ã§ã—ã‚‡ã†ã€‚å€‹äººçš„ã«ã¯ã“ã®èª¿æŸ»ã®ä¸ã§ã€Rustã‚’PyO3ã‚’ä½¿ã£ã¦Pythonã§å‘¼ã³å‡ºã™æ–¹æ³•ã‚„ã€unsafe Rustã«ã¤ã„ã¦éžå¸¸ã«å‹‰å¼·ã«ãªã‚Šã¾ã—ãŸã€‚

We are Hiring!

ã‚¨ãƒ ã‚¹ãƒªãƒ¼ã§ã¯æ–‡å—åˆ—å‡¦ç†ã€è‡ªç„¶è¨€èªžå‡¦ç†ã§åŒ»ç™‚ã«è²¢çŒ®ã—ã¦ã„ããŸã„ãƒ¡ãƒ³ãƒãƒ¼ã‚’å‹Ÿé›†ã—ã¦ã„ã¾ã™ã€‚ ã€Œã¡ã‚‡ã£ã¨è©±ã‚’èžã„ã¦ã¿ãŸã„ã‹ã‚‚ã€ã¨ã„ã†äººã¯ã“ã¡ã‚‰ã‹ã‚‰ï¼

jobs.m3.com

ãã®ä»–

ã‚«ãƒãƒ¼ç”»åƒã¯Unsplashã®British Libraryã®ç”»åƒã§ã™ã€‚ã‚ã‚ŠãŒã¨ã†ã”ã–ã„ã¾ã™ã€‚

ã‚¨ãƒ ã‚¹ãƒªãƒ¼ãƒ†ãƒƒã‚¯ãƒ–ãƒã‚°

ã‚¨ãƒ ã‚¹ãƒªãƒ¼(m3)ã®ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒ»é–‹ç™ºãƒ¡ãƒ³ãƒãƒ¼ã«ã‚ˆã‚‹æŠ€è¡“ãƒ–ãƒã‚°ã§ã™

Rustè£½ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ãƒžã‚·ãƒ³Daachorseã‚’ä½¿ã£ã¦Pythonãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã‚’é«˜é€ŸåŒ–ã™ã‚‹è©±

Daachorseã¨ã¯

ãªãœPythonã‹ã‚‰å‘¼ã³å‡ºã—ãŸã„ã®ã‹

ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ã®ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

python-daachorseã ã‘ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰è¾¼ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

ã¾ã¨ã‚

We are Hiring!

ãã®ä»–

Daachorseã¨ã¯

ãªãœPythonã‹ã‚‰å‘¼ã³å‡ºã—ãŸã„ã®ã‹

ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ã®ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

python-daachorseã ã‘ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰è¾¼ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

ã¾ã¨ã‚

We are Hiring!

ãã®ä»–

Daachorseã¨ã¯

ãªãœPythonã‹ã‚‰å‘¼ã³å‡ºã—ãŸã„ã®ã‹

ãƒ‘ã‚¿ãƒ¼ãƒ³ãƒžãƒƒãƒãƒ³ã‚°ã®ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

python-daachorseã ã‘ã‚ªãƒ¼ãƒˆãƒžãƒˆãƒ³æ§‹ç¯‰è¾¼ã¿ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯

ã¾ã¨ã‚

ãã®ä»–