2023/06/20

Elasticsearchã‚’CPUåˆ©ç”¨çŽ‡ã§ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã•ã›ã‚‹

Author:: mrkm4ntr

Â ,Â 2023/06/20

Elasticsearchã‚’CPUåˆ©ç”¨çŽ‡ã§ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã•ã›ã‚‹

ã“ã‚“ã«ã¡ã¯ã€‚search infraãƒãƒ¼ãƒ ã®mrkm4ntrã§ã™ã€‚
æˆ‘ã€…ã®ãƒãƒ¼ãƒ ã§ã¯æ¤œç´¢åŸºç›¤ã¨ã—ã¦Elasticsearchã‚¯ãƒ©ã‚¹ã‚¿ã‚’Kubernetesä¸Šã§å¤šæ•°é‹ç”¨ã—ã¦ã„ã¾ã™ã€‚ã“ã‚Œã‚‰ã®Elasticsearchã‚¯ãƒ©ã‚¹ã‚¿ã‚’ç®¡ç†ã—ã¦ã„ã‚‹namespaceã¯ãƒžãƒ«ãƒãƒ†ãƒŠãƒ³ãƒˆãªæˆ‘ã€…ã®Kubernetesã‚¯ãƒ©ã‚¹ã‚¿ã®ä¸ã§æœ€å¤§ã®ãƒªã‚½ãƒ¼ã‚¹ã‚’è¦æ±‚ã—ã¦ã„ã‚‹namespaceã§ã™ã€‚

ä¸€æ–¹ã§ã‚¯ãƒ©ã‚¹ã‚¿ã®ã‚µã‚¤ã‚ºã‚’ãƒ”ãƒ¼ã‚¯ã‚¿ã‚¤ãƒ ã«åˆã‚ã›ã¦å›ºå®šã—ã¦ã„ãŸãŸã‚ã€ãã®ãƒªã‚½ãƒ¼ã‚¹åˆ©ç”¨çŽ‡ã¯éžå¸¸ã«ä½Žã„ã¨ã„ã†å•é¡ŒãŒã‚ã‚Šã¾ã—ãŸã€‚Elasticsearch Enterpriseã‚„Elastic Cloudã«ã¯ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°æ©Ÿèƒ½ãŒå˜åœ¨ã™ã‚‹ã®ã§ã™ãŒã€ã“ã‚Œã¯ã‚¹ã‚±ãƒ¼ãƒ«ã‚¤ãƒ³/ã‚¢ã‚¦ãƒˆã®ãŸã‚ã®ã‚‚ã®ã§ã¯ãªãã€ãƒ‡ã‚£ã‚¹ã‚¯ã‚µã‚¤ã‚ºã«é–¢ã™ã‚‹ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ãƒƒãƒ—/ãƒ€ã‚¦ãƒ³ã‚’æä¾›ã™ã‚‹ã‚‚ã®ã§æˆ‘ã€…ã®è¦æ±‚ã‚’æº€ãŸã™ã‚‚ã®ã§ã¯ã‚ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚

ãã“ã§ä»Šå›žã¯ã€HPAã‚’ç”¨ã„ãŸã‚¹ã‚±ãƒ¼ãƒ«ã‚¤ãƒ³/ã‚¢ã‚¦ãƒˆã®ãŸã‚ã®ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã®ä»•çµ„ã¿ã‚’é–‹ç™ºã—ã¾ã—ãŸã€‚ã“ã‚Œã«ã‚ˆã£ã¦ãƒªã‚½ãƒ¼ã‚¹åˆ©ç”¨çŽ‡ã‚’å‘ä¸Šã•ã›ã€ç´„40%ã®ã‚³ã‚¹ãƒˆå‰Šæ¸›ã‚’é”æˆã§ããŸã®ã§ã€ãã®è©³ç´°ã«ã¤ã„ã¦èª¬æ˜Žã—ã¾ã™ã€‚

Elasticsearchã¨ECK

ãƒ¡ãƒ«ã‚«ãƒªã§ã¯Elasticsearchã‚’ECK(https://github.com/elastic/cloud-on-k8s) ã‚’ç”¨ã„ã¦Kubernetesä¸Šã§ç®¡ç†ã—ã¦ã„ã¾ã™ã€‚ECKã¯Elasticsearchã¨ã„ã†Custom Resourceã¨ãã®controllerã§ã‚ã‚Šã€ä»¥ä¸‹ã®ã‚ˆã†ãªãƒªã‚½ãƒ¼ã‚¹ã‚’ä½œæˆã™ã‚‹ã¨å¯¾å¿œã—ãŸStatefuleSetã‚„Serviceã€ConfigMapãŠã‚ˆã³Secretãªã©ã®ãƒªã‚½ãƒ¼ã‚¹ãŒè‡ªå‹•ã§ä½œæˆã•ã‚Œã¾ã™ã€‚

apiVersion: elasticsearch.k8s.elastic.co/v1
kind: Elasticsearch
metadata:
  name: example
spec:
  version: 8.8.1
  nodeSets:
  - name: coordinating
    count: 2
  - name: master
    count: 3
  - name: data
    count: 6

ã“ã®å®šç¾©ã‹ã‚‰coordinatingã€masterã€dataã®3ã¤ã®StatefulSetãŒä½œæˆã•ã‚Œã¾ã™ã€‚

Horizontal Pod Autoscaler(HPA)ã‚’ä½¿ã£ã¦ã“ã‚Œã‚‰ã®StatefulSetã‚’ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã•ã›ãŸã„ã®ã§ã™ãŒã€ä»¥ä¸‹ã®ã‚ˆã†ãªèª²é¡ŒãŒã‚ã‚Šã¾ã™ã€‚

Elasticsearchãƒªã‚½ãƒ¼ã‚¹è‡ªä½“ã‚’HPAã®å¯¾è±¡ã¨ã¯ã§ããªã„ã€‚ãªãœãªã‚‰scale subresource(å¾Œè¿°)ãŒå®šç¾©ã•ã‚Œã¦ã„ãªã„ãŸã‚ã€è¤‡æ•°ã‚ã‚‹nodeSetã®ã©ã‚Œã‚’å¢—æ¸›ã•ã›ã‚Œã°è‰¯ã„ã®ã‹ã‚ã‹ã‚‰ãªã„ã€‚
Elasticsearchã‚’ã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã™ã‚‹éš›ã¯Podæ•°ã®å¢—æ¸›ã ã‘ã§ã¯ãªãã€ãã®Podã«é…ç½®ã•ã‚Œã‚‹Elasticsearchã®indexã‚‚ãƒ¬ãƒ—ãƒªã‚«æ•°ã‚’å¤‰æ›´ã—ã¦å¢—æ¸›ã•ã›ãªã‘ã‚Œã°ãªã‚‰ãªã„ã€‚ã¤ã¾ã‚Šã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã®å˜ä½ã¯ (indexã®shardæ•° / Podã‚ãŸã‚Šã®shardæ•°)ã¨ãªã‚‹ã€‚ä¸‹å›³ã®å ´åˆã¯ (3 / 1) = 3ã€‚ ä¸€æ–¹HPAã¯minReplicasã‹ã‚‰maxReplicasã¾ã§ã®é–“ã®ä»»æ„ã®å€¤ã‚’æŒ‡å®šã™ã‚‹å¯èƒ½æ€§ãŒã‚ã‚‹ã€‚ã“ã®å ´åˆã€Elasticsearchã®auto_expand_replicasã‚ªãƒ—ã‚·ãƒ§ãƒ³ã¯Podã‚ãŸã‚Šã®shardæ•° = indexã®shardæ•°ã¨ãªã‚Šã€1Podã‚ãŸã‚Š3ã¤ã®shardãŒä¹—ã£ã¦ã—ã¾ã†ã®ã§æˆ‘ã€…ã®ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã«ã¯åˆã‚ãªã„ãŸã‚ã€è‡ªåˆ†ã§ãƒ¬ãƒ—ãƒªã‚«æ•°ã‚’å¤‰æ›´ã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã€‚
Elasticsearchãƒªã‚½ãƒ¼ã‚¹ã®ç®¡ç†ä¸‹ã®StatefulSetã‚’ç›´æŽ¥HPAã®å¯¾è±¡ã¨ã—ãŸå ´åˆã€2ã®å•é¡Œã«åŠ ãˆã€è¦ªãƒªã‚½ãƒ¼ã‚¹ã§ã‚ã‚‹Elasticsearchã‚’æ›´æ–°ã—ãŸå ´åˆã«HPAã«ã‚ˆã£ã¦èª¿æ•´ã•ã‚Œã¦ã„ãŸPodæ•°ãŒè¦ªãƒªã‚½ãƒ¼ã‚¹ã®å€¤ã«ãƒªã‚»ãƒƒãƒˆã•ã‚Œã¦ã—ã¾ã†ã€‚

ã“ã‚Œã‚‰ã®å•é¡Œã‚’è§£æ±ºã™ã‚‹ãŸã‚ã«æ–°ã—ãKubernetesã®Custom Resourceã¨controllerã‚’ä½œæˆã—ã¾ã—ãŸã€‚

Custom Resourceã¨controller

ä»¥ä¸‹ãŒæ–°ãŸã«å°Žå…¥ã—ãŸCustom Resourceã®ä¾‹ã§ã™ã€‚

apiVersion: search.mercari.in/v1alpha1
kind: ScalableElasticsearchNodeSet
metadata:
  name: example
spec:
  clusterName: example
  count: 6
  index:
    name: index1
    shardsPerNode: 1
  nodeSetName: data

ã“ã‚Œã¯å…ˆã»ã©ã®Elasticsearchãƒªã‚½ãƒ¼ã‚¹ã®dataã¨ã„ã†åå‰ã®nodeSetã«å¯¾å¿œã—ã¾ã™ã€‚ã“ã®ãƒªã‚½ãƒ¼ã‚¹ã¯ç›´æŽ¥Elasticsearchãƒªã‚½ãƒ¼ã‚¹ã¨ã®è¦ªåé–¢ä¿‚ã¯ãªãã€scale subresourceã‚’æä¾›ã—ã¦ãŠã‚Šã€ kubectl scaleã‚³ãƒžãƒ³ãƒ‰ã‚„HPAã®å¯¾è±¡ã¨ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚Custom Resourceã®å®šç¾©ã¯kubebuilderã‚’ç”¨ã„ã¦ç”Ÿæˆã—ã¦ã„ã‚‹ã®ã§ã™ãŒã€ä»¥ä¸‹ã®ã‚ˆã†ãªã‚³ãƒ¡ãƒ³ãƒˆã‚’è¿½åŠ ã™ã‚‹ã“ã¨ã§scale subresourceã‚’æä¾›ã§ãã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

//+kubebuilder:subresource:scale:specpath=.spec.count,statuspath=.status.count,selectorpath=.status.selector

ã“ã‚Œã¯ä¸Šè¨˜ã®ScalableElasticsearchNodeSetã®.spec.countãŒHPAã‚„kubectl scaleã‚³ãƒžãƒ³ãƒ‰ã®æ“ä½œå¯¾è±¡ã§ã‚ã‚‹ã“ã¨ã‚’ç¤ºã—ã€.status.countã«ç¾åœ¨ã®countæ•°ãŒè¨˜éŒ²ã•ã‚Œã‚‹ã“ã¨ã‚’æ„å‘³ã—ã¾ã™ã€‚ã•ã‚‰ã«.status.selectorã«ã“ã®ãƒªã‚½ãƒ¼ã‚¹ã®ç®¡ç†å¯¾è±¡ã€ã™ãªã‚ã¡å¯¾è±¡ã®StatefulSetã®ç®¡ç†å¯¾è±¡ã‚’é¸æŠžã™ã‚‹ãŸã‚ã®selectorãŒè¨˜éŒ²ã•ã‚Œã¾ã™ã€‚ã“ã‚Œã‚‰ã¯å‹¿è«–è‡ªå‹•ã§è¨˜éŒ²ã•ã‚Œã‚‹ã‚ã‘ã§ã¯ãªãã€ãã†ãªã‚‹ã‚ˆã†ã«è‡ªåˆ†ã§controllerã‚’å®Ÿè£…ã—ãªã‘ã‚Œã°ãªã‚Šã¾ã›ã‚“ã€‚

ã¾ãŸã€ã“ã®Custom Resourceã®specå†…ã®countã€shardsPerNodeãŠã‚ˆã³å¯¾è±¡ã¨ãªã‚‹indexã®shardæ•°ã‹ã‚‰å®Ÿéš›ã®StatefulSetã®ãƒ¬ãƒ—ãƒªã‚«æ•°ã‚’ä»¥ä¸‹ã®ã‚ˆã†ã«ç®—å‡ºã—ã¾ã™ã€‚

ceil(ceil(count * shardsPerNode / shardæ•°) * shardæ•° / shardsPerNode)

specå†…ã®Podæ•°ã¨å®Ÿéš›ã®Podæ•°

Scale subresourceã®.spec.countã¨å®Ÿéš›ã®countãŒä¸€è‡´ã—ã¦ã„ãªãã¦ã‚‚(å°‘ãªãã¨ã‚‚type: Resourceã®å ´åˆ)HPAã®æŒ™å‹•ã«å•é¡ŒãŒãªã„ã“ã¨ã¯ã€HPAã®ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚’èªã‚“ã§ç¢ºèªæ¸ˆã¿ã§ã™ã€‚HPAã§è¨å®šã™ã¹ããƒ¬ãƒ—ãƒªã‚«æ•°ã‚’è¨ˆç®—ã™ã‚‹éš›ã«ç”¨ã„ã‚‰ã‚Œã‚‹ç¾åœ¨ã®ãƒ¬ãƒ—ãƒªã‚«æ•°ã¯.status.selectorã§é¸æŠžã•ã‚ŒãŸPodã®æ•°ã¨ãªã‚Šã¾ã™ã€‚

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆæ™‚ã«ã¯ã¾ãšElasticsearchãƒªã‚½ãƒ¼ã‚¹ã®è©²å½“ã®nodeSetã®countã‚’ä¸Šè¨˜ã®è¨ˆç®—å¼ã‹ã‚‰ç®—å‡ºã•ã‚ŒãŸå€¤ã«è¨å®šã—ã€ã™ã¹ã¦ã®PodãŒReadyã«ãªã£ãŸå¾Œã€Elasticsearchã®APIã‚’ç”¨ã„ã¦indexã®ãƒ¬ãƒ—ãƒªã‚«æ•°ã‚’å¢—ã‚„ã—ã¾ã™ã€‚ã‚¹ã‚±ãƒ¼ãƒ«ã‚¤ãƒ³ã™ã‚‹å ´åˆã¯é€†ã«indexã®ãƒ¬ãƒ—ãƒªã‚«æ•°ã‚’æ¸›ã‚‰ã—ãŸå¾Œã«Elasticsearchãƒªã‚½ãƒ¼ã‚¹ã®countã‚’å¤‰æ›´ã—ã¾ã™ã€‚

ã“ã‚Œã§å…ˆã»ã©æŒ™ã’ãŸèª²é¡Œã®1ã¨2ã«ã¤ã„ã¦ã¯è§£æ±ºã§ãã¾ã—ãŸã€‚3ã«é–¢ã—ã¦ã¯MutatingWebhookConfigurationã‚’ç”¨ã„ã¦è§£æ±ºã—ã¾ã™ã€‚ã“ã‚Œã¯Elasticsearchãƒªã‚½ãƒ¼ã‚¹ãŒæ›´æ–°ã•ã‚ŒãŸéš›ã«å‘¼ã³å‡ºã•ã‚Œã‚‹hookã‚’æŒ‡å®šã™ã‚‹ä»•çµ„ã¿ã§ã€ãã®hookã®ä¸ã§ search.mercari.in/ignore-count-changeâ€: â€œdata,coordinatingã®ã‚ˆã†ãªannotationãŒæŒ‡å®šã•ã‚Œã¦ã„ãŸå ´åˆã€ãã®annotationã«å¯¾å¿œã™ã‚‹nodeSetã®countæ•°ã‚’ç¾åœ¨ã®countæ•°ã«ä¸Šæ›¸ãã—ã¾ã™ã€‚ã“ã‚Œã«ã‚ˆã‚ŠHPAã®å¯¾è±¡ã¨ãªã£ã¦ã„ã‚‹çŠ¶æ…‹ã§Elasticsearchãƒªã‚½ãƒ¼ã‚¹ã®å¤‰æ›´ã‚’GitOpsç‰ã§è¡Œã£ã¦ã‚‚ã€countãŒãƒªã‚»ãƒƒãƒˆã•ã‚Œã‚‹ã“ã¨ãŒãªããªã‚Šã¾ã™ã€‚

å°Žå…¥ã«éš›ã—ã¦ã®å•é¡Œã¨è§£æ±º

ä»¥ä¸Šã®æ–¹é‡ã§å®Ÿè£…ã—ãŸcontrollerã‚’å®Ÿéš›ã«å°Žå…¥ã—ã¦ã¿ãŸã¨ã“ã‚ã€ã„ãã¤ã‹ã®èª²é¡ŒãŒã‚ã‹ã£ãŸã®ã§ãã‚Œã‚‰ã«ã¤ã„ã¦ç´¹ä»‹ã—ã¾ã™ã€‚

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆç›´å¾Œã«latencyãŒå¢—åŠ ã™ã‚‹
Force mergeã«ã‚ˆã‚ŠHPAã®metricã‚’CPUåˆ©ç”¨çŽ‡ã«ã§ããªã„
ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒå°‘ãªã„æ™‚é–“ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã¨ãªã‚‹metricsãŒå¤‰åŒ–ã™ã‚‹

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆç›´å¾Œã«latencyãŒå¢—åŠ ã™ã‚‹

ã“ã®èª²é¡Œã¯å…ƒã€…rolling updateã‚’è¡Œã†ã¨ããªã©ã§ã‚‚è¦³æ¸¬ã§ãã¦ã„ãŸã®ã§ã™ãŒã€DataãƒŽãƒ¼ãƒ‰ãŒèµ·å‹•ã—ã€shardãŒé…ç½®ã•ã‚Œã€æ¤œç´¢ãƒªã‚¯ã‚¨ã‚¹ãƒˆã‚’å—ã‘ä»˜ã‘å§‹ã‚ãŸç›´å¾Œã®latencyãŒéžå¸¸ã«é«˜ããªã£ã¦ã„ã¾ã—ãŸã€‚ã“ã‚Œã¯DataãƒŽãƒ¼ãƒ‰ã«é™ã£ãŸè©±ã§ã¯ãªãElasticsearchã«ãƒªã‚¯ã‚¨ã‚¹ãƒˆã‚’é€ã‚‹microserviceã«Istioã‚’å°Žå…¥ã—ãŸéš›ã«ã€CoordinatingãƒŽãƒ¼ãƒ‰ (shardã‚’æŒãŸãšã«æœ€åˆã«ãƒªã‚¯ã‚¨ã‚¹ãƒˆã‚’å—ã‘ä»˜ã‘ã¦routingã¨mergeå‡¦ç†ã‚’è¡Œã†ã ã‘ã®ãƒŽãƒ¼ãƒ‰)ã§ã‚‚ç™ºç”Ÿã—ã¦ã„ã¾ã—ãŸã€‚

åŽŸå› ã¯ãŠãã‚‰ãJVMã®ã‚³ãƒ¼ãƒ«ãƒ‰ã‚¹ã‚¿ãƒ¼ãƒˆå•é¡Œã«ã‚ˆã‚‹ã‚‚ã®ã§ã€Istioã®å ´åˆsidecarãŒæ–°ã—ãè¿½åŠ ã•ã‚ŒãŸPodã«å³åº§ã«å‡ç‰ã«ãƒªã‚¯ã‚¨ã‚¹ãƒˆã‚’é€ã‚ã†ã¨ã™ã‚‹ã“ã¨ãŒå•é¡Œã§ã—ãŸã€‚ã“ã®ç‚¹ã«ã¤ã„ã¦ã¯ã€Istioå°Žå…¥ä»¥å‰ã¯HTTPã®keep aliveã«ã‚ˆã‚Šã€æ–°ã—ãè¿½åŠ ã•ã‚ŒãŸPodã«ç·©ã‚„ã‹ã«ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒç§»è¡Œã—ã¦ã„ããŸã‚å•é¡Œã¨ãªã£ã¦ã„ã¾ã›ã‚“ã§ã—ãŸã€‚

ã“ã®èª²é¡Œã‚’è§£æ±ºã™ã‚‹ãŸã‚ã«passthrough(Istioã®service discoveryã«é ¼ã‚‰ãšãã®ã¾ã¾é€šã™)ã‚„DestinationRuleã®warmupDurationSecs(æŒ‡å®šã®ç§’æ•°ã‚’ã‹ã‘ã¦æ–°ã—ã„Podã«å¾ã€…ã«ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ã‚’å¢—ã‚„ã—ã¦ã„ã)ã‚’ä½¿ã„ã¾ã—ãŸã€‚ãŸã DataãƒŽãƒ¼ãƒ‰ã®å ´åˆã¯ã€routingã¯å®Œå…¨ã«Elasticsearchä¾å˜ã¨ãªã‚Šã€å¤–éƒ¨ã‹ã‚‰ã©ã†ã«ã‹ã§ãã‚‹ä½™åœ°ãŒãªã‹ã£ãŸãŸã‚Elasticsearchè‡ªä½“ã‚’ä¿®æ£ã™ã‚‹ã“ã¨ã«ã—ã¾ã—ãŸã€‚ã“ã‚Œã¯upstreamã«Pull Requestã¨ã—ã¦ã‚ã’ã¦ã„ã¾ã™ã€‚https://github.com/elastic/elasticsearch/pull/90897

æˆ‘ã€…ã®indexã¯ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã®å‰Šé™¤ï¼Œæ›´æ–°(ElasticsearchãŒåˆ©ç”¨ã—ã¦ã„ã‚‹æ¤œç´¢ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã§ã‚ã‚‹Luceneã«ãŠã‘ã‚‹æ›´æ–°ã¯ã€å†…éƒ¨çš„ã«ã¯å‰Šé™¤+è¿½åŠ ã¨ã„ã†å‡¦ç†ã‚’ãŠã“ãªã„ã¾ã™)ã®é »åº¦ãŒé«˜ã„ãŸã‚æ¯Žæ—¥ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ã®å°‘ãªã„æ™‚é–“å¸¯ã«force mergeã‚’è¡Œã£ã¦è«–ç†çš„ã«å‰Šé™¤æ¸ˆã¿ã®ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã‚’å‰Šé™¤ã—ã¦ã„ã¾ã—ãŸã€‚ã“ã®force mergeã‚’å¿˜ã‚Œã‚‹ã¨æ•°æ—¥å¾Œã«ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ã‚’æŒã‘ãªããªã‚‹ã¨ã„ã†ã“ã¨ãŒéŽåŽ»ç™ºç”Ÿã—ã¦ã„ã¾ã—ãŸã€‚

ã—ã‹ã—Force mergeã¯CPUã«è² è·ã®ã‹ã‹ã‚‹å‡¦ç†ã§ã‚ã‚Šã€ã¾ãŸãã®æ€§è³ªä¸ŠåŒã˜ã‚¿ã‚¤ãƒŸãƒ³ã‚°ã§ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆã‚’è¡Œã†ã¹ãã‚‚ã®ã§ã‚‚ãªã„ãŸã‚ã€HPAã®metricã‚’CPUåˆ©ç”¨çŽ‡ã«ã™ã‚‹ã“ã¨ãŒã§ãã¾ã›ã‚“ã§ã—ãŸã€‚ãã®ãŸã‚åˆæœŸã¯æ¤œç´¢ãƒªã‚¯ã‚¨ã‚¹ãƒˆæ•°ã‚’DatadogçµŒç”±ã§external metricã¨ã—ã¦åˆ©ç”¨ã—ã‚ˆã†ã¨è€ƒãˆã¦ã„ã¾ã—ãŸãŒã€æ–°ã—ã„microserviceã‹ã‚‰å‘¼ã³å‡ºã•ã‚Œã‚‹éš›ã«ã‚¯ã‚¨ãƒªã®ãƒ‘ã‚¿ãƒ¼ãƒ³ãŒå¤‰åŒ–ã—è² è·ã®ãƒ‘ã‚¿ãƒ¼ãƒ³ã‚‚å¤‰ã‚ã‚‹ãŸã‚æœ¬è³ªçš„ã«ã¯CPUåˆ©ç”¨çŽ‡ã‚’HPAã®metricã«ã™ã‚‹ã“ã¨ãŒæœ›ã¾ã—ã„ã§ã™ã€‚

ãã“ã§Luceneã®ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚’èªã‚“ã§ã„ã‚‹ã¨ã€deletes_pct_allowedã¨ã„ã†ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã‚’è¦‹ã¤ã‘ã¾ã—ãŸã€‚ã“ã‚Œã¯è«–ç†çš„ã«å‰Šé™¤æ¸ˆã¿ã®ãƒ‰ã‚ãƒ¥ãƒ¡ãƒ³ãƒˆã®å‰²åˆã‚’æŒ‡å®šã™ã‚‹ãŸã‚ã®ã‚‚ã®ã§ã€ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆå€¤ã¯33ã§ã—ãŸã€‚ã“ã®å€¤ã‚’å¤‰æ›´ã—ãªãŒã‚‰ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãƒ†ã‚¹ãƒˆã‚’å®Ÿæ–½ã™ã‚‹ã¨30%ä»˜è¿‘ã‹ã‚‰æ€¥æ¿€ã«latencyãŒæ‚ªåŒ–ã™ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã—ãŸã€‚ãã®ãŸã‚ã“ã®å€¤ã‚’æœ€å°å€¤ã§ã‚ã‚‹20 (æœ€æ–°ã®Elasticsearchã§ã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆ20ã€æœ€å°å€¤ã¯5 https://github.com/elastic/elasticsearch/pull/93188 )ã«è¨å®šã™ã‚‹ã“ã¨ã§Force mergeå‡¦ç†ã‚’å‰Šé™¤ã™ã‚‹ã“ã¨ãŒã§ãã¾ã—ãŸã€‚ã“ã‚Œã«ã‚ˆã‚ŠHPAã®metricã«CPUåˆ©ç”¨çŽ‡ã‚’æŒ‡å®šã™ã‚‹ã“ã¨ãŒã§ãã¦ã„ã¾ã™ã€‚

Elasticsearchã§ã¯indexã®ä¸èº«ã‚’ãƒ•ã‚¡ã‚¤ãƒ«ã‚·ã‚¹ãƒ†ãƒ ã‚ãƒ£ãƒƒã‚·ãƒ¥ã«è¼‰ã›ã‚‹ã“ã¨ã§ä½Žlatencyã‚’å®Ÿç¾ã—ã¾ã™ã€‚æˆ‘ã€…ã‚‚å¿…è¦ãªæƒ…å ±ã¯ã™ã¹ã¦ãƒ•ã‚¡ã‚¤ãƒ«ã‚·ã‚¹ãƒ†ãƒ ã‚ãƒ£ãƒƒã‚·ãƒ¥ã«è¼‰ã›ã‚‹ã“ã¨ã‚’ç›®æŒ‡ã—ã¦ã„ã‚‹ãŸã‚ã€å·¨å¤§ãªindexã§ã¯å¤šãã®memoryã‚’ä½¿ç”¨ã—ã¾ã™ã€‚ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒã‚ã‚‹ç¨‹åº¦å˜åœ¨ã™ã‚‹æ™‚é–“å¸¯ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ãŒCPUã§ã‚ã‚Šã€CPUåˆ©ç”¨çŽ‡ã‚’HPAã®metricã«ã™ã‚‹ã“ã¨ã§ã†ã¾ãã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã—ã¾ã™ã€‚

ã—ã‹ã—ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒæ¥µç«¯ã«å°‘ãªã„æ™‚é–“å¸¯ã§ã‚ã£ã¦ã‚‚å¯ç”¨æ€§ã®ãŸã‚ã«æœ€ä½Žé™ã®ãƒ¬ãƒ—ãƒªã‚«ã¯ç¢ºä¿ã—ãªãã¦ã¯ãªã‚Šã¾ã›ã‚“ã€‚ãã®ãŸã‚ãã®æ™‚é–“å¸¯ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã¯memoryã¨ãªã‚Šã€å¿…è¦ãªCPUã«å¯¾ã—ã¦ç„¡é§„ã«å¤šãã®CPUã‚’å‰²ã‚Šå½“ã¦ã¦ã—ã¾ã†ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

å…ƒã€…ã®æ§‹æˆã¯memoryã®é‡ãŒdiskä¸Šã®indexã‚µã‚¤ã‚ºã®2å€ã¨ãªã‚‹ã‚ˆã†è¨å®šã•ã‚Œã¦ãŠã‚Šã€memory.usageã‚‚é«˜ã„å€¤ã‚’ç¤ºã—ã¦ã„ã¾ã—ãŸãŒã€memory.working_setã‚’è¦‹ã‚‹ã¨ã¾ã ã¾ã ä½™è£•ãŒã‚ã‚Šãã†ã§ã—ãŸã€‚Kubernetesã«ãŠã„ã¦ memory.working_setã¨ã¯ memory.usageã‹ã‚‰inactive filesã‚’å¼•ã„ãŸå€¤ã¨ãªã‚Šã¾ã™ã€‚inactive filesã¯ã–ã£ãã‚Šã„ã†ã¨ã»ã¨ã‚“ã©å‚ç…§ã•ã‚Œã¦ã„ãªã„ãƒ•ã‚¡ã‚¤ãƒ«ã‚·ã‚¹ãƒ†ãƒ ã‚ãƒ£ãƒƒã‚·ãƒ¥ã®ã‚µã‚¤ã‚ºã¨ãªã‚Šã¾ã™ã€‚Kubernetesã§ã¯containerã®memory limitã«é”ã™ã‚‹å‰ã«ã“ã‚Œã‚‰ã®ãƒ•ã‚¡ã‚¤ãƒ«ã‚·ã‚¹ãƒ†ãƒ ã‚ãƒ£ãƒƒã‚·ãƒ¥ã¯evictã•ã‚Œã‚‹ãŸã‚ã€å‰²ã‚Šå½“ã¦ã‚‹memoryã¯ã‚‚ã£ã¨å°‘ãªãã¦ã‚‚è‰¯ã„ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚

å‹¿è«–inactive filesã§ã¯ãªã„ãƒ•ã‚¡ã‚¤ãƒ«ã‚·ã‚¹ãƒ†ãƒ ã‚ãƒ£ãƒƒã‚·ãƒ¥ã‚‚å¿…è¦ãªã‚‰ã°evictã•ã‚Œã‚‹ã®ã§ã™ãŒã€ã“ã¡ã‚‰ã¯evictã—ã™ãŽã‚‹ã¨ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ã®åŠ£åŒ–ã«ã¤ãªãŒã‚Šã¾ã™ã€‚é›£ã—ã„ã“ã¨ã«inactiveã§ãªããªã‚‹æ¡ä»¶ãŒæ„å¤–ã¨ç·©ã„ã®ã§ã©ã“ã¾ã§evictå¯èƒ½ãªã®ã‹ãŒæ˜Žç¤ºçš„ã«ã¯ã‚ã‹ã‚‰ãªã„ãŸã‚ã€memory requestã‚’ã‚ã¾ã‚Šæ”»ã‚ãŸå€¤ã«ã¯ã§ãã¦ã„ã¾ã›ã‚“ãŒã€ã“ã‚Œã«ã‚ˆã‚ŠmemoryãŒãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã«ãªã£ã¦ã„ã‚‹æ™‚é–“å¸¯ã«åˆè¨ˆCPU requestã‚’æ¸›ã‚‰ã™ã“ã¨ãŒã§ãã¾ã—ãŸã€‚

Elasticsearchã¯statefulãªã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ãªã®ã§Podã®å†èµ·å‹•ãŒå¿…è¦ãªVPAã‚’é©ç”¨ã™ã‚‹ã®ãŒé›£ã—ã„ã§ã™ãŒIn-place Update of Pod Resources (https://kubernetes.io/blog/2023/05/12/in-place-pod-resize-alpha/) ãŒåˆ©ç”¨å¯èƒ½ã«ãªã‚‹ã¨CPU requestã‚’å†èµ·å‹•ãªã—ã«ã‚¹ã‚±ãƒ¼ãƒ«ãƒ€ã‚¦ãƒ³ã§ãã‚‹ã‚ˆã†ã«ãªã‚‹ãŸã‚ã€ã“ã®å•é¡ŒãŒç·©å’Œã•ã‚Œã‚‹ã“ã¨ã‚’æœŸå¾…ã—ã¦ã„ã¾ã™ã€‚

ã•ã„ã”ã«

ã“ã®è¨˜äº‹ã§ã¯ã€ECKã§Kubernetesä¸Šã§å‹•ã‹ã—ã¦ã„ã‚‹Elasticsearchã‚¯ãƒ©ã‚¹ã‚¿ã«å¯¾ã—ã¦HPAã‚’ç”¨ã„ã¦CPUåˆ©ç”¨çŽ‡ã‚’åŸºã«ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°ã™ã‚‹æ–¹æ³•ã«ã¤ã„ã¦è¿°ã¹ã¾ã—ãŸã€‚ã“ã‚Œã«ã‚ˆã‚ŠElasticsearchã®é‹ç”¨ã«é–¢ã‚ã‚‹Kubernetesã®ã‚³ã‚¹ãƒˆãŒç´„40%å‰Šæ¸›ã§ãã¾ã—ãŸã€‚ãŠãã‚‰ãä»Šå¾ŒElastic Cloudã«ã¯Serverlessã®ä¸€ç’°ã¨ã—ã¦ã“ã®è¾ºã‚Šã®ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒªãƒ³ã‚°æ©Ÿèƒ½ãŒæä¾›ã•ã‚Œã‚‹ã“ã¨ã«ãªã‚‹ã¨äºˆæƒ³ã—ã¾ã™ãŒã€æˆ‘ã€…ã®ä»Šã®çŠ¶æ³ä¸‹ã«ãŠã„ã¦ã¯åŠ¹æžœçš„ãªæ‰‹æ³•ã ã¨æ„Ÿã˜ã¦ã„ã¾ã™ã€‚

search infraãƒãƒ¼ãƒ ã§ã¯ç¾åœ¨ã¨ã‚‚ã«åƒãä»²é–“ã‚’å‹Ÿé›†ã—ã¦ã„ã¾ã™ã€‚ã‚‚ã—èˆˆå‘³ãŒã‚ã‚Šã¾ã—ãŸã‚‰ã”æ°—è»½ã«ãŠå•åˆã›ãã ã•ã„ã€‚

Software Engineer, Search Platform Development – Mercari

Elasticsearchã‚’CPUåˆ©ç”¨çŽ‡ã§ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã•ã›ã‚‹

Elasticsearchã¨ECK

Custom Resourceã¨controller

å°Žå…¥ã«éš›ã—ã¦ã®å•é¡Œã¨è§£æ±º

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆç›´å¾Œã«latencyãŒå¢—åŠ ã™ã‚‹

Force mergeã«ã‚ˆã‚ŠHPAã®metricã‚’CPUåˆ©ç”¨çŽ‡ã«ã§ããªã„

ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒå°‘ãªã„æ™‚é–“ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã¨ãªã‚‹metricsãŒå¤‰åŒ–ã™ã‚‹

ã•ã„ã”ã«

Related article

äº‹æ¥è€…è«‹æ±‚æ‰•ã„: å¤šæ§˜ãªæ±ºæ¸ˆã‚’æ”¯ãˆã‚‹æ±ºæ¸ˆåŸºç›¤ã®ä»•çµ„ã¿

Argo Workflowsã‚’å°Žå…¥ã—ã¦è¤‡æ•°ãƒãƒƒãƒã®ç®¡ç†ã‚’è¡Œã£ãŸè©±

ãƒ¡ãƒ«ã‚«ãƒªã«ãŠã‘ã‚‹å•†å“ãƒ•ã‚£ãƒ¼ãƒ‰ã‚·ã‚¹ãƒ†ãƒ ã®ãƒªã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£

Elasticsearchã‚’CPUåˆ©ç”¨çŽ‡ã§ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã•ã›ã‚‹

Elasticsearchã¨ECK

Custom Resourceã¨controller

å°Žå…¥ã«éš›ã—ã¦ã®å•é¡Œã¨è§£æ±º

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆç›´å¾Œã«latencyãŒå¢—åŠ ã™ã‚‹

Force mergeã«ã‚ˆã‚ŠHPAã®metricã‚’CPUåˆ©ç”¨çŽ‡ã«ã§ããªã„

ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒå°‘ãªã„æ™‚é–“ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã¨ãªã‚‹metricsãŒå¤‰åŒ–ã™ã‚‹

ã•ã„ã”ã«

Related article

äº‹æ¥­è€…è«‹æ±‚æ‰•ã„: å¤šæ§˜ãªæ±ºæ¸ˆã‚’æ”¯ãˆã‚‹æ±ºæ¸ˆåŸºç›¤ã®ä»•çµ„ã¿

Argo Workflowsã‚’å°Žå…¥ã—ã¦è¤‡æ•°ãƒãƒƒãƒã®ç®¡ç†ã‚’è¡Œã£ãŸè©±

ãƒ¡ãƒ«ã‚«ãƒªã«ãŠã‘ã‚‹å•†å“ãƒ•ã‚£ãƒ¼ãƒ‰ã‚·ã‚¹ãƒ†ãƒ ã®ãƒªã‚¢ãƒ¼ã‚­ãƒ†ã‚¯ãƒãƒ£

Elasticsearchã‚’CPUåˆ©ç”¨çŽ‡ã§ã‚ªãƒ¼ãƒˆã‚¹ã‚±ãƒ¼ãƒ«ã•ã›ã‚‹

Elasticsearchã¨ECK

Custom Resourceã¨controller

å°Žå…¥ã«éš›ã—ã¦ã®å•é¡Œã¨è§£æ±º

ã‚¹ã‚±ãƒ¼ãƒ«ã‚¢ã‚¦ãƒˆç›´å¾Œã«latencyãŒå¢—åŠ ã™ã‚‹

Force mergeã«ã‚ˆã‚ŠHPAã®metricã‚’CPUåˆ©ç”¨çŽ‡ã«ã§ããªã„

ãƒˆãƒ©ãƒ•ã‚£ãƒƒã‚¯ãŒå°‘ãªã„æ™‚é–“ã§ã¯ãƒœãƒˆãƒ«ãƒãƒƒã‚¯ã¨ãªã‚‹metricsãŒå¤‰åŒ–ã™ã‚‹

ã•ã„ã”ã«

äº‹æ¥è€…è«‹æ±‚æ‰•ã„: å¤šæ§˜ãªæ±ºæ¸ˆã‚’æ”¯ãˆã‚‹æ±ºæ¸ˆåŸºç›¤ã®ä»•çµ„ã¿

Argo Workflowsã‚’å°Žå…¥ã—ã¦è¤‡æ•°ãƒãƒƒãƒã®ç®¡ç†ã‚’è¡Œã£ãŸè©±

ãƒ¡ãƒ«ã‚«ãƒªã«ãŠã‘ã‚‹å•†å“ãƒ•ã‚£ãƒ¼ãƒ‰ã‚·ã‚¹ãƒ†ãƒ ã®ãƒªã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£