# kubernetes\_vpa\_hpa\_ca * [HPA](kubernetes_vpa_hpa_ca.md#hpa) * [æ¦‚å¿µåŠåŽŸç†](kubernetes_vpa_hpa_ca.md#æ¦‚å¿µåŠåŽŸç†) * [Install Metrics-Server](kubernetes_vpa_hpa_ca.md#install-metrics-server) * [usage](kubernetes_vpa_hpa_ca.md#usage) * [ç¤ºä¾‹é…ç½®](kubernetes_vpa_hpa_ca.md#ç¤ºä¾‹é…ç½®) * [VPA](kubernetes_vpa_hpa_ca.md#vpa) * [æ¦‚å¿µåŠåŽŸç†](kubernetes_vpa_hpa_ca.md#æ¦‚å¿µåŠåŽŸç†) * [å®‰è£…](kubernetes_vpa_hpa_ca.md#å®‰è£…) * [å…³äºŽå‘åŽå…¼å®¹æ€§çš„æ³¨æ„äº‹é¡¹](kubernetes_vpa_hpa_ca.md#å…³äºŽå‘åŽå…¼å®¹æ€§çš„æ³¨æ„äº‹é¡¹) * [å…ˆå†³æ¡ä»¶](kubernetes_vpa_hpa_ca.md#å…ˆå†³æ¡ä»¶) * [å®‰è£…](kubernetes_vpa_hpa_ca.md#å®‰è£…) * [å¿«é€Ÿå¼€å§‹](kubernetes_vpa_hpa_ca.md#å¿«é€Ÿå¼€å§‹) * [æµ‹è¯•æ‚¨çš„å®‰è£…](kubernetes_vpa_hpa_ca.md#æµ‹è¯•æ‚¨çš„å®‰è£…) * [ç¤ºä¾‹é…ç½®](kubernetes_vpa_hpa_ca.md#ç¤ºä¾‹é…ç½®) * [æ•…éšœæŽ’é™¤](kubernetes_vpa_hpa_ca.md#æ•…éšœæŽ’é™¤) * [åˆ é™¤](kubernetes_vpa_hpa_ca.md#åˆ é™¤) * [alphaç‰ˆæœ¬çš„å·²çŸ¥é™åˆ¶](kubernetes_vpa_hpa_ca.md#alphaç‰ˆæœ¬çš„å·²çŸ¥é™åˆ¶) * [CA](kubernetes_vpa_hpa_ca.md#ca) * [ä»€ä¹ˆæ˜¯cluster-autoscaler](kubernetes_vpa_hpa_ca.md#ä»€ä¹ˆæ˜¯cluster-autoscaler) * [ä»€ä¹ˆæ—¶å€™æ‰©ï¼Ÿ](kubernetes_vpa_hpa_ca.md#ä»€ä¹ˆæ—¶å€™æ‰©) * [ä»€ä¹ˆæ—¶å€™ç¼©ï¼Ÿ](kubernetes_vpa_hpa_ca.md#ä»€ä¹ˆæ—¶å€™ç¼©) * [ä»€ä¹ˆæ ·çš„èŠ‚ç‚¹ä¸ä¼šè¢«CAåˆ é™¤](kubernetes_vpa_hpa_ca.md#ä»€ä¹ˆæ ·çš„èŠ‚ç‚¹ä¸ä¼šè¢«caåˆ é™¤) * [å¦‚ä½•é˜²æ¢nodeè¢«Cluster Autoscaleråˆ é™¤](kubernetes_vpa_hpa_ca.md#å¦‚ä½•é˜²æ¢nodeè¢«cluster-autoscaleråˆ é™¤) * [éƒ¨ç½²æ–¹å¼](kubernetes_vpa_hpa_ca.md#éƒ¨ç½²æ–¹å¼) * [What does CA do?](kubernetes_vpa_hpa_ca.md#what-does-ca-do) * [What CA doesn't do?](kubernetes_vpa_hpa_ca.md#what-ca-doesnt-do) * [Cluster Autoscaleræž¶æž„](kubernetes_vpa_hpa_ca.md#cluster-autoscaleræž¶æž„) * [æ‰©å®¹æµç¨‹](kubernetes_vpa_hpa_ca.md#æ‰©å®¹æµç¨‹) * [å¦‚ä½•ç›‘æŽ§Cluster Autoscaler](kubernetes_vpa_hpa_ca.md#å¦‚ä½•ç›‘æŽ§cluster-autoscaler) * [CAé›†ç¾¤çŠ¶æ€æ£€æŸ¥](kubernetes_vpa_hpa_ca.md#caé›†ç¾¤çŠ¶æ€æ£€æŸ¥) * [éƒ¨ç½²ä½¿ç”¨CA](kubernetes_vpa_hpa_ca.md#éƒ¨ç½²ä½¿ç”¨ca) * [CAä»£ç é€»è¾‘è§£æž](kubernetes_vpa_hpa_ca.md#caä»£ç é€»è¾‘è§£æž) * [CA æ—¶åºå›¾](kubernetes_vpa_hpa_ca.md#ca-æ—¶åºå›¾) * [CA scaldownæµç¨‹å›¾](kubernetes_vpa_hpa_ca.md#ca-scaldownæµç¨‹å›¾) * [CA scalupæµç¨‹å›¾](kubernetes_vpa_hpa_ca.md#ca-scalupæµç¨‹å›¾) * [cloudprovider ç®€å•ç‰ˆæµç¨‹å›¾](kubernetes_vpa_hpa_ca.md#cloudprovider-ç®€å•ç‰ˆæµç¨‹å›¾) * [kubernetes cluster autoscalerè°ƒç ”ä¸Žhpa/vpaè”åŠ¨](kubernetes_vpa_hpa_ca.md#kubernetes-cluster-autoscalerè°ƒç ”ä¸Žhpa/vpaè”åŠ¨) * [æ¨ªå‘æ‰©å®¹$HPA$](kubernetes_vpa_hpa_ca.md#æ¨ªå‘æ‰©å®¹hpa) * [çºµå‘æ‰©å®¹$VPA$](kubernetes_vpa_hpa_ca.md#çºµå‘æ‰©å®¹vpa) * [é›†ç¾¤æ‰©å®¹$Cluster Autoscaler$](kubernetes_vpa_hpa_ca.md#é›†ç¾¤æ‰©å®¹cluster-autoscaler) **HPA** ### æ¦‚å¿µåŠåŽŸç† åˆ©ç”¨Horizontal Pod Autoscalingï¼ˆHPAï¼‰ï¼Œkubernetesèƒ½å¤Ÿæ ¹æ®ç›‘æµ‹åˆ°çš„CPUåˆ©ç”¨çŽ‡è‡ªåŠ¨çš„æ‰©ç¼©å®¹ replication controllerï¼Œdeploymentå’Œreplica setä¸podçš„æ•°é‡ã€‚ HPAä½œä¸ºkubernetes API resourceå’Œcontroller çš„å®žçŽ°ã€‚Resourceç¡®å®šcontrollerçš„è¡Œä¸ºã€‚Controller ä¼šæ ¹æ®ç›‘æµ‹åˆ°ç”¨æˆ·æŒ‡å®šçš„ç›®æ ‡çš„ CPU åˆ©ç”¨çŽ‡å‘¨æœŸæ€§åœ°è°ƒæ•´ replication controller æˆ– deployment çš„ replica æ•°é‡ã€‚ ![image](../.gitbook/assets/hpa-logic.png) HPAç”±ä¸€ä¸ªæŽ§åˆ¶å¾ªçŽ¯å®žçŽ°ï¼Œå¾ªçŽ¯å‘¨æœŸç”±controller manager ä¸çš„ --horizontal-pod-autoscaler-sync-periodæ ‡å¿—æŒ‡å®šã€‚åœ¨æ¯ä¸ªå‘¨æœŸå†…ï¼Œcontroller managerä¼šæŸ¥è¯¢HPAä¸å®šä¹‰çš„metricçš„èµ„æºåˆ©ç”¨çŽ‡ã€‚Controller manager ä»Ž resource metric APIï¼ˆæ¯ä¸ª pod çš„ resource metricï¼‰æˆ–è€…è‡ªå®šä¹‰ metric APIï¼ˆæ‰€æœ‰çš„metricï¼‰ä¸èŽ·å– metricã€‚ ### Install Metrics-Server ### usage ```text # kubectl autoscale sts apache2 --cpu-percent=50 --min=1 --max=3 ``` ```text # kubectl get hpa NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE apache2 StatefulSet/apache2 5%/10% 1 2 2 33m ``` ```text # kubectl describe hpa apache2 Name: apache2 Namespace: default Labels: Annotations: CreationTimestamp: Wed, 11 Sep 2019 10:47:42 +0800 Reference: StatefulSet/apache2 Metrics: ( current / target ) resource cpu on pods (as a percentage of request): 5% (14m) / 10% Min replicas: 1 Max replicas: 2 StatefulSet pods: 2 current / 2 desired Conditions: Type Status Reason Message ---- ------ ------ ------- AbleToScale True ScaleDownStabilized recent recommendations were higher than current one, applying the highest recent recommendation ScalingActive True ValidMetricFound the HPA was able to successfully calculate a replica count from cpu resource utilization (percentage of request) ScalingLimited False DesiredWithinRange the desired count is within the acceptable range Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal SuccessfulRescale 89s horizontal-pod-autoscaler New size: 2; reason: cpu resource utilization (percentage of request) above target ``` * AbleToScaleï¼šè¡¨æ˜ŽHPAæ˜¯å¦ å¯ä»¥èŽ·å–å’Œæ›´æ–°ä¼¸ç¼©ä¿¡æ¯ï¼Œä»¥åŠæ˜¯å¦å˜åœ¨é˜»æ¢ä¼¸ç¼©çš„å„ç§å›žé€€æ¡ä»¶ * ScalingActiveï¼šè¡¨æ˜ŽHPAæ˜¯å¦è¢«å¯ç”¨ï¼ˆå³ç›®æ ‡çš„å‰¯æœ¬æ•°é‡ä¸ä¸ºé›¶ï¼‰ ä»¥åŠæ˜¯å¦èƒ½å¤Ÿå®Œæˆä¼¸ç¼©è®¡ç®—ã€‚å½“è¿™ä¸€çŠ¶æ€ä¸ºFalseæ—¶ï¼Œé€šå¸¸è¡¨æ˜ŽèŽ·å–åº¦é‡æŒ‡æ ‡å˜åœ¨é—®é¢˜ã€‚ * ScalingLimittedï¼šè¡¨æ˜Žæ‰€éœ€ä¼¸ç¼©çš„å€¼è¢«HorizontalPodAutoscaleræ‰€å®šä¹‰çš„æœ€å¤§æˆ–è€…æœ€å°å€¼æ‰€é™åˆ¶ï¼ˆå³å·²ç»è¾¾åˆ°æœ€å¤§æˆ–è€…æœ€å°ä¼¸ç¼©å€¼ï¼‰ã€‚è¿™é€šå¸¸è¡¨æ˜Žæ‚¨å¯èƒ½éœ€è¦è°ƒæ•´HorizontalPodAutoscaler æ‰€å®šä¹‰çš„æœ€å¤§æˆ–è€…æœ€å°å‰¯æœ¬æ•°é‡çš„é™åˆ¶äº†ã€‚ ### ç¤ºä¾‹é…ç½® ç¬¬ä¸€æ¥ï¼šéƒ¨ç½²podã€serviceï¼š ```text $ kubectl run php-apache --image=gcr.io/google_containers/hpa-example --requests=cpu=200m --expose --port=80 service "php-apache" created deployment "php-apache" created ``` ç¬¬äºŒæ¥ï¼šåˆ›å»ºHorizontal Pod Autoscalerï¼š ```text $ kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10 deployment "php-apache" autoscaled ``` ```text $ kubectl get hpa NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 ``` ç¬¬ä¸‰æ¥ï¼šå¢žåŠ è´Ÿè½½ï¼š ```text $ kubectl run -i --tty load-generator --image=busybox /bin/sh Hit enter for command prompt $ while true; do wget -q -O- http://php-apache.default.svc.cluster.local; done ``` ```text $ kubectl get hpa NAME REFERENCE TARGET CURRENT MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache/scale 305% / 50% 305% 1 10 1 3m ``` ```text $ kubectl get deployment php-apache NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE php-apache 7 7 7 7 19m ``` ç¬¬å››æ¥ï¼šåœæ¢è´Ÿè½½ï¼š ```text $ kubectl get hpa NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache/scale 0% / 50% 1 10 1 11m $ kubectl get deployment php-apache NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE php-apache 1 1 1 1 27m ``` ## VPA ### æ¦‚å¿µåŠåŽŸç† Vertical Pod Autoscalerï¼ˆVPAï¼‰ä½¿ç”¨æˆ·æ— éœ€ä¸ºå…¶podsä¸çš„å®¹å™¨è®¾ç½®æœ€æ–°çš„èµ„æºrequestã€‚é…ç½®åŽï¼Œå®ƒå°†æ ¹æ®ä½¿ç”¨æƒ…å†µè‡ªåŠ¨è®¾ç½®requestï¼Œä»Žè€Œå…è®¸åœ¨èŠ‚ç‚¹ä¸Šè¿›è¡Œé€‚å½“çš„è°ƒåº¦ï¼Œä»¥ä¾¿ä¸ºæ¯ä¸ªpodæä¾›é€‚å½“çš„èµ„æºé‡ã€‚ ä½¿ç”¨åä¸ºVerticalPodAutoscalerçš„è‡ªå®šä¹‰èµ„æºå®šä¹‰å¯¹è±¡é…ç½®è‡ªåŠ¨ç¼©æ”¾ ã€‚å®ƒå…è®¸æŒ‡å®šåž‚ç›´è‡ªåŠ¨ç¼©æ”¾çš„podä»¥åŠæ˜¯å¦/å¦‚ä½•åº”ç”¨èµ„æºå»ºè®®ã€‚ è¦åœ¨ç¾¤é›†ä¸Šå¯ç”¨vpaï¼Œè¯·æŒ‰ç…§ä¸‹é¢ä»‹ç»çš„å®‰è£…æ¥éª¤è¿›è¡Œæ“ä½œã€‚ ### å®‰è£… #### å…³äºŽå‘åŽå…¼å®¹æ€§çš„æ³¨æ„äº‹é¡¹ åœ¨alphaæœŸé—´ï¼ŒVPA CRDå¯¹è±¡å¯èƒ½ä»¥ä¸åŒç‰ˆæœ¬ä¹‹é—´çš„å…¼å®¹æ–¹å¼å‘å±•ã€‚å¦‚æžœå®‰è£…æ–°ç‰ˆæœ¬çš„VPAï¼Œæœ€å®‰å…¨çš„åšæ³•æ˜¯åˆ é™¤çŽ°æœ‰çš„VPA CRDå¯¹è±¡ã€‚è¯·æ³¨æ„ï¼Œå¦‚æžœæ‚¨åªæ˜¯ä½¿ç”¨vpa-down.shè„šæœ¬æ‹†é™¤æ—§çš„VPAå®‰è£…ï¼Œåˆ™ä¼šè‡ªåŠ¨æ‰§è¡Œæ¤æ“ä½œã€‚ #### å…ˆå†³æ¡ä»¶ * å¼ºçƒˆå»ºè®®ä½¿ç”¨Kubernetes 1.9æˆ–æ›´é«˜ç‰ˆæœ¬ã€‚æ‚¨çš„ç¾¤é›†å¿…é¡»æ”¯æŒMutatingAdmissionWebhooksï¼Œé»˜è®¤æƒ…å†µä¸‹è‡ª1.9ï¼ˆ\#58255ï¼‰å¯ç”¨ã€‚äº†è§£æœ‰å…³VPA Admission Webhookçš„æ›´å¤šä¿¡æ¯ã€‚ * kubectl åº”è¯¥è¿žæŽ¥åˆ°è¦å®‰è£…VPAçš„ç¾¤é›†ã€‚ * å¿…é¡»åœ¨ç¾¤é›†ä¸éƒ¨ç½²Metrics Serverã€‚é˜…è¯»æœ‰å…³Metrics Serverçš„æ›´å¤šä¿¡æ¯ã€‚ * å¦‚æžœæ‚¨ä½¿ç”¨çš„æ˜¯GKE Kubernetesç¾¤é›†ï¼Œåˆ™éœ€è¦æŽˆäºˆæ‚¨å½“å‰çš„Googleèº«ä»½ cluster-adminè§’è‰²ã€‚å¦åˆ™ï¼Œæ‚¨å°†æ— æƒæŽˆäºˆVPAç³»ç»Ÿç»„ä»¶é¢å¤–çš„æƒé™ã€‚ ```text $ gcloud info | grep Account # get current google identity Account: [[email protected]] $ kubectl create clusterrolebinding myname-cluster-admin-binding --clusterrole=cluster-admin [email protected] Clusterrolebinding "myname-cluster-admin-binding" created ``` * å¦‚æžœæ‚¨çš„ç¾¤é›†ä¸å·²å®‰è£…äº†å¦ä¸€ç‰ˆæœ¬çš„VPAï¼Œåˆ™å¿…é¡»é¦–å…ˆåˆ é™¤çŽ°æœ‰å®‰è£…ï¼š ```text ./hack/vpa-down.sh ``` #### å®‰è£… è¦å®‰è£…VPAï¼Œè¯·ä¸‹è½½VPAçš„æºä»£ç ï¼ˆä¾‹å¦‚ä½¿ç”¨ git clone [https://github.com/kubernetes/autoscaler.gitï¼‰å¹¶åœ¨vertical-pod-autoscalerç›®å½•ä¸è¿è¡Œä»¥ä¸‹å‘½ä»¤ï¼š](https://github.com/kubernetes/autoscaler.gitï¼‰å¹¶åœ¨vertical-pod-autoscalerç›®å½•ä¸è¿è¡Œä»¥ä¸‹å‘½ä»¤ï¼š) ```text ./hack/vpa-up.sh ``` æ³¨æ„ï¼šè„šæœ¬å½“å‰è¯»å–çŽ¯å¢ƒå˜é‡ï¼š$REGISTRYå’Œ$TAGã€‚é™¤éžæ‚¨è¦ä½¿ç”¨éžé»˜è®¤ç‰ˆæœ¬çš„VPAï¼Œå¦åˆ™è¯·ç¡®ä¿ä¸è®¾ç½®å®ƒä»¬ã€‚ è¯¥è„šæœ¬kubectlå‘é›†ç¾¤å‘å‡ºå¤šä¸ªå‘½ä»¤ï¼Œè¿™äº›å‘½ä»¤æ’å…¥é…ç½®å¹¶åœ¨kube-systemå‘½åç©ºé—´ä¸å¯åŠ¨æ‰€æœ‰éœ€è¦çš„podï¼ˆè¯·å‚é˜… ä½“ç³»ç»“æž„ï¼‰ã€‚å®ƒè¿˜ä¼šç”Ÿæˆå¹¶ä¸Šè½½VPA Admission Controlleråœ¨ä¸ŽAPIæœåŠ¡å™¨é€šä¿¡æ—¶ä½¿ç”¨çš„æœºå¯†ï¼ˆCAè¯ä¹¦ï¼‰ã€‚ #### å¿«é€Ÿå¼€å§‹ å®‰è£…å®ŒæˆåŽï¼Œç³»ç»Ÿå°±å¯ä»¥ä¸ºæ‚¨çš„podå»ºè®®å’Œè®¾ç½®èµ„æºè¯·æ±‚ã€‚ä¸ºäº†ä½¿ç”¨å®ƒï¼Œæ‚¨éœ€è¦ä¸ºå…·æœ‰ç›¸ä¼¼èµ„æºè¦æ±‚çš„æ¯ä¸ªé€»è¾‘podç»„æ’å…¥Vertical Pod Autoscalerèµ„æºã€‚æˆ‘ä»¬å»ºè®®ä¸ºæ¯ä¸ªè¦è‡ªåŠ¨æŽ§åˆ¶çš„éƒ¨ç½²æ’å…¥VPAï¼Œå¹¶ä½¿ç”¨ä¸Žéƒ¨ç½²ä½¿ç”¨çš„ç›¸åŒçš„æ ‡ç¾é€‰æ‹©å™¨ã€‚VPAæœ‰ä¸‰ç§è¿ä½œæ¨¡å¼ï¼š * "Auto"ï¼šVPAåœ¨åˆ›å»ºpodæ—¶åˆ†é…èµ„æºè¯·æ±‚ï¼Œå¹¶ä½¿ç”¨é¦–é€‰æ›´æ–°æœºåˆ¶åœ¨çŽ°æœ‰podä¸Šæ›´æ–°å®ƒä»¬ã€‚ç›®å‰è¿™ç›¸å½“äºŽ"Recreate"ï¼ˆè§ä¸‹æ–‡ï¼‰ã€‚ä¸€æ—¦é‡å¯å…è´¹ï¼ˆâ€œin-placeâ€ï¼‰ï¼Œpodè¯·æ±‚çš„æ›´æ–°å¯ç”¨ï¼Œ"Auto"æ¨¡å¼å¯ä»¥è¢«ç”¨ä½œä¼˜é€‰çš„æ›´æ–°æœºåˆ¶ã€‚ * "Recreate"ï¼šVPAåœ¨åˆ›å»ºpodæ—¶åˆ†é…èµ„æºè¯·æ±‚ï¼Œå¹¶åœ¨è¯·æ±‚çš„èµ„æºä¸Žæ–°å»ºè®®æ˜Žæ˜¾ä¸åŒæ—¶ï¼ˆå¦‚æžœå·²å®šä¹‰ï¼Œåˆ™éµå¾ªPodä¸æ–é¢„ç®—ï¼‰ï¼Œé€šè¿‡é€å‡ºé©±åŠ¨æ¥æ›´æ–°å®ƒä»¬ã€‚åªæœ‰åœ¨éœ€è¦ç¡®ä¿åœ¨èµ„æºè¯·æ±‚å‘ç”Ÿæ›´æ”¹æ—¶é‡æ–°å¯åŠ¨podæ—¶ï¼Œæ‰åº”è¯¥å¾ˆå°‘ä½¿ç”¨æ¤æ¨¡å¼ã€‚å¦åˆ™æ›´å–œæ¬¢"Auto"å¯ä»¥åˆ©ç”¨å…é‡å¯çš„æ›´æ–°æ¨¡å¼ã€‚ * "Initial"ï¼šVPAä»…åœ¨åˆ›å»ºpodæ—¶åˆ†é…èµ„æºè¯·æ±‚ï¼Œå¹¶ä¸”ä»¥åŽæ°¸è¿œä¸ä¼šæ›´æ”¹å®ƒä»¬ã€‚ * "Off"ï¼šVPAä¸ä¼šè‡ªåŠ¨æ›´æ”¹podsçš„èµ„æºè¦æ±‚ã€‚è®¡ç®—å»ºè®®å¹¶å¯åœ¨VPAå¯¹è±¡ä¸æ£€æŸ¥ã€‚ #### æµ‹è¯•æ‚¨çš„å®‰è£… æ£€æŸ¥Vertical Pod Autoscaleråœ¨é›†ç¾¤ä¸æ˜¯å¦å®Œå…¨å¯æ“ä½œçš„ä¸€ç§ç®€å•æ–¹æ³•æ˜¯åˆ›å»ºç¤ºä¾‹éƒ¨ç½²å’Œç›¸åº”çš„VPAé…ç½®ï¼š ```text kubectl create -f examples/hamster.yaml ``` ä¸Šé¢çš„å‘½ä»¤åˆ›å»ºäº†ä¸€ä¸ªåŒ…å«2ä¸ªpodçš„deploymentï¼Œæ¯ä¸ªpodè¿è¡Œä¸€ä¸ªè¯·æ±‚100 millicores çš„å®¹å™¨ï¼Œå¹¶å°è¯•ä½¿ç”¨ç•¥é«˜äºŽ500millicoresçš„å®¹å™¨ã€‚è¯¥å‘½ä»¤è¿˜ä¼šåˆ›å»ºä¸€ä¸ªVPAé…ç½®ï¼Œå…¶ä¸åŒ…å«ä¸Žéƒ¨ç½²ä¸çš„podåŒ¹é…çš„é€‰æ‹©å™¨ã€‚VPAå°†è§‚å¯Ÿpodçš„è¡Œä¸ºï¼Œå¤§çº¦5åˆ†é’ŸåŽï¼Œä»–ä»¬åº”è¯¥ä½¿ç”¨æ›´é«˜çš„CPUè¯·æ±‚è¿›è¡Œæ›´æ–°ï¼ˆè¯·æ³¨æ„ï¼ŒVPAä¸ä¼šä¿®æ”¹éƒ¨ç½²ä¸çš„æ¨¡æ¿ï¼Œä½†ä¼šæ›´æ–°podçš„å®žé™…è¯·æ±‚ï¼‰ã€‚è¦æŸ¥çœ‹VPAé…ç½®å’Œå½“å‰å»ºè®®çš„èµ„æºè¯·æ±‚ï¼Œè¯·æ‰§è¡Œ: ```text kubectl describe vpa ``` æ³¨æ„ï¼šå¦‚æžœæ‚¨çš„ç¾¤é›†çš„å¯ç”¨å®¹é‡å¾ˆå°ï¼Œåˆ™è¿™äº›å®¹å™¨å¯èƒ½æ— æ³•å®‰æŽ’ã€‚æ‚¨å¯èƒ½éœ€è¦æ·»åŠ æ›´å¤šèŠ‚ç‚¹æˆ–è°ƒæ•´examples / hamster.yamlä»¥ä½¿ç”¨æ›´å°‘çš„CPUã€‚ #### ç¤ºä¾‹é…ç½® ```text apiVersion: poc.autoscaling.k8s.io/v1alpha1 kind: VerticalPodAutoscaler metadata: name: my-app-vpa spec: selector: matchLabels: app: my-app updatePolicy: updateMode: "Auto" ``` #### æ•…éšœæŽ’é™¤ è¦è¯Šæ–VPAå®‰è£…é—®é¢˜ï¼Œè¯·æ‰§è¡Œä»¥ä¸‹æ¥éª¤ï¼š æ£€æŸ¥æ‰€æœ‰ç³»ç»Ÿç»„ä»¶æ˜¯å¦æ£åœ¨è¿è¡Œï¼š ```text kubectl --namespace=kube-system get pods|grep vpa ``` ä¸Šé¢çš„å‘½ä»¤åº”è¯¥åˆ—å‡ºçŠ¶æ€ä¸ºRunningçš„3ä¸ªpodï¼ˆæŽ¨èè€…ï¼Œæ›´æ–°è€…å’Œå‡†å…¥æŽ§åˆ¶å™¨ï¼‰ã€‚ æ£€æŸ¥ç³»ç»Ÿç»„ä»¶æ˜¯å¦è®°å½•ä»»ä½•é”™è¯¯ã€‚å¯¹äºŽä¸Šä¸€ä¸ªå‘½ä»¤è¿”å›žçš„æ¯ä¸ªpodï¼Œæ‰§è¡Œä»¥ä¸‹æ“ä½œï¼š ```text kubectl --namespace=kube-system logs [pod name]| grep -e '^E[0-9]\{4\}' ``` æ£€æŸ¥æ˜¯å¦å·²åˆ›å»ºVPAè‡ªå®šä¹‰èµ„æºå®šä¹‰ï¼š ```text kubectl get customresourcedefinition|grep verticalpodautoscalers ``` VPAçš„ç»„æˆéƒ¨åˆ† è¯¥é¡¹ç›®åŒ…æ‹¬3ä¸ªç»„æˆéƒ¨åˆ†ï¼š * Recommender - å®ƒç›‘è§†å½“å‰å’Œè¿‡åŽ»çš„èµ„æºæ¶ˆè€—ï¼Œå¹¶æ ¹æ®å®ƒæä¾›æŽ¨èå€¼å®¹å™¨çš„CPUå’Œå†…å˜è¯·æ±‚ã€‚ * Updater - å®ƒæ£€æŸ¥å“ªäº›æ‰˜ç®¡çª—æ ¼å…·æœ‰æ£ç¡®çš„èµ„æºé›†ï¼Œå¦‚æžœæ²¡æœ‰ï¼Œåˆ™æ£€æŸ¥å®ƒä»¬ï¼Œä»¥ä¾¿æŽ§åˆ¶å™¨å¯ä»¥ä½¿ç”¨æ›´æ–°çš„è¯·æ±‚é‡æ–°åˆ›å»ºå®ƒä»¬ã€‚ * Admission Plugin - å®ƒåœ¨æ–°podä¸Šè®¾ç½®æ£ç¡®çš„èµ„æºè¯·æ±‚ï¼ˆç”±äºŽUpdaterçš„æ´»åŠ¨è€Œåˆšåˆšç”±å…¶æŽ§åˆ¶å™¨åˆ›å»ºæˆ–é‡æ–°åˆ›å»ºï¼‰ã€‚ #### åˆ é™¤ è¯·æ³¨æ„ï¼Œå¦‚æžœæ‚¨åœæ¢åœ¨ç¾¤é›†ä¸è¿è¡ŒVPAï¼Œåˆ™VPAå·²ä¿®æ”¹çš„podçš„èµ„æºè¯·æ±‚å°†ä¸ä¼šæ›´æ”¹ï¼Œä½†ä»»ä½•æ–°podå°†èŽ·å–æŽ§åˆ¶å™¨ä¸å®šä¹‰çš„èµ„æºï¼ˆå³éƒ¨ç½²æˆ–å¤åˆ¶ï¼‰ï¼Œè€Œä¸æ˜¯æ ¹æ®å…ˆå‰çš„å»ºè®®ç”±VPAã€‚ è¦åœæ¢åœ¨ç¾¤é›†ä¸ä½¿ç”¨Vertical Pod Autoscalingï¼š å¦‚æžœåœ¨GKEä¸Šè¿è¡Œï¼Œè¯·æ¸…é™¤åœ¨å…ˆå†³æ¡ä»¶ä¸åˆ›å»ºçš„è§’è‰²ç»‘å®šï¼š ```text kubectl delete clusterrolebinding myname-cluster-admin-binding ``` åˆ é™¤VPAç»„ä»¶ï¼š ```text ./hack/vpa-down.sh ``` #### alphaç‰ˆæœ¬çš„å·²çŸ¥é™åˆ¶ * æ¯å½“VPAæ›´æ–°podèµ„æºæ—¶ï¼Œéƒ½ä¼šé‡æ–°åˆ›å»ºpodï¼Œè¿™ä¼šå¯¼è‡´é‡æ–°å¯åŠ¨æ‰€æœ‰æ£åœ¨è¿è¡Œçš„å®¹å™¨ã€‚å¯ä»¥åœ¨ä¸åŒèŠ‚ç‚¹ä¸Šé‡æ–°åˆ›å»ºpodã€‚ * vpaä¸åº”ä¸ŽCPUæˆ–å†…å˜ä¸Šçš„Horizoâ€‹â€‹ntal Pod Autoscaler$HPA$ä¸€èµ·ä½¿ç”¨ã€‚ä½†æ˜¯ï¼Œæ‚¨å¯ä»¥åœ¨è‡ªå®šä¹‰å’Œå¤–éƒ¨æŒ‡æ ‡ä¸Šä½¿ç”¨VPAå’ŒHPAã€‚ * Autoæ¨¡å¼ä¸çš„VPA åªèƒ½ç”¨äºŽåœ¨æŽ§åˆ¶å™¨ï¼ˆä¾‹å¦‚éƒ¨ç½²ï¼‰ä¸‹è¿è¡Œçš„podï¼ŒåŽè€…è´Ÿè´£é‡æ–°å¯åŠ¨å·²åˆ é™¤çš„podã€‚ åœ¨Autoæ¨¡å¼ä¸‹ï¼Œæ²¡æœ‰åœ¨ä»»ä½•æŽ§åˆ¶å™¨ä¸‹è¿è¡Œçš„podçš„æ¨¡å¼ä¸‹ä½¿ç”¨VPA å°†å¯¼è‡´åˆ é™¤è¯¥podå¹¶ä¸”ä¸ä¼šé‡æ–°åˆ›å»ºè¯¥podã€‚ * VPAå‡†å…¥æŽ§åˆ¶å™¨æ˜¯ä¸€ä¸ªadmission webhookã€‚å¦‚æžœæ‚¨å‘ç¾¤é›†æ·»åŠ å…¶ä»–admission webhookï¼Œåˆ™å¿…é¡»åˆ†æžå®ƒä»¬ä¹‹é—´çš„äº¤äº’æ–¹å¼ä»¥åŠå®ƒä»¬æ˜¯å¦å¯èƒ½ç›¸äº’å†²çªã€‚å‡†å…¥æŽ§åˆ¶å™¨çš„é¡ºåºç”±APIserverä¸Šçš„æ ‡å¿—å®šä¹‰ã€‚ * VPAä¼šå¯¹æŸäº›å†…å˜ä¸è¶³äº‹ä»¶åšå‡ºååº”ï¼Œä½†å¹¶éžåœ¨æ‰€æœ‰æƒ…å†µä¸‹éƒ½ä¼šå‘ç”Ÿã€‚ * VPAæ€§èƒ½å°šæœªåœ¨å¤§åž‹é›†ç¾¤ä¸è¿›è¡Œæµ‹è¯•ã€‚ * VPAå»ºè®®å¯èƒ½ä¼šè¶…å‡ºå¯ç”¨èµ„æºï¼ˆä¾‹å¦‚èŠ‚ç‚¹å¤§å°ï¼Œå¯ç”¨å¤§å°ï¼Œå¯ç”¨é…é¢ï¼‰å¹¶å¯¼è‡´podè¿›å…¥å¾…å¤„ç†çŠ¶æ€ã€‚è¿™å¯ä»¥é€šè¿‡å°†VPAä¸ŽCluster Autoscalerä¸€èµ·ä½¿ç”¨æ¥è§£å†³ã€‚ * ä¸ŽåŒä¸€ä¸ªpodåŒ¹é…çš„å¤šä¸ªVPAèµ„æºå…·æœ‰æœªå®šä¹‰çš„è¡Œä¸ºã€‚ ç›¸å…³é“¾æŽ¥ [FQA](https://github.com/kubernetes/autoscaler/blob/master/vertical-pod-autoscaler/FAQ.md) [è®¾è®¡æ–¹æ¡ˆ](https://github.com/kubernetes/community/blob/master/contributors/design-proposals/autoscaling/vertical-pod-autoscaler.md) [APIå®šä¹‰](https://github.com/kubernetes/autoscaler/blob/master/vertical-pod-autoscaler/pkg/apis/autoscaling.k8s.io/v1beta2/types.go) [GitHub](https://github.com/kubernetes/autoscaler/blob/master/vertical-pod-autoscaler/README.md) ## CA ### ä»€ä¹ˆæ˜¯cluster-autoscaler CA[cluster-autoscaler](https://github.com/kubernetes/autoscaler/tree/master/cluster-autoscaler)æ˜¯ç”¨æ¥å¼¹æ€§ä¼¸ç¼©kubernetesé›†ç¾¤çš„ã€‚æˆ‘ä»¬åœ¨ä½¿ç”¨kubernetesé›†ç¾¤ç»å¸¸é—®åˆ°çš„ä¸€ä¸ªé—®é¢˜æ˜¯ï¼Œæˆ‘åº”è¯¥ä¿æŒå¤šå¤§çš„èŠ‚ç‚¹è§„æ¨¡æ¥æ»¡è¶³åº”ç”¨éœ€æ±‚å‘¢ï¼Ÿ cluster-autoscalerçš„å‡ºçŽ°è§£å†³äº†è¿™ä¸ªé—®é¢˜ï¼Œå®ƒå¯ä»¥è‡ªåŠ¨çš„æ ¹æ®éƒ¨ç½²çš„åº”ç”¨æ‰€è¯·æ±‚çš„èµ„æºé‡æ¥åŠ¨æ€çš„ä¼¸ç¼©é›†ç¾¤ #### ä»€ä¹ˆæ—¶å€™æ‰©ï¼Ÿ ç”±äºŽèµ„æºä¸è¶³ï¼Œpodè°ƒåº¦å¤±è´¥ï¼Œå¯¼è‡´podå¤„äºŽpendingçŠ¶æ€æ—¶ #### ä»€ä¹ˆæ—¶å€™ç¼©ï¼Ÿ nodeçš„èµ„æºåˆ©ç”¨çŽ‡è¾ƒä½Žæ—¶ï¼Œä¸”æ¤nodeä¸Šå˜åœ¨çš„podéƒ½èƒ½è¢«é‡æ–°è°ƒåº¦åˆ°å…¶ä»–èŠ‚ç‚¹ #### ä»€ä¹ˆæ ·çš„èŠ‚ç‚¹ä¸ä¼šè¢«CAåˆ é™¤ * èŠ‚ç‚¹ä¸Šæœ‰podè¢«PodDisruptionBudgetæŽ§åˆ¶å™¨é™åˆ¶ã€‚ * èŠ‚ç‚¹ä¸Šæœ‰å‘½åç©ºé—´æ˜¯kube-systemçš„podsã€‚ * èŠ‚ç‚¹ä¸Šçš„podä¸æ˜¯è¢«æŽ§åˆ¶å™¨åˆ›å»ºï¼Œä¾‹å¦‚ä¸æ˜¯è¢«deployment, replica set, job, stateful setåˆ›å»ºã€‚ * èŠ‚ç‚¹ä¸Šæœ‰podä½¿ç”¨äº†æœ¬åœ°å˜å‚¨ * èŠ‚ç‚¹ä¸Špodé©±é€åŽæ— å¤„å¯åŽ»ï¼Œå³æ²¡æœ‰å…¶ä»–nodeèƒ½è°ƒåº¦è¿™ä¸ªpod * èŠ‚ç‚¹æœ‰æ³¨è§£ï¼šâ€cluster-autoscaler.kubernetes.io/scale-down-disabledâ€: â€œtrueâ€ #### å¦‚ä½•é˜²æ¢nodeè¢«Cluster Autoscaleråˆ é™¤ kubectl annotate node cluster-autoscaler.kubernetes.io/scale-down-disabled=true #### éƒ¨ç½²æ–¹å¼ deployment #### What does CA do? Monitor the state of the cluster Look for pending pods Simulate scheduler Resize NodeGroups based on result of simulations #### What CA doesn't do? Register nodes in kubernetes Configure nodes in any way Put any labels or taints on new nodes Look at actual resource usage Support custom scheduling Predictive autoscaling #### Cluster Autoscaleræž¶æž„ ![k8s-ca](../.gitbook/assets/k8s-ca.png) autoscalerï¼šæ ¸å¿ƒæ¨¡å—ï¼Œè´Ÿè´£æ•´ä½“æ‰©ç¼©å®¹åŠŸèƒ½ Estimatorï¼šè´Ÿè´£è¯„ä¼°è®¡ç®—æ‰©å®¹ Simulatorï¼šè´Ÿè´£æ¨¡æ‹Ÿè°ƒåº¦ï¼Œè®¡ç®—ç¼©å®¹ Cloud Providerï¼šæŠ½è±¡äº†CloudProvideråŠNodeGroupç‰ç›¸å…³æŽ¥å£ï¼Œä¸Žäº‘APIäº¤äº’ #### æ‰©å®¹æµç¨‹ ![k8s-ca-up](../.gitbook/assets/k8s-ca-up.png) Cluster autoscaleræ¯10sæ£€æŸ¥æ˜¯å¦æœ‰podå¤„äºŽpendingçŠ¶æ€ å½“å‘çŽ°æœ‰podç”±äºŽèµ„æºä¸è¶³è€Œå¤„äºŽpendingçŠ¶æ€ï¼ŒCluster Autoscalerå‡†å¤‡è¿›è¡Œnodeçš„å‚¨å¤‡ ç”±cloud provideråˆ›å»ºnodeï¼ŒnodeåŠ å…¥é›†ç¾¤ï¼Œè¿›å…¥readyçŠ¶æ€ Scale-upå¯åŠ¨ä¸€ä¸ªAPIç›‘å¬çš„æœåŠ¡ï¼Œæ¯10s$--scan-interval$æ£€æŸ¥å› ä¸ºæ— nodeå¯è°ƒåº¦å¯¼è‡´pendingçš„podsï¼Œå³unschedulable podsï¼ŒPodCondition=falseï¼Œreason=unschedulableã€‚CAå‡è®¾é›†ç¾¤æ˜¯åŸºäºŽnode groupsï¼ŒåŒä¸ªnode groupé‡Œçš„æœºå™¨å…·æœ‰ç›¸åŒçš„æ€§èƒ½å’ŒåŒæ ·çš„labeslé›†ã€‚åŸºäºŽè¿™ä¸ªè¢ˆè£Ÿï¼ŒCAä¸ºæ¯ä¸ªnode groupåˆ›å»ºä¸€ä¸ªtemplate nodesã€‚ Expanderï¼šç”¨äºŽæ ¹æ®ç–ç•¥å†³å®šscale upå“ªä¸ªnode groupã€‚ æ–°nodeæ‹‰å–ä¹‹åŽéœ€è¦ä¸€äº›æ—¶é—´æ‰èƒ½è¢«æ³¨å†Œåˆ°kubernetesï¼Œä¾èµ–äºŽcloud providerå’Œéƒ¨ç½²çš„æ—¶é—´ã€‚CAå¸Œæœ›nodeåœ¨é›†ç¾¤ä¸çš„ç‰å¾…æ—¶é—´åœ¨15mä¹‹å†…ï¼ˆmax-node-provision-timeï¼‰ã€‚å¦‚æžœæœªå¦‚æœŸæ³¨å†Œï¼Œscale upä¼šæ‹‰èµ·æ–°nodeå¹¶ç§»é™¤æœªæ³¨å†Œçš„node #### å¦‚ä½•ç›‘æŽ§Cluster Autoscaler CA metrics /metrics /health-check #### CAé›†ç¾¤çŠ¶æ€æ£€æŸ¥ ![k8s-cluster](../.gitbook/assets/k8s-cluster.png) /var/log/cluster-autoscaler.log kubectl get configmap cluster-autoscaler-status -n kube-system -o yaml Events on pods $ç‰¹åˆ«æ˜¯unscheduled pods$ on nodes on kube-system/cluster-autoscaler-status config map kubectl get events -n kube-system \| grep cluster-autoscaler-status #### éƒ¨ç½²ä½¿ç”¨CA ç›´æŽ¥åœ¨é›†ç¾¤ä¸éƒ¨ç½²å³å¯ï¼Œç®€åŒ–çš„yamlå¦‚ä¸‹æ‰€ç¤ºï¼Œå¯åŠ¨å‚æ•°æŒ‰éœ€æ·»åŠ ï¼Œå…¶ä¸æ˜¯æœ€å°èŠ‚ç‚¹æ•°ï¼Œæ˜¯æœ€å¤§èŠ‚ç‚¹æ•° ```text apiVersion: extensions/v1beta1 kind: Deployment metadata: name: cluster-autoscaler labels: k8s-app: cluster-autoscaler spec: replicas: 1 selector: matchLabels: k8s-app: cluster-autoscaler template: metadata: labels: k8s-app: cluster-autoscaler spec: containers: - image: cluster-autoscaler:latest name: cluster-autoscaler command: - ./cluster-autoscaler - --nodes={{MIN}}:{{MAX}}:k8s-worker-asg-1 ``` ### CAä»£ç é€»è¾‘è§£æž #### CA æ—¶åºå›¾ ![ca](../.gitbook/assets/k8s-ca-logic.png) #### CA scaldownæµç¨‹å›¾ ![ScaleDown](../.gitbook/assets/k8s-scaledown-2.png) #### CA scalupæµç¨‹å›¾ ![ScaleUp](../.gitbook/assets/k8s-scale-up.png) #### cloudprovider ç®€å•ç‰ˆæµç¨‹å›¾ ![CA](../.gitbook/assets/paas-ca.png) ## kubernetes cluster autoscalerè°ƒç ”ä¸Žhpa/vpaè”åŠ¨ Kubernetesä½œä¸ºå®¹å™¨ç¼–æŽ’å·¥å…·ï¼Œåº”ç”¨éƒ¨ç½²åœ¨é›†ç¾¤ä¸ï¼Œåº”ç”¨çš„è´Ÿè½½æœ¬èº«æ˜¯ä¼šéšç€æ—¶é—´åŠ¨æ€å‘ç”Ÿå˜åŒ–çš„ï¼Œä¸ºäº†æ›´å¥½çš„å¹³è¡¡èµ„æºä½¿ç”¨çŽ‡ä»¥åŠæ€§èƒ½ï¼Œkuberneteså¼•å…¥äº†autoscalerã€‚å¯ä»¥æ ¹æ®åº”ç”¨è´Ÿè½½çš„æƒ…å†µåŠ¨æ€çš„æ‰©ç¼©å®¹èµ„æº Kubernetesçš„autoscaleråˆ†æˆä¸¤ä¸ªå±‚æ¬¡: * podçº§åˆ«çš„æ‰©å®¹ï¼ŒåŒ…å«æ¨ªå‘æ‰©å®¹$HPA$ä»¥åŠçºµå‘æ‰©å®¹$VPA$,æ‰©å®¹å®¹å™¨å¯ç”¨çš„èµ„æºä½¿ç”¨é‡ã€‚ * é›†ç¾¤çº§åˆ«çš„æ‰©å®¹ï¼Œé€šè¿‡CA$Cluster Autoscaler$æ¥æŽ§åˆ¶æ‰©å®¹æˆ–è€…ç¼©å°é›†ç¾¤ä¸Nodeçš„æ•°é‡ã€‚é›†ç¾¤çº§åˆ«çš„æ‰©å®¹ï¼Œé€šè¿‡CA$Cluster Autoscaler$æ¥æŽ§åˆ¶æ‰©å®¹æˆ–è€…ç¼©å°é›†ç¾¤ä¸Nodeçš„æ•°é‡ã€‚ ### æ¨ªå‘æ‰©å®¹$HPA$ æ‰©å®¹podçš„å‰¯æœ¬æ•°ï¼Œé€šè¿‡å®¹å™¨çš„CPUä»¥åŠï¼emoryæ¥è§¦å‘æ‰©å®¹æˆ–è€…ç¼©å®¹æ“ä½œï¼Œå¹¶ä¸”æ”¯æŒè‡ªå®šä¹‰æŒ‡æ ‡ã€å¤šä¸ªæŒ‡æ ‡ç”šè‡³æ˜¯å¤–éƒ¨çš„æŒ‡æ ‡æ¥ä½œä¸ºè§¦å‘æ‰©å®¹æˆ–è€…ç¼©å®¹æ“ä½œçš„æ¡ä»¶ã€‚ HPAçš„å·¥ä½œæµ ![hpa](../.gitbook/assets/hpa.png) * HPAæ¯éš”30secæ¥æ£€æŸ¥æŒ‡æ ‡çš„å€¼ * å¦‚æžœSPECIFIFD é˜ˆå€¼æ»¡è¶³æ¡ä»¶å°†ä¼šå¢žåŠ podå‰¯æœ¬çš„æ•°é‡ * HPAä¸»è¦æ›´æ–°deployment/replication controlleræŽ§åˆ¶å™¨å¯¹è±¡çš„å‰¯æœ¬æ•° * Deployment/replication controllerå°†ä¼šåˆ›å»ºå‡ºæ¥é¢å¤–éœ€è¦çš„pods å½“ä½¿ç”¨HPAçš„æ—¶å€™éœ€è¦æ³¨æ„çš„åœ°æ–¹ * HPAæ£€æŸ¥å‘¨æœŸä¸º30så¯ä»¥é€šè¿‡è®¾ç½®controller managerçš„horizontal-pod-autoscaler-sync-periodå‚æ•°æ¥æ”¹å˜ * é»˜è®¤çš„HPAç›¸å¯¹æŒ‡æ ‡å…¬å·®ä¸º10% * HPAåœ¨æœ€åŽä¸€æ¬¡æ‰©å®¹äº‹ä»¶åŽç‰å¾…3åˆ†é’Ÿï¼Œä»¥ä½¿æŒ‡æ ‡ç¨³å®šä¸‹æ¥ã€‚å¯é€šè¿‡ - horizontal-pod-autoscaler-upscale-delayå‚æ•°æ¥é…ç½® * HPAä»Žæœ€åŽä¸€æ¬¡ç¼©å®¹äº‹ä»¶å¼€å§‹ç‰å¾…5åˆ†é’Ÿï¼Œä»¥é¿å…è‡ªåŠ¨è°ƒèŠ‚å™¨æŠ–åŠ¨ã€‚å¯é€šè¿‡ - horizontal-pod-autoscaler-downscale-delayå‚æ•°æ¥é…ç½® * ç›¸å¯¹äºŽreplication controllerè€Œè¨€ï¼Œï½ˆï½ï½æ›´åŠ é€‚åˆä¸Ždeploymentä¸€èµ·é…ç½®å·¥ä½œ ### çºµå‘æ‰©å®¹$VPA$ Vertical Pods Autoscalerï¼ˆVPAï¼‰ä¸ºçŽ°æœ‰podåˆ†é…æ›´å¤šï¼ˆæˆ–æ›´å°‘ï¼‰çš„CPUæˆ–å†…å˜ã€‚å®ƒå¯ä»¥é€‚ç”¨äºŽæœ‰çŠ¶æ€å’Œæ— çŠ¶æ€çš„podï¼Œä½†å®ƒä¸»è¦æ˜¯ä¸ºæœ‰çŠ¶æ€æœåŠ¡è€Œæž„å»ºçš„ã€‚ä½†æ˜¯ï¼Œå¦‚æžœæ‚¨å¸Œæœ›å®žçŽ°æœ€åˆä¸ºpodåˆ†é…çš„èµ„æºçš„è‡ªåŠ¨æ›´æ£ï¼Œåˆ™å¯ä»¥å°†å…¶ç”¨äºŽæ— çŠ¶æ€å®¹å™¨ã€‚VPAè¿˜å¯ä»¥å¯¹OOMï¼ˆå†…å˜ä¸è¶³ï¼‰äº‹ä»¶åšå‡ºååº”ã€‚VPAå½“å‰è¦æ±‚é‡æ–°å¯åŠ¨podä»¥æ›´æ”¹å·²åˆ†é…çš„CPUå’Œå†…å˜ã€‚å½“VPAé‡æ–°å¯åŠ¨podæ—¶ï¼Œå®ƒä¼šè€ƒè™‘podsåˆ†å‘é¢„ç®—ï¼ˆPDBï¼‰ä»¥ç¡®ä¿å§‹ç»ˆå…·æœ‰æ‰€éœ€çš„æœ€å°podæ•°ã€‚æ‚¨å¯ä»¥è®¾ç½®VPAå¯ä»¥åˆ†é…ç»™ä»»ä½•podçš„èµ„æºçš„æœ€å°å€¼å’Œæœ€å¤§å€¼ã€‚ä¾‹å¦‚ï¼Œæ‚¨å¯ä»¥å°†æœ€å¤§å†…å˜é™åˆ¶é™åˆ¶ä¸ºä¸è¶…è¿‡8 GBã€‚å½“æ‚¨çŸ¥é“å½“å‰èŠ‚ç‚¹æ— æ³•ä¸ºæ¯ä¸ªå®¹å™¨åˆ†é…è¶…è¿‡8 GBæ—¶ï¼Œè¿™å°¤å…¶æœ‰ç”¨ã€‚ VPAè¿˜æœ‰ä¸€ä¸ªåä¸ºVPA Recommenderçš„æœ‰è¶£åŠŸèƒ½ã€‚å®ƒç›‘è§†æ‰€æœ‰podçš„åŽ†å²èµ„æºä½¿ç”¨æƒ…å†µå’ŒOOMäº‹ä»¶ï¼Œä»¥å»ºè®®requestèµ„æºçš„æ–°å€¼ã€‚æŽ¨èå™¨ä½¿ç”¨ä¸€äº›æ™ºèƒ½ç®—æ³•æ¥æ ¹æ®åŽ†å²æŒ‡æ ‡è®¡ç®—å†…å˜å’ŒCPUå€¼ã€‚å®ƒè¿˜æä¾›äº†ä¸€ä¸ªAPIï¼Œé€šè¿‡å®ƒå¯ä»¥èŽ·å–podæè¿°ç¬¦å¹¶æä¾›å»ºè®®çš„requestå€¼ã€‚ å€¼å¾—ä¸€æçš„æ˜¯ï¼ŒVPAæŽ¨èè€…ä¸ä¼šè®¾ç½®èµ„æºçš„limitå€¼ã€‚è¿™å¯èƒ½å¯¼è‡´podåž„æ–èŠ‚ç‚¹å†…çš„èµ„æºã€‚å»ºè®®ä½ åœ¨namespacçº§åˆ«è®¾ç½®ä¸€ä¸ªâ€œé™åˆ¶â€å€¼ï¼Œä»¥é¿å…ç–¯ç‹‚æ¶ˆè€—å†…å˜æˆ–CPU VPAå·¥ä½œæµ ![vpa](../.gitbook/assets/vpa.png) VPAæ¯éš”ï¼‘ï¼ï½“æ£€æŸ¥æŒ‡æ ‡çš„å€¼ * å½“é˜ˆå€¼è¾¾åˆ°çš„æ—¶å€™ï¼ŒVPAå°è¯•ä¿®æ”¹åˆ†é…çš„memoryå’ŒCPU * VPAä¸»è¦æ˜¯æ›´æ–°deploymentæˆ–è€…replication controller specsä¸çš„resourceså®šä¹‰ * å½“Podé‡å¯çš„æ—¶å€™ï¼Œæ‰€æœ‰è¯·æ±‚çš„èµ„æºå¾—åˆ°è°ƒæ•´ ä½¿ç”¨VPAçš„æ—¶å€™éœ€è¦æ³¨æ„ç‚¹ * å¦‚æžœä¸é‡æ–°å¯åŠ¨podï¼Œåˆ™æ— æ³•è¿›è¡Œèµ„æºæ›´æ”¹ã€‚åˆ°ç›®å‰ä¸ºæ¢ä¸»è¦ç†æ€§ï¼Œå°±æ˜¯è¿™ç§å˜åŒ–å¯èƒ½ä¼šé€ æˆå¾ˆå¤šä¸ç¨³å®šã€‚å› æ¤ï¼Œæƒ³è¦é‡æ–°å¯åŠ¨podå¹¶æ ¹æ®æ–°åˆ†é…çš„èµ„æºè¿›è¡Œè°ƒåº¦ã€‚ * VPAå’ŒHPAå°šæœªç›¸äº’å…¼å®¹ï¼Œæ— æ³•åœ¨ç›¸åŒçš„podä¸Šè¿è¡Œã€‚å¦‚æžœæ‚¨åœ¨åŒä¸€ç¾¤é›†ä¸ä½¿ç”¨å®ƒä»¬ï¼Œè¯·ç¡®ä¿å°†å®ƒä»¬çš„èŒƒå›´åˆ†å¼€ã€‚ * VPAä»…æ ¹æ®è§‚å¯Ÿåˆ°çš„è¿‡åŽ»å’Œå½“å‰èµ„æºä½¿ç”¨æƒ…å†µè°ƒæ•´å®¹å™¨çš„èµ„æºè¯·æ±‚ã€‚å®ƒæ²¡æœ‰è®¾ç½®èµ„æºé™åˆ¶ã€‚å¯¹äºŽè¡Œä¸ºä¸ç«¯çš„åº”ç”¨ç¨‹åºè€Œè¨€ï¼Œè¿™å¯èƒ½ä¼šå‡ºçŽ°é—®é¢˜ï¼Œè¿™äº›åº”ç”¨ç¨‹åºå¼€å§‹ä½¿ç”¨è¶Šæ¥è¶Šå¤šçš„èµ„æºå¯¼è‡´podè¢«Kubernetesæ€æ»ã€‚ ### é›†ç¾¤æ‰©å®¹$Cluster Autoscaler$ Cluster Autoscalerï¼ˆCAï¼‰æ ¹æ®pendingçŠ¶æ€çš„podæ¥æ‰©å±•æ‚¨çš„ç¾¤é›†èŠ‚ç‚¹ã€‚å®ƒä¼šå®šæœŸæ£€æŸ¥æ˜¯å¦æœ‰pendingçŠ¶æ€çš„podï¼Œå¦‚æžœéœ€è¦æ›´å¤šèµ„æºå¹¶ä¸”æ‰©å±•åŽçš„ç¾¤é›†ä»åœ¨ç”¨æˆ·æä¾›çš„çº¦æŸèŒƒå›´å†…ï¼Œåˆ™ä¼šå¢žåŠ ç¾¤é›†çš„å¤§å°ã€‚CAä¸Žäº‘æä¾›å•†æŽ¥å£ä»¥è¯·æ±‚æ›´å¤šèŠ‚ç‚¹æˆ–é‡Šæ”¾ç©ºé—²èŠ‚ç‚¹ã€‚å®ƒé€‚ç”¨äºŽGCPï¼ŒAWSå’ŒAzureã€‚ç‰ˆæœ¬1.0ï¼ˆGAï¼‰ä¸Žkubernetes 1.8ä¸€èµ·å‘å¸ƒã€‚ CAå·¥ä½œæµ ![ca](../.gitbook/assets/ca.png) * CAæ¯éš”10sæ£€æŸ¥ä»¥ä¸‹pendingçŠ¶æ€çš„å®¹å™¨ * å¦‚æžœå˜åœ¨å› ä¸ºèµ„æºä¸è¶³å¯¼è‡´pendingçŠ¶æ€çš„podå˜åœ¨çš„æ—¶å€™ï¼Œå°è¯•åˆ›å»ºä¸€ä¸ªæˆ–å¤šä¸ªnodes * å½“nodeæ˜¯è¢«cloud provideræ‰€ç®¡ç†çš„ï¼Œnodeå°†ä¼šè¢«æ·»åŠ åˆ°é›†ç¾¤ä¸ï¼Œæˆä¸ºreadyçš„èŠ‚ç‚¹æ¥åˆ›å»ºpod * Kubernetesè°ƒåº¦å™¨åˆ†é…pendingçŠ¶æ€çš„podsåˆ°æ–°çš„nodeèŠ‚ç‚¹ä¸Šã€‚å¦‚æžœä¸€äº›podä»ç„¶å¤„äºŽpendingçŠ¶æ€ï¼Œè¿™ä¸ªè¿‡ç¨‹å°†ä¼šç»§ç»ï¼Œå°†ä¼šæœ‰æ›´å¤šçš„nodesæ·»åŠ åˆ°é›†ç¾¤ä¸ CAä½¿ç”¨çš„æ—¶å€™æ³¨æ„äº‹é¡¹ * Cluster Autoscalerç¡®ä¿ç¾¤é›†ä¸çš„æ‰€æœ‰podéƒ½æœ‰ä¸€ä¸ªå¯ä»¥è¿è¡Œçš„ä½ç½®ï¼Œæ— è®ºæ˜¯å¦æœ‰ä»»ä½•CPUè´Ÿè½½ã€‚æ¤å¤–ï¼Œå®ƒä¼šå°è¯•ç¡®ä¿ç¾¤é›†ä¸æ²¡æœ‰ä¸éœ€è¦çš„èŠ‚ç‚¹ã€‚ï¼ˆèµ„æºï¼‰ * CAåœ¨å¤§çº¦30ç§’å†…å®žçŽ°äº†å¯æ‰©å±•æ€§éœ€æ±‚ã€‚ * åœ¨èŠ‚ç‚¹å˜ä¸ºä¸éœ€è¦ä¹‹å‰ï¼ŒCAé»˜è®¤ç‰å¾…10åˆ†é’Ÿï¼Œç„¶åŽå†ç¼©å°èŠ‚ç‚¹ã€‚ * CAå…·æœ‰æ‰©å±•å™¨çš„æ¦‚å¿µã€‚æ‰©å±•å™¨æä¾›äº†ä¸åŒçš„ç–ç•¥æ¥é€‰æ‹©è¦æ·»åŠ æ–°èŠ‚ç‚¹çš„èŠ‚ç‚¹ç»„ã€‚ * è´Ÿè´£ä»»åœ°ä½¿ç”¨"cluster-autoscaler.kubernetes.io/safe-to-evict"ï¼š"true"ã€‚å¦‚æžœæ‚¨è®¾ç½®äº†æ‰€æœ‰èŠ‚ç‚¹ä¸Šçš„è®¸å¤špodæˆ–è¶³å¤Ÿçš„podï¼Œåˆ™ä¼šå¤±åŽ»å¾ˆå¤§çš„ç¼©å°çµæ´»æ€§ã€‚ * ä½¿ç”¨PodDisruptionBudgetså¯ä»¥é˜²æ¢åˆ é™¤podå¹¶ä½¿åº”ç”¨ç¨‹åºçš„ä¸€éƒ¨åˆ†å®Œå…¨æ— æ³•è¿è¡Œã€‚ Kubernetes autoscalersäº¤äº’ä¸€èµ·æ€Žä¹ˆå·¥ä½œ å¦‚æžœæ‚¨å¸Œæœ›è‡ªåŠ¨æ‰©å±•æ‚¨çš„Kubernetesé›†ç¾¤ï¼Œåˆ™éœ€è¦åœ¨CAä¸ä½¿ç”¨podå±‚è‡ªåŠ¨ç¼©æ”¾å™¨ã€‚ä»–ä»¬å½¼æ¤åˆä½œçš„æ–¹å¼ç›¸å¯¹ç®€å•ï¼Œå¦‚ä¸‹å›¾æ‰€ç¤ºã€‚ ![ca-hpa-vpa](../.gitbook/assets/ca-hpa-vpa.png) * HPAæˆ–è€…VPAæ¥æ›´æ–°å·²ç»å˜åœ¨çš„podå‰¯æœ¬æ•°æˆ–è€…ä½¿ç”¨çš„resources * å¦‚æžœæ²¡æœ‰è¶³å¤Ÿçš„èŠ‚ç‚¹åœ¨å¯ä¼¸ç¼©æ€§äº‹ä»¶åŽè¿è¡Œpodï¼Œåˆ™CAä¼šå‘çŽ°éƒ¨åˆ†æˆ–å…¨éƒ¨å·²ç¼©æ”¾çš„podå¤„äºŽæŒ‚èµ·çŠ¶æ€çš„äº‹å®žã€‚ * CAæ‰©å®¹æ–°çš„nodeåˆ°é›†ç¾¤ä¸ * Podså°†ä¼šè¢«è°ƒåº¦åˆ°è¢«æ–°ç®¡ç†çš„nodeä¸Š å¸¸è§çš„é”™è¯¯ æˆ‘åœ¨ä¸åŒçš„è®ºå›ä¸Šçœ‹è¿‡ï¼Œæ¯”å¦‚Kubernetes slackå’ŒStackOverflowé—®é¢˜ï¼Œç”±äºŽä¸€äº›äº‹å®žå¯¼è‡´çš„å¸¸è§é—®é¢˜ï¼Œè®¸å¤šDevOpsé”™è¿‡äº†è‡ªåŠ¨ç¼©æ”¾å™¨ã€‚ HPAå’ŒVPAä¾èµ–äºŽæŒ‡æ ‡å’Œä¸€äº›åŽ†å²æ•°æ®ã€‚å¦‚æžœæ‚¨æ²¡æœ‰åˆ†é…è¶³å¤Ÿçš„èµ„æºï¼Œæ‚¨çš„podå°†è¢«OOMæ€æ»ï¼Œå¹¶ä¸”æ°¸è¿œä¸ä¼šæœ‰æœºä¼šç”ŸæˆæŒ‡æ ‡ã€‚åœ¨è¿™ç§æƒ…å†µä¸‹ï¼Œpodsä¸Šçš„æ‰©å±•å™¨å¯èƒ½æ°¸è¿œä¸ä¼šå‘ç”Ÿã€‚æ‰©å®¹æ˜¯æ—¶é—´æ•æ„Ÿçš„æ“ä½œã€‚åœ¨ç”¨æˆ·é‡åˆ°åº”ç”¨ç¨‹åºä¸çš„ä»»ä½•ä¸æ–æˆ–å´©æºƒä¹‹å‰ï¼Œæ‚¨å¸Œæœ›æ‚¨çš„podå’Œç¾¤é›†èƒ½å¤Ÿç›¸å½“å¿«åœ°æ‰©å±•ã€‚æ‚¨åº”è¯¥è€ƒè™‘å®¹å™¨å’Œç¾¤é›†æ‰©å±•çš„å¹³å‡æ—¶é—´ã€‚ æœ€ä½³æ¡ˆä¾‹åœºæ™¯ï¼ï¼”åˆ†é’Ÿ * 30ç§’ - ç›®æ ‡æŒ‡æ ‡å€¼æ›´æ–°ï¼š30-60ç§’ * 30ç§’ - HPAæ£€æŸ¥æŒ‡æ ‡å€¼ï¼š30ç§’ - >30ç§’ - HPAæ£€æŸ¥æŒ‡æ ‡å€¼ï¼š30ç§’ - > * <2ç§’ - Podsåˆ›å»ºä¹‹åŽè¿›å…¥pendingçŠ¶æ€<2ç§’ã€€ï¼Podsåˆ›å»ºä¹‹åŽè¿›å…¥pendingçŠ¶æ€ * <2ç§’ - CAçœ‹åˆ°pendingçŠ¶æ€çš„podsï¼Œä¹‹åŽè°ƒç”¨æ¥åˆ›å»ºnode 1ç§’<2ç§’ã€€ï¼CAçœ‹åˆ°pendingçŠ¶æ€çš„podsï¼Œä¹‹åŽè°ƒç”¨æ¥åˆ›å»ºnode 1ç§’ * 3åˆ†é’Ÿ - cloud provideråˆ›å»ºnodeï¼Œä¹‹åŽåŠ å…¥k8sä¹‹åŽç‰å¾…nodeå˜æˆready,ä¸Šçº¿æ˜¯10åˆ†é’Ÿ $åˆç†$æœ€ç³Ÿç³•çš„æƒ…å†µ - 12åˆ†é’Ÿ * 60 ç§’ â€”ç›®æ ‡æŒ‡æ ‡å€¼æ›´æ–° * 30 ç§’â€Šâ€”â€ŠHPAæ£€æŸ¥æŒ‡æ ‡å€¼ * < 2 ç§’â€Šâ€”â€ŠPodsåˆ›å»ºä¹‹åŽè¿›å…¥pendingçŠ¶æ€ * < 2 ç§’â€Šâ€”CAçœ‹åˆ°pendingçŠ¶æ€çš„podsï¼Œä¹‹åŽè°ƒç”¨æ¥åˆ›å»ºnode 1ç§’ * 10 åˆ†é’Ÿ â€” cloud provideråˆ›å»ºï½Žï½ï½„ï½…ï¼Œä¹‹åŽåŠ å…¥ï½‹8sä¹‹åŽç‰å¾…nodeå˜æˆready,ä¸Šçº¿æ˜¯10åˆ†é’Ÿ ä¸è¦å°†äº‘æä¾›ç¨‹åºå¯ä¼¸ç¼©æ€§æœºåˆ¶ä¸ŽCAæ··æ·†ã€‚CAåœ¨é›†ç¾¤å†…éƒ¨å·¥ä½œï¼Œè€Œäº‘æä¾›å•†çš„å¯æ‰©å±•æ€§æœºåˆ¶ï¼ˆä¾‹å¦‚AWSå†…éƒ¨çš„ASGï¼‰åŸºäºŽèŠ‚ç‚¹åˆ†é…å·¥ä½œã€‚å®ƒä¸çŸ¥é“æ‚¨çš„podæˆ–åº”ç”¨ç¨‹åºæ£åœ¨å‘ç”Ÿä»€ä¹ˆã€‚ä¸€èµ·ä½¿ç”¨å®ƒä»¬ä¼šä½¿æ‚¨çš„ç¾¤é›†ä¸ç¨³å®šå¹¶ä¸”éš¾ä»¥é¢„æµ‹è¡Œä¸ºã€‚ ç›¸å…³é“¾æŽ¥ [CA Events](https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-events-are-emitted-by-ca) [å‚æ•°è§£æž](https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-are-the-parameters-to-ca) [å¦‚ä½•å¼€å‘CA](https://github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/FAQ.md#what-events-are-emitted-by-ca)