Skip to content
Carlos Rios edited this page Nov 25, 2018 · 2 revisions
  • request é o minimo para inicializar uma aplicação

  • limit é o máximo para a aplicação usar

  • se não houver o request disponível em alguma maquina mãe, outra máquina mãe levanta.

  • uma aplicação com GRANDE request de cpu pode fazer uma maquina ficar com BAIXO uso de memória pois não ha cpu disponível

  • uma aplicação com GRANDE request de memória pode fazer uma maquina ficar com BAIXO uso de cpu

  • não existe relação entre req/limit com o hpa. hpa mensura o consumo dentro de cada maquina mae e faz uma média desse consumo de todos os conteiners em maquinas mãe . posso ter uma aplicacao com 100m de cpu e ela estar usando 10% de hpa em uma maquina mãe e 50% em outra. pois nas maquinas mães diferentes tem aplicações diferentes, cada uma com seu ciclo de requests independentes

  • Unidades de cpu nos datacenters:

    • AWS: 1vCPU
    • GCE: 1Core
  • quanto mais uso de cpu e menor cpu limit tem, mais aumenta o "consumo" de cpu, com isso ativa o hpa

  • grandes usos de cpu APENAS para aplicações de fins científicos, matemáticos, AIs, etc...

  • nenhum cpu limit acima de 1000m

  • nenhum cpu limit acima de 8000m (8cpus , 8 cores das maquinas mais) Acima disso nunca levanta

  • não usar mais multiple threads em kubernet/docker.. (node_workers) abandono no naughty ou qualquer coisa outra coisa como forever, supervisor

  • Memória não tem autoscaling, a maquina mate killa a app e pronto.

Clone this wiki locally