自动缩放¶
Knative Serving为应用程序提供自动伸缩,或 autoscaling ,以匹配传入的需求。 这是通过使用Knative Pod Autoscaler (KPA)默认提供的。
例如,如果一个应用程序没有接收流量,并且启用了向零扩展,Knative Serving将应用程序扩展到零副本。 如果禁用了向零伸缩,则应用程序将被缩小到集群上为应用程序指定的最小副本数量。 如果应用程序的流量增加,副本将被扩大以满足需求。
如果您具有集群管理员权限,可以为集群启用和禁用伸缩至零功能。 参见配置缩放到零。
如果在您的集群上启用了自动伸缩功能,要为您的应用程序使用自动伸缩功能,您必须配置并发和伸缩边界。
额外的资源¶
- 试试Go Autoscale Sample App.
- 配置您的Knative部署以使用Kubernetes Horizontal Pod Autoscaler (HPA)而不是默认的KPA。关于如何安装HPA,请参见安装可选服务扩展.
- 配置自动伸缩器使用的度量类型.
- 配置您的Knative服务使用container-freeze,它会在Pod的流量降为零时冻结正在运行的进程。最有价值的好处是减少了这种配置中的冷启动时间。