API 网关详解:核心功能、工作原理与 Spring Cloud Gateway / Kong / APISIX 选型
什么是网关?
API 网关(API Gateway)是位于客户端与后端服务之间的统一入口,所有客户端请求先经过网关,再由网关路由到具体的目标服务。
核心价值
在微服务架构下,一个系统被拆分为多个服务。像安全认证、流量控制、日志、监控等功能是每个服务都需要的。如果没有网关,我们需要在每个服务中单独实现这些功能,导致:
- 代码重复:相同逻辑在多个服务中冗余实现
- 管理分散:缺乏统一的配置和监控视图
- 维护成本高:功能变更需要修改所有服务

核心职责
网关的功能虽然繁多,但核心可以概括为两件事:
| 职责 | 说明 | 典型功能 |
|---|---|---|
| 请求转发 | 将客户端请求路由到正确的目标服务 | 动态路由、负载均衡、协议转换 |
| 请求过滤 | 在请求到达后端服务前/后进行拦截处理 | 身份认证、权限校验、限流熔断、日志记录 |
下表是抽象层面的两类核心职责,落到具体能力上,会衍生出下一节列举的十余项网关功能。
网关可以提供请求转发、安全认证(身份/权限认证)、流量控制、负载均衡、降级熔断、日志、监控、参数校验、协议转换等功能。
网关在微服务架构中的位置:所有客户端请求先到达网关,网关负责统一的认证鉴权、流量控制、路由分发,后端服务专注于业务逻辑处理。
高可用部署
引入网关后会增加一次网络转发(性能损耗在内网环境下通常可忽略),但同时也引入了新的单点风险。因此,网关服务本身必须保障高可用:
如下图所示,网关服务外层通过 Nginx(或其他负载均衡设备/软件)进行负载转发以达到高可用。Nginx 在部署时也应考虑高可用,避免单点风险。

网关能提供哪些功能?
绝大部分网关可以提供下面这些功能(有一些功能需要借助其他框架或者中间件):
- 请求转发:将请求转发到目标微服务。
- 负载均衡:根据各个微服务实例的负载情况或者具体的负载均衡策略配置对请求实现动态的负载均衡。
- 安全认证:对用户请求进行身份验证并仅允许可信客户端访问 API,并且还能够使用类似 RBAC 等方式来授权。
- 参数校验:支持参数映射与校验逻辑。
- 日志记录:记录所有请求的行为日志供后续使用。
- 监控告警:从业务指标、机器指标、JVM 指标等方面进行监控并提供配套的告警机制。
- 流量控制:对请求的流量进行控制,也就是限制某一时刻内的请求数。
- 熔断降级:实时监控请求的统计信息,达到配置的失败阈值后,自动熔断,返回默认值。
- 响应缓存:当用户请求获取的是一些静态的或更新不频繁的数据时,一段时间内多次请求获取到的数据很可能是一样的。对于这种情况可以将响应缓存起来。这样用户请求可以直接在网关层得到响应数据,无需再去访问业务服务,减轻业务服务的负担。
- 响应聚合:某些情况下用户请求要获取的响应内容可能会来自于多个业务服务。通用网关可以做简单聚合,但复杂聚合更推荐放在 BFF(Backend For Frontend)或 GraphQL 层,避免把业务编排逻辑沉淀到基础设施层。
- 灰度发布:将请求动态分流到不同的服务版本(最基本的一种灰度发布)。
- 异常处理:对于业务服务返回的异常响应,可以在网关层在返回给用户之前做转换处理。这样可以把一些业务侧返回的异常细节隐藏,转换成用户友好的错误提示返回。
- API 文档:如果计划将 API 暴露给组织以外的开发人员,那么必须考虑使用 API 文档,例如 Swagger 或 OpenAPI。
- 协议转换:通过协议转换整合后台基于 REST、AMQP、Dubbo 等不同风格和实现技术的微服务,面向 Web/Mobile、开放平台等特定客户端提供统一服务。
- 证书管理:将 SSL 证书部署到 API 网关,由一个统一的入口管理接口,降低了证书更换时的复杂度。
需要注意的是,网关并不适合承载所有逻辑。强业务规则校验、复杂字段映射、长事务、长连接业务逻辑、细粒度业务授权等,通常应该回到业务服务、BFF 或 GraphQL 层处理。网关更适合做协议级、通用型、跨服务的能力,避免演化成难以维护的“巨石网关”。
下图来源于百亿规模 API 网关服务 Shepherd 的设计与实现 - 美团技术团队 - 2021这篇文章。

有哪些常见的网关系统?
Netflix Zuul
Zuul 是 Netflix 开发的一款提供动态路由、监控、弹性、安全的网关服务,基于 Java 技术栈开发,可以和 Eureka、Ribbon、Hystrix 等组件配合使用。
Zuul 核心架构如下:

Zuul 主要通过过滤器(类似于 AOP)来过滤请求,从而实现网关必备的各种功能。

我们可以自定义过滤器来处理请求,并且,Zuul 生态本身就有很多现成的过滤器供我们使用。就比如限流可以使用社区扩展 spring-cloud-zuul-ratelimit(这里只是举例说明)。需要区分的是:Hystrix 主要负责熔断、超时、降级和线程池/信号量隔离,并不是严格意义上的 QPS 限流组件。
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-zuul</artifactId>
</dependency>
<dependency>
<groupId>com.marcosbarbero.cloud</groupId>
<artifactId>spring-cloud-zuul-ratelimit</artifactId>
<version>2.2.0.RELEASE</version>
</dependency>Zuul 1.x 基于同步 IO,性能较差。Zuul 2.x 基于 Netty 实现了异步 IO,性能得到了大幅改进。

重要提示:Spring Cloud Netflix 中 Zuul 1.x、Ribbon、Hystrix 等模块已进入维护模式,Spring Cloud 主流发行版也早已转向 Spring Cloud Gateway。尽管 Netflix 开源了 Zuul 2.x,但 Zuul 2.x 并未被集成到 Spring Cloud 主流版本中。对于 Spring Cloud 技术栈的新项目,不建议再选用 Zuul 1.x;存量项目应结合重构窗口逐步迁移到 Spring Cloud Gateway 或其他现代网关。
- GitHub 地址: https://github.com/Netflix/zuul
- 官方 Wiki: https://github.com/Netflix/zuul/wiki
Spring Cloud Gateway
Spring Cloud Gateway 属于 Spring Cloud 生态系统中的网关,其诞生的目标是为了替代老牌网关 Zuul(准确说是 Zuul 1.x)。值得注意的是,Spring Cloud Gateway 的起步时间早于 Zuul 2.x,两者属于不同的技术演进路线。
为什么 Spring Cloud Gateway 性能更好?
| 版本 | IO 模型 | 线程模型 | 吞吐量 | 延迟 |
|---|---|---|---|---|
| Zuul 1.x | 同步阻塞(Servlet) | 每请求一线程 | 低 | 高 |
| Zuul 2.x | 异步非阻塞(Netty) | 事件循环 | 高 | 低 |
| Spring Cloud Gateway | 异步非阻塞(Netty) | 事件循环 | 高 | 低 |
Spring Cloud Gateway 基于 Spring WebFlux 实现,而不是传统的 Spring Web MVC。Spring WebFlux 使用 Reactor 库来实现响应式编程模型,底层基于 Netty 实现异步非阻塞的 I/O。
响应式编程的优势:
- 非阻塞 I/O:无需为每个请求分配独立线程,少量线程即可处理大量并发连接
- 背压机制:Reactor 的背压主要作用于网关进程内部的响应式链路,避免 in-flight 请求把自身压垮。端到端的过载保护仍需依赖显式的限流、舱壁、超时和熔断,例如
RequestRateLimiter、CircuitBreaker等过滤器 - 资源利用率高:线程上下文切换开销大幅降低
核心概念
Spring Cloud Gateway 的核心组件包括三个部分:
- Route(路由):网关的基本构建块,由 ID、目标 URI、断言集合和过滤器集合组成
- Predicate(断言):基于 Java 8
Predicate函数式接口实现,用于匹配 HTTP 请求(如路径、方法、请求头等)。例如Path=/api/users/**、Method=GET、Header=X-Request-Id, \d+,多个 Predicate 通过逻辑与组合 - Filter(过滤器):
GatewayFilter的实例,用于在请求被发送到下游服务之前或之后修改请求和响应
Spring Cloud Gateway 和 Zuul 2.x 都是通过过滤器来处理请求,但 Spring Cloud Gateway 与 Spring 生态系统(如 Eureka、Consul、Config)集成更加紧密。目前,对于 Java 技术栈的新项目,Spring Cloud Gateway 通常是更主流的选择。需要注意的是,Spring Cloud Gateway 4.x/5.x 文档中已经同时提供 Server 与 Proxy Exchange 两类形态,并分别提供 WebFlux 和 Web MVC 兼容路径。熟悉 Servlet 技术栈、暂时不想引入响应式编程复杂度的团队,也可以评估 Spring Cloud Gateway Server MVC。
在能力边界上也要说清楚:Spring Cloud Gateway 内置了 RequestRateLimiter 过滤器,常见 Redis 实现基于令牌桶算法,但 Redis 限流还需要引入对应的 reactive Redis 依赖;熔断能力则是通过 Spring Cloud CircuitBreaker 适配 Resilience4j,需要额外引入 spring-cloud-starter-circuitbreaker-reactor-resilience4j 等依赖。路由配置也不只是“内存配置”,默认可以写在 YAML 中,也可以通过 RouteDefinitionRepository、Redis 路由仓库或自定义实现接入外部配置,并结合刷新机制动态生效。
- GitHub 地址: https://github.com/spring-cloud/spring-cloud-gateway
- 官网: https://spring.io/projects/spring-cloud-gateway
OpenResty
根据官方介绍:
OpenResty 是一个基于 Nginx 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

OpenResty 基于 Nginx,主要还是看中了其优秀的高并发能力。不过,由于 Nginx 采用 C 语言开发,二次开发门槛较高。如果想在 Nginx 上实现一些自定义的逻辑或功能,就需要编写 C 语言的模块,并重新编译 Nginx。
为了解决这个问题,OpenResty 集成并维护了 ngx_http_lua_module、ngx_stream_lua_module 等模块,把 Lua/LuaJIT 整合进了 Nginx,从而让我们能够在 Nginx 内部嵌入 Lua 脚本,使得可以通过简单的 Lua 语言来扩展网关的功能,比如实现自定义的路由规则、过滤器、缓存策略等。
Lua 是一种非常快速的动态脚本语言,它的运行速度接近于 C 语言。LuaJIT 是 Lua 的一个即时编译器,它可以显著提高 Lua 代码的执行效率。LuaJIT 将一些常用的 Lua 函数和工具库预编译并缓存,这样在下次调用时就可以直接使用缓存的字节码,从而大大加快了执行速度。
关于 OpenResty 的入门以及网关安全实战推荐阅读这篇文章:每个后端都应该了解的 OpenResty 入门以及网关安全实战。
- GitHub 地址: https://github.com/openresty/openresty
- 官网地址: https://openresty.org/
Kong
Kong 是一款基于 OpenResty (Nginx + Lua)的高性能、云原生、可扩展、生态丰富的网关系统,主要由 3 个组件组成:
- Kong Server:基于 Nginx 的服务器,用来接收 API 请求。
- PostgreSQL:用来存储操作数据(传统数据库模式)。Kong 早期也支持 Cassandra,但 Kong Gateway 3.4 起已经移除 Cassandra DB 支持,新部署不建议再选 Cassandra。
- Kong Manager:官方 UI 管理工具,提供可视化的 API 管理、监控和配置功能(有 OSS 开源版和 Enterprise 企业版)。也可使用 RESTful Admin API 进行管理。

Kong 传统模式依赖外部数据库存储配置,架构相对复杂,需要额外保障数据库层的高可用。但自 Kong 1.1 版本起,已支持 DB-less 模式(无库模式):
- 传统模式:使用 PostgreSQL 存储配置,适合需要通过 Admin API 持久化管理 API 数据的场景
- DB-less 模式:通过声明式配置文件管理,无需部署数据库,架构更加轻量
- Hybrid 模式:控制平面使用数据库管理配置,数据平面不直接连接数据库,适合多集群、跨区域分发配置
- Kubernetes Ingress 模式:通过 ConfigMap 或 CRD(Kubernetes Custom Resource Definitions)管理配置,无需数据库,是 K8s 环境下的主流用法
注意:本文后续讨论的 Kong 高可用问题,主要针对传统数据库模式。在 K8s 环境使用 Ingress Controller 模式,或使用 DB-less/Hybrid 模式时,架构和运维关注点会有明显差异。
Kong 提供了插件机制来扩展其功能,插件在 API 请求响应循环的生命周期中被执行。比如在服务上启用 Zipkin 插件:
$ curl -X POST http://kong:8001/services/{service}/plugins \
--data "name=zipkin" \
--data "config.http_endpoint=http://your.zipkin.collector:9411/api/v2/spans" \
--data "config.sample_ratio=0.001"Kong 本身就是一个 Lua 应用程序,并且是在 OpenResty 的基础之上做了一层封装的应用。归根结底就是利用 Lua 嵌入 Nginx 的方式,赋予了 Nginx 可编程的能力,这样以插件的形式在 Nginx 这一层能够做到无限想象的事情。例如限流、安全访问策略、路由、负载均衡等等。编写一个 Kong 插件,就是按照 Kong 插件编写规范,写一个自己自定义的 Lua 脚本,然后加载到 Kong 中,最后引用即可。

除了 Lua,Kong 还可以基于 Go、JavaScript、Python 等语言开发插件,得益于对应的 PDK(插件开发工具包)。
关于 Kong 插件的详细介绍,推荐阅读官方文档:https://docs.konghq.com/gateway/latest/kong-plugins/,写的比较详细。
- GitHub 地址: https://github.com/Kong/kong
- 官网地址: https://konghq.com/kong
APISIX
APISIX 是一款基于 OpenResty 和 etcd 的高性能、云原生、可扩展的网关系统。
etcd 是使用 Go 语言开发的一个开源的、高可用的分布式 Key-Value 存储系统,使用 Raft 协议做分布式共识。
与传统 API 网关相比,APISIX 具有动态路由和插件热加载,特别适合微服务系统下的 API 管理。并且,APISIX 与 SkyWalking(分布式链路追踪系统)、Zipkin(分布式链路追踪系统)、Prometheus(监控系统)等 DevOps 生态工具对接都十分方便。

作为 Nginx 和 Kong 的替代项目,APISIX 已于 2020-07-15 成为 Apache 顶级项目。国内目前已经有很多知名企业(比如金山、有赞、爱奇艺、腾讯、贝壳)使用 APISIX 处理核心的业务流量。
APISIX 在路由动态性、基于 etcd 的配置热更新、插件生态、控制台等方面对 Kong 形成了有力竞争。不过,API 网关的性能对比高度依赖版本、部署拓扑、路由数量、插件链长度、请求体大小、TLS 开关和连接复用方式,建议根据自身场景做基准测试,不要直接照搬任一厂商的营销口径。
APISIX 同样支持定制化的插件开发。开发者除了能够使用 Lua 语言开发插件,还能通过下面两种方式开发来避开 Lua 语言的学习成本:
- 通过 Plugin Runner 来支持更多的主流编程语言(比如 Java、Python、Go 等等)。通过这样的方式,可以让后端工程师通过本地 RPC 通信,使用熟悉的编程语言开发 APISIX 的插件。这样做的好处是减少了开发成本,提高了开发效率,但是在性能上会有一些损失。
- 使用 Wasm(WebAssembly) 开发插件。Wasm 被嵌入到了 APISIX 中,用户可以使用 Wasm 去编译成 Wasm 的字节码在 APISIX 中运行。
Wasm 是基于堆栈的虚拟机的二进制指令格式,一种低级汇编语言,旨在非常接近已编译的机器代码,并且非常接近本机性能。Wasm 最初是为浏览器构建的,但是随着技术的成熟,在服务器端看到了越来越多的用例。

- GitHub 地址:https://github.com/apache/apisix
- 官网地址: https://apisix.apache.org/zh/
ShenYu
ShenYu 是一款基于 WebFlux 的可扩展、高性能、响应式网关,Apache 顶级开源项目。

ShenYu 通过插件扩展功能,插件是 ShenYu 的灵魂,并且插件也是可扩展和热插拔的。不同的插件实现不同的功能。ShenYu 自带了诸如限流、熔断、转发、重写、重定向和路由监控等插件。
- GitHub 地址: https://github.com/apache/shenyu
- 官网地址: https://shenyu.apache.org/
网关对比一览
| 特性 | Zuul 1.x | Zuul 2.x | Spring Cloud Gateway | Kong | APISIX | ShenYu |
|---|---|---|---|---|---|---|
| IO 模型 | 同步阻塞 | 异步非阻塞 | 异步非阻塞 | 异步非阻塞 | 异步非阻塞 | 异步非阻塞 |
| 底层技术 | Servlet | Netty | WebFlux/Server MVC + Netty/Servlet 容器 | OpenResty(Nginx + Lua) | OpenResty + etcd | WebFlux + Netty |
| 性能 | 低 | 高 | 高 | 很高 | 很高 | 高 |
| 动态配置 | 默认需重启,可扩展 | 支持,需自建体系 | 支持 | 支持 | 支持(热更新) | 支持 |
| 配置存储 | 本地配置/内存 | 自定义 | 默认 YAML/内存,可接 Redis 或自定义路由仓库 | PostgreSQL / YAML / K8s CRD | etcd(分布式) | 内存/数据库/注册中心 |
| 限流熔断 | 限流靠扩展,熔断靠 Hystrix | 需集成 | 限流内置 RequestRateLimiter;熔断需接 CircuitBreaker | 插件 | 插件 | 插件 |
| 生态系统 | Netflix(维护模式) | Netflix | Spring Cloud | Kong / 插件生态 | Apache | Apache |
| 运维复杂度 | 低 | 中 | 低到中 | 中(DB-less) / 高(DB Mode) | 中 | 中 |
| 学习曲线 | 平缓 | 平缓 | 平缓到中 | 陡峭(Lua) | 陡峭(Lua) | 平缓(Java) |
| 适用场景 | 遗留系统维护 | Netflix 存量体系 | Spring Cloud 生态 | 云原生、多语言 | 云原生、高性能 | Java 生态 |
上表中的“性能”只是经验分级,不能替代基准测试。实际性能会受路由数量、插件链长度、请求体大小、TLS 开关、连接复用率、日志采样率、下游延迟等因素影响。选型前建议用 wrk2、vegeta、k6 等工具在自身流量画像下复测,并重点观察 P99/P999 延迟、错误率、CPU/内存占用,而不是只看单纯 QPS。
如何选择?
选择 API 网关需要综合考虑技术栈、性能要求、团队能力和运维成本。
双层网关架构
在中大型微服务体系中,常见做法是把网关拆成两层:
- 流量网关:通常部署在边缘层,可以选择 Kong、APISIX、Nginx/OpenResty、Envoy Gateway 等,负责 SSL 终止、WAF、全局限流、IP 黑白名单、DDoS 防护、协议适配等偏基础设施的能力。
- 业务网关:通常部署在内网,可以选择 Spring Cloud Gateway、ShenYu 或自研网关,负责微服务路由、细粒度鉴权、参数校验、灰度路由、业务侧观测等更贴近业务系统的能力。
如果系统规模较小、业务域单一、团队人力有限,单层网关通常更简单;当外部流量治理和内部业务路由的职责开始互相干扰时,再拆成双层会更稳妥。如果团队已经全面使用 Service Mesh,也可以评估直接用 Envoy/Istio Ingress 承担南北向流量入口,避免代理层级过多。
| 场景 | 推荐方案 | 理由 |
|---|---|---|
| Spring Cloud 生态 | Spring Cloud Gateway | 与 Spring Boot/Spring Cloud 无缝集成,配置简单 |
| 高性能 / 云原生 | APISIX | 基于 etcd 的热更新、性能优异、云原生架构 |
| 多语言生态 | Kong | 插件丰富、支持多语言开发、社区成熟 |
| Netflix 存量体系 | 维持现状并规划迁移 | Zuul 1.x、Ribbon、Hystrix 等已进入维护模式,新项目不建议继续扩展 |
| 双层架构 | Kong/APISIX/Envoy(流量网关) + Spring Cloud Gateway(业务网关) | 流量网关处理 SSL、WAF、全局限流;业务网关处理微服务鉴权、参数校验、灰度路由 |
参考
- Spring Cloud Gateway 官方文档:https://docs.spring.io/spring-cloud-gateway/reference/
- Spring Cloud Netflix 维护模式说明:https://cloud.spring.io/spring-cloud-netflix/multi/multi__modules_in_maintenance_mode.html
- Kong Gateway 3.4 Breaking Changes:https://docs.konghq.com/gateway/latest/breaking-changes/34x/
- ASF 宣布 Apache APISIX 成为顶级项目:https://news.apache.org/foundation/entry/the-apache-software-foundation-announces66
- RFC 9113 HTTP/2:https://www.ietf.org/rfc/rfc9113.html
- Kong 插件开发教程[通俗易懂]:https://cloud.tencent.com/developer/article/2104299
- API 网关 Kong 实战:https://xie.infoq.cn/article/10e4dab2de0bdb6f2c3c93da6
- Spring Cloud Gateway 原理介绍和应用:https://blog.fintopia.tech/60e27b0e2078082a378ec5ed/
- 微服务为什么要用到 API 网关?:https://apisix.apache.org/zh/blog/2023/03/08/why-do-microservices-need-an-api-gateway/
写在最后
如果内容对你有帮助的话,欢迎顺手给 JavaGuide 点一个免费的 Star 支持一下:GitHub | Gitee。
JavaGuide 已持续维护近七年,累计 6100+ 次提交,来自 620+ 位贡献者共同完善。你的 Star、反馈和 PR,都是这个项目继续更新的动力。
如果你正在准备后端/AI 应用开发面试,也可以了解一下我的知识星球,里面包括后端和 AI 实战项目、简历优化、一对一提问和高频考点资料,已经持续维护六年。
