1. 传统拉取模式的缺陷(如Eureka)
在类似Eureka的注册中心中,消费者需要定时(如每30秒)主动拉取服务列表(Pull模式)。如果此时某个服务突然宕机,消费者可能无法立即感知,导致后续请求仍会发送到已故障的实例,造成调用失败。这种延迟可能持续到下一次拉取完成。
2. Nacos推送模式的核心机制
Nacos通过UDP推送 + 事件监听实现主动通知:
- 事件触发:当服务实例注册、下线或健康状态变化时,Nacos服务端会生成一个
ServiceChangeEvent
事件。 - UDP广播:服务端通过UDP协议将变更信息广播给所有订阅该服务的消费者客户端。例如,若服务A宕机,Nacos会立即推送一条消息:"服务A已不可用"。
- 客户端响应:消费者收到UDP通知后,立即从本地缓存更新服务列表(无需等待定时任务),并返回ACK确认。若服务端未收到ACK,会重试推送,确保可靠性。
3. 兜底机制:定时拉取
虽然UDP可能存在丢包风险,但Nacos设计了双重保障:
- 定时拉取:客户端默认每10秒主动拉取一次服务列表,作为推送失败的兜底。
- 本地缓存:消费者优先使用本地缓存的服务列表,即使短时网络波动也不会导致服务不可用。
4. 对比Eureka的改进
- Eureka:仅通过客户端定时拉取(Pull),更新延迟可能长达30秒以上。
- Nacos:推送(Push)能在毫秒级通知变更(如服务宕机),结合定时拉取,兼顾实时性与可靠性。
5. 应用场景示例
假设服务B调用服务A:
- 服务A宕机 → Nacos服务端立即检测到(通过心跳或主动检查)。
- 推送通知 → 服务B在1秒内收到UDP消息,剔除服务A的地址。
- 后续调用 → 服务B自动将请求转发到其他健康实例,避免调用失败。
总结
Nacos通过主动推送 + 定时拉取的组合模式,既解决了传统拉取模式的延迟问题,又通过兜底机制保证了可靠性。这种设计使得服务列表更新更及时,尤其适合对故障恢复要求高的场景。