1.
一、上线前的流量与风险评估
- 估算并发与带宽:按历史PV估算峰值并发,例:每日峰值100万PV,瞬时并发10万,带宽预留至少2×峰值带宽。
- 请求特性分析:静态资源占比、API请求比、长连接占比(WebSocket/推送)。
- DDoS 风险等级:按目标可被攻击面列出(域名、API、登录、文件接口)。
- 依赖项清单:域名解析生效时间、证书、回源带宽、第三方接口限流。
- 回滚条件与SLA:设定响应时延阈值(200ms)与错误率阈值(>1%触发回滚)。
2.
二、服务器与VPS基础配置样例
- 生产主机建议:8 vCPU / 32GB RAM / NVMe 1TB / 2×1Gbps 公网链路(示例)。
- 边缘回源池(备用):3台回源(4 vCPU / 8GB)做轮询与权重备份。
- Nginx 基础调优示例:worker_processes auto; worker_connections 10240; keepalive_timeout 65; sendfile on; tcp_nopush on。
- 系统层面:ulimit -n 200000,net.core.somaxconn=65535,tcp_tw_reuse=1。
- 监控项:CPU、内存、NIC吞吐、磁盘I/O、95/99分位响应时延、错误率。
3.
三、CDN与域名策略(针对不熟悉CDN的稳妥做法)
- 选择Anycast节点的CDN提供商(例如:Cloudflare/阿里云CDN/腾讯云CDN)以分散流量。
- 域名生效:使用二级域名指向CNAME到CDN,主域名A记录保留用于回源探测。
- 缓存策略:静态资源长缓存(Cache-Control max-age=86400),动态接口走按规则缓存或分段缓存。
- 回源限流:设置回源QPS阈值与熔断,避免源站被拉垮。
- 证书与HTTPS:提前上传证书或使用CDN托管证书,开启HTTP/2和OCSP stapling。
4.
四、DDoS 与安全防护措施
- 接入WAF并启用常见攻击规则(SQLi、XSS、异常UA检测)。
- 开启流量清洗(Scrubbing)与黑白名单,任何突发流量触发自动切换到清洗链路。
- 速率限制(Rate Limit):对登录、支付、API接口做QPS限制与验证码上升策略。
- Anycast 与负载均衡:使用多区域Anycast + 本地负载均衡分散攻击面。
- 日志与溯源:请求日志保留90天,异常流量导出到SIEM做回溯。
5.
五、演练步骤与真实案例
- 演练步骤:1) 预演脚本;2) 小流量测试;3) 渐进式放量;4) 峰值压测;5) 回滚验证。
- 真实案例:某电商大促 2023 年,未充分使用CDN导致回源带宽被吃满,采取Anycast+清洗后将回源QPS从50k降至3k。
- 演练数据采集:每次压测记录RPS、P95/P99、缓存命中率与带宽。
- 回归验证:演练后复查NGINX连接数与内核参数是否达到预期。
- 通知链路:演练时通知运维、开发、客户支持与外包厂商。
6.
六、压测结果与可视化数据(示例表格)
| 场景 | 并发 | 请求率(RPS) | 缓存命中率 | 带宽 | P95 响应(ms) |
| 正常日常 | 10k | 5k | 92% | 200 Mbps | 120 |
| 峰值测试 | 100k | 60k | 96% | 1.5 Gbps | 230 |
| DDoS 模拟 | 200k | 200k | 20% | 5.2 Gbps | >1000 |
- 结论:在不熟悉CDN的情况下,使用以上分步骤演练、配置备份回源与DDoS清洗策略,能将故障范围与回退成本最小化。
- 建议:上线前72小时完成一次完整演练并保存所有监控快照以供事后分析。
来源:cdn加速不熟 但又要上线大型活动时的稳妥预案与演练