1.
前言:目标与前置条件
目标:在韩国机房VPS上接入“硕网监控”、实施可恢复的备份策略并保证中国访问可用。前置:已购买VPS、有root或sudo权限、可访问硕网监控控制台、在中国侧有备份接收端(对象存储或另一台VPS)。
2.
准备工作:时间同步与基本工具
步骤:1) 安装ntp或chrony:apt install chrony 或 yum install chrony,systemctl enable --now chronyd;2) 安装常用工具:apt/yum install curl wget rsync tar vim git openssh-client;3) 配置SSH密钥:ssh-keygen -t rsa -b 4096,复制公钥到备份接收端ssh-copy-id user@backup_ip。
3.
接入硕网监控:安装Agent(通用方法)
步骤:1) 在硕网监控控制台获取Agent安装脚本或token;2) 在VPS执行curl -sSL "安装脚本URL" | sudo bash 或按照文档下载deb/rpm并安装;3) 检查agent状态:systemctl status shuo-monitor-agent,确保注册成功并在控制台显示主机在线。
4.
配置常用监控项
指标:CPU、内存、磁盘、I/O、网络延迟、端口(如80/443/22)、进程健康。操作:在硕网控制台添加模板或在agent配置文件中启用node_exporter或自定义脚本,示例:/etc/shuo-monitor/conf.d/custom.conf 指定检查命令和阈值;重启agent以生效。
5.
告警与通知渠道设置
步骤:1) 在硕网控制台设置告警策略:添加阈值(如CPU>90% 5分钟);2) 配置通知接收端:邮件、钉钉/微信企业号、短信或Webhook;3) 测试告警:使用stress或dd制造高负载,观察是否触发并收到通知。
6.
备份策略概览:分层与保留
原则:分为快照层(完整系统快照)、文件层(代码与配置)和数据库层(逻辑备份)。保留策略示例:最近7天每日、7天到30天隔日、30天到365天月度。加密和压缩必不可少(gpg + gzip/zip)。
7.
实现文件与配置备份(rsync)
步骤:1) 在VPS创建备份脚本 /usr/local/bin/backup_files.sh,内容示例:rsync -az --delete /var/www/ user@backup_ip:/data/backup/$(hostname)/files/;2) 加入crontab:0 2 * * * /usr/local/bin/backup_files.sh >> /var/log/backup_files.log 2>&1;3) 验证:ssh backup_ip ls /data/backup/$(hostname)/files。
8.
数据库备份(MySQL示例)
步骤:1) 创建导出脚本 /usr/local/bin/backup_mysql.sh,示例:mysqldump -u backup_user -p'密码' --single-transaction --databases db1 db2 | gzip > /tmp/db-$(date +%F).sql.gz;2) 将导出文件rsync或scp到备份端并删除本地临时文件;3) crontab示例:30 3 * * * /usr/local/bin/backup_mysql.sh
9.
快照与块设备备份(LVM/云快照)
步骤:1) 若VPS支持云快照,使用云面板在低峰期创建系统盘快照;2) 若使用LVM:lvcreate --size 1G --snapshot --name root_snap /dev/vg/root && dd if=/dev/vg/root_snap | gzip > /backup/root-snap-$(date +%F).img.gz && lvremove /dev/vg/root_snap;3) 将镜像传到异地并验证可挂载恢复。
10.
加密、压缩与生命周期管理
建议:使用gpg对备份文件加密:gpg --encrypt --recipient backup@yourdomain.com file.gz。使用rclone或ossutil同步到对象存储并设置存储生命周期(归档/冷存)。测试恢复流程每月至少一次。
11.
恢复演练与SOP
恢复步骤示例:1) 恢复代码:从备份端rsync回新实例并修正权限;2) 恢复数据库:gunzip < db.sql.gz && mysql -u root -p < db.sql;3) 挂载快照镜像并chroot修复引导。将每种恢复场景写入SOP并记录时间与问题。
12.
问:如何在韩国VPS上降低到中国的网络监控误报?
答:通过延时容忍、设置更长阈值和多点探测来降低误报。具体操作:在硕网监控中对Ping/RTP类检查设置更高 RTT 阈值、增加重试次数并添加中国境内探针作为对比。
13.
问:万一备份端与VPS断连,如何保证数据不丢失?
答:本地先保留短期快照与增量文件(7天),并在断连恢复后通过rsync --partial --progress 继续传输;同时使用后台队列(如lftp --resume或rclone copy --checksum)保证断点续传。
14.
问:如何验证备份可用性和完整性?
答:定期做恢复演练:1) 隔离环境还原完整备份并启动服务;2) 校验文件哈希(sha256sum)与数据库校验和;3) 在监控面板做合规性记录,确保每次演练有结果与改进记录。
来源:运维工程师必读的vps韩国机房中国硕网监控和备份策略