Ubuntu 服务器日常运维清单
一、系统更新与补丁
- 定期执行
apt update && apt upgrade更新软件包 - 关注安全补丁,优先应用
unattended-upgrades自动安全更新 - 定期检查内核版本,必要时升级并重启
二、监控与告警
系统资源监控:
- CPU、内存、磁盘使用率(
top、htop、df -h、free -h) - 网络流量与连接数(
netstat、ss、iftop) - 进程状态(
ps aux、systemctl status)
建议工具: Prometheus + Grafana、Zabbix、Netdata
三、日志管理
- 定期检查系统日志:
/var/log/syslog、/var/log/auth.log - 使用
journalctl查看 systemd 服务日志 - 配置
logrotate防止日志撑满磁盘 - 有条件时接入集中日志平台(ELK Stack)
四、安全加固
- 检查登录记录:
last、lastb(失败登录) - 审查 SSH 配置:禁止 root 登录、使用密钥认证
- 管理防火墙规则:
ufw status或iptables -L - 定期检查开放端口:
ss -tlnp - 扫描异常用户账号:
cat /etc/passwd
五、备份
- 定期备份重要数据(数据库、配置文件、应用数据)
- 验证备份可用性,做恢复演练
- 使用
rsync、borgbackup或云存储方案 - 遵循 3-2-1 原则(3份副本、2种介质、1份异地)
六、磁盘与存储
- 监控磁盘使用率,超过 80% 需预警
- 定期清理:
apt autoremove、旧日志、临时文件 - 检查磁盘健康:
smartctl -a /dev/sda
七、服务与进程管理
- 确认关键服务正常运行:
systemctl status <服务名> - 设置服务自动重启(
Restart=always) - 定期检查 crontab 任务:
crontab -l
八、性能调优
- 分析慢查询(数据库场景)
- 检查 OOM(内存溢出)事件:
dmesg | grep -i oom - 定期回顾资源趋势,提前规划扩容
九、文档与变更记录
- 每次操作留下变更记录
- 维护服务器配置文档(IP、端口、服务、负责人)
- 重大变更走审批流程
推荐运维频率参考:
| 频率 | 任务 |
|---|---|
| 每天 | 检查告警、日志、服务状态 |
| 每周 | 更新补丁、清理磁盘、检查备份 |
| 每月 | 安全审计、账号复查、性能报告 |
| 每季度 | 恢复演练、架构评审、文档更新 |


