业务正常运行,运维技术必不可少!
运维一般是指对大型组织已经建立的网络软硬件的维护,传统的运维是指信息技术运维也就是IT运维。对已建立的网络软硬件进行维护,确保业务正常上线和运行。它集成了网络、系统、数据库、开发、安全和监控技术。运维的种类很多,包括DBA运维、网站运维、虚拟化运维、监控运维、游戏运维等。
运维技术方向
在产品的整个生命周期中,运维的责任是重要且广泛的,但是运维工程师的责任不仅仅局限于此,在工作中也要总结遇到的问题,提取相关的技术指导,研究开发相关工具和平台,以支持/优化业务开发,提高运营效率,相关的技术工作主要包括:
1.服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障。
2.服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性。
3.服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作。
4.服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验。
5.服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量。
6.服务任务调度:服务的各种定时/非定时任务的调度触发及状态监控。
7.服务安全保障:包括服务的访问安全、防攻击、权限控制等。
8.数据传输技术:包括p2p等各类传输技术的研发应用,也远距离大数据传输等问题的解决。
9.服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务。
10.服务集群管理:包括服务的服务器管理、大规模集群管理等。
11.服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本。
12.数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。
13.平台化的开发:类docker和google borg平台的开发管理,及服务接入技术。
14.分布式存储平台的开发优化:类google gfs等分布式存储平台的研发及服务接入。