天天看点

云计算简介

云计算简介:

云计算:一群提供服务的计算机的整体

提供服务(通信网络)

云服务:用户按需消费、使用

云计算运维做什么:

7*24 小时快速响应

故障处理

备份恢复

系统安全

软件部署

监控报警

架构调优

统计分析

脚本开发(自动化)

发展方向:

资深运维工程师

运维平台研发工程师

数据库工程师

运维总监

架构师

系统运维工程师:基础设施部署、应用环境部署、与开发协作更新应用版本、性能监控、容 量规划、备份、响应处理运维故障、优化系统性能、改善自身运维方法流程

常用的开源软件:

操作系统:centos,ubantu

网站:nginx,php-fpm,tomcat

关系型数据库:mysql nosql:redis,mongodb

代理:lvs,keepalived,haproxy

版本控制:gitlab

监控:zabbix

批量管理:ansible

打包工具:jenkins

日志分析:ELK(ElasticSearch+Logstash+Kibana)

脚本语言:shell,python

故障解决思路:

1.根据故障现象判断故障产生的影响,确定优先级

2.尽快恢复服务

a) 服务出错、假死:重启服务

b) 版本问题:保存日志待查,回滚版本

c) 资源不足:暂时关闭次要服务、紧急扩容

3.定位故障原因:

配置、版本是否变更

查看日志

4.后续完善响应监控

5.制定应急方案

运维的分类

系统运维:管理服务器、基础服务搭建、负载均衡、高可用、CDN、系统优化 
桌面运维:管理客户端、企业桌面维护、办公设备维护、网络维护
网络运维:管理网络设备、服务器上架、硬件设备故障监控、设备保修 
应用运维:参与产品设计、应用部署上线、版本更新、应用故障处理
运维研发:运维平台开发、基础设施开发(中间件、维护软件)、自动化运维 
数据库运维:数据库设计、优化、监控、备份、灾备
运维安全:制定安全制度、安全培训、风险评估、漏洞检测
           

服务器:能够为其他计算机提供服务的更高级的电脑(更加稳定、高效)

分类:机架式、塔式、机柜式、刀片式            

选择服务器的指标:

1.需求决定一切,着眼未来
2.不要贪图便宜,电费远比你想象的贵 
3.机房中的空间是稀缺资源,机架式比塔式性价比更高 
4.管理方便:比如螺丝少、支持远程控制 
5.硬件通用性好,尤其是驱动
6.厂商支持
7.可替代产品是否广泛
8.在一定规模范围内,云主机的性价比更高 
服务器尺寸:1U≈4.445 厘米
机柜容量:22U、37U、42U(主流) 
网络设备机柜:600 或 800mm 
服务器机柜:900 或 1000mm 
选型参数:
  支持的 CPU 颗数、CPU 核心数
  内存插槽数(最少 24 个)、最大支持内存容量 
  硬盘接口(服务器:SAS,家用机:SATA)、盘架个数、最大支持硬盘容量 
  RAID 卡支持级别、RAID 卡电池
  电源数量、整机功率
           

典型服务模式(C/S:Client/Server 架构):

服务器:提供资源或某种功能
客户机:使用资源、功能           

架构方式:

1.SMP 服务器:主要特征是共享。系统中所有的资源(例如:CPU、内存、I/O 等)都是 共享的。扩展能力有限,最受限制的是内存,当 CPU 数量增多时,会导致内存紊乱,降低 CPU 效率。效率最高的 CPU 数量是 2~4 个
2.NUMA 服务器:主要特征是具有多个 CPU 模块,每个 CPU 模块由多个 CPU 组成,并且 具有独立的内存、I/O 等。当需要运行大内存应用时,需要向其他模块借调内存 
           

CPU 选择:

1.主要指标有缓存、主频、核心数量,服务器的 CPU 一般都是 XEON 
2.CPU 物理核心数量越多,并发行越强,不包括超线程。超线程在 CPU 密集型计算, 高负载的时候没有任何效果,甚至还会拖慢系统速度 
3.CPU 主频越高单次计算速度就越快 
4.CPU 缓存大的性能好 
5.不同主频的内存不要混插
6.多通道的一定要按组接入,多 CPU 的按组对称分布,一般主板内存槽同组都会标示 相同的颜色 
7.RAID 卡很重要,带高速缓存的好,带备用电池单元的好,硬 RAID 卡(自带数据存 储和专用 CPU)比软 RAID 卡好 
           

硬盘选择:

1.硬盘转速
2.做 RAID 不能混用 
3.SSD 在随机 I/O 读写上性能非常好 
4.在格式化 SSD 分区的时候要注意对齐,影响 I/O 速度 
5.在内核队列上选择 NOOP 效果比较好 
功耗:如果选配的最大功耗大于电源模块的最大输出就需要考虑购买多个电源模块。电源不 考虑冗余
基于智能平台管理接口(IPMI:Intelligent Platform Management Interface)协议的服务 器带外管理工具
让用户通过网络来监控服务器上各种硬件组件的健康状况,如 CPU 电压、风扇转速、系 统温度、功耗等,开放的免费标准 
DELL 的管理命令:IPMITOOL 
DELL 工具名称:iDRAC
参数:-U 登陆用户名 
  -P 登陆密码
  -H 远程主机地址
  -power 电源管理模块 
  -sel 硬件日志管理 
  -sol 串口重定向           

网络设备选型:

交换机:端口数量、端口速率、背板带宽、POE 供电(有源以太网) 
路由器:内存、flash、协议支持、模块扩展