HPE ProLiant DL380 Gen10 不同BIOS设置内存性能测试

Posted on 2019 年 1 月 20 日 (Updated 2019 年 1 月 20 日) by yaoge123

硬件环境

2*Intel(R) Xeon(R) Gold 5122 CPU @ 3.60GHz
12*HPE SmartMemory DDR4-2666 RDIMM 16GiB

iLO 5 1.37 Oct 25 2018
System ROM U30 v1.46 (10/02/2018)
Intelligent Platform Abstraction Data 7.2.0 Build 30
System Programmable Logic Device 0x2A
Power Management Controller Firmware 1.0.4
NVMe Backplane Firmware 1.20
Power Supply Firmware 1.00
Power Supply Firmware 1.00
Innovation Engine (IE) Firmware 0.1.6.1
Server Platform Services (SPS) Firmware 4.0.4.288
Redundant System ROM U30 v1.42 (06/20/2018)
Intelligent Provisioning 3.20.154
Power Management Controller FW Bootloader 1.1
HPE Smart Storage Battery 1 Firmware 0.60
HPE Eth 10/25Gb 2p 631FLR-SFP28 Adptr 212.0.103001
HPE Ethernet 1Gb 4-port 331i Adapter – NIC 20.12.41
HPE Smart Array P816i-a SR Gen10 1.65
HPE 100Gb 1p OP101 QSFP28 x16 OPA Adptr 1.5.2.0.0
HPE InfiniBand EDR/Ethernet 100Gb 2-port 840QSF 12.22.40.30
Embedded Video Controller 2.5

软件环境

CentOS Linux release 7.6.1810 (Core)
Linux yaoge123 3.10.0-957.el7.x86_64 #1 SMP Thu Nov 8 23:39:32 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
Intel(R) Memory Latency Checker – v3.6

Continue reading →

安装 GPFS 管理GUI

Posted on 2018 年 9 月 7 日 (Updated 2020 年 3 月 15 日) by yaoge123

GUI节点安装 gpfs.gss.pmcollector-.rpm gpfs.gss.pmsensors-.rpm gpfs.gui-.noarch.rpm gpfs.java-.x86_64.rpm
所有节点安装 gpfs.gss.pmsensors-*.rpm
初始化收集器节点 mmperfmon config generate –collectors [node list]，GUI节点必须是收集器节点
启用传感器节点 mmchnode –perfmon -N [SENSOR_NODE_LIST]
设置容量监控节点和间隔 mmperfmon config update GPFSDiskCap.restrict=[node] GPFSDiskCap.period=86400
设置fileset容量监控节点和间隔 mmperfmon config update GPFSFilesetQuota.restrict=[node] GPFSFilesetQuota.period=3600
GUI节点自动启动systemctl enable gpfsgui

删除

GUI节点：systemctl stop gpfsgui; systemctl disable gpfsgui;
mmlscluster |grep perfmon 查询一下哪些节点，mmchnode –noperfmon -N [SENSOR_NODE_LIST]
mmperfmon config delete –all
清空数据库 psql postgres postgres -c “drop schema fscc cascade”
删除相关的rpm包 yum erase gpfs.gss.pmcollector gpfs.gss.pmsensors gpfs.gui gpfs.java
mmlsnodeclass 查询有哪些节点，分别用mmchnodeclass GUI_SERVERS delete -N <……> 和 mmchnodeclass GUI_MGMT_SERVERS delete -N <……> 删除

OpenLDAP 升级报错pwdMaxRecordedFailure不存在

Posted on 2018 年 8 月 30 日 by yaoge123

升级到OpenLDAP 2.4.44，出现以下错误

User Schema load failed for attribute "pwdMaxRecordedFailure". Error code 17: attribute type undefined
config error processing olcOverlay={1}ppolicy,olcDatabase={2}hdb,cn=config: User Schema load failed for attribute "pwdMaxRecordedFailure". Erro...ype undefined
slapd stopped.

解决办法

cd /etc/openldap/slapd.d/cn=config/cn=schema
mv cn\=\{3\}ppolicy.ldif cn\=\{3\}ppolicy.ldif.bak
mv /etc/openldap/schema/ppolicy.ldif cn\=\{3\}ppolicy.ldif

OpenLDAP 密码策略

Posted on 2018 年 8 月 30 日 (Updated 2020 年 3 月 15 日) by yaoge123

OpenLDAP默认是没有密码检查策略的，123456这也得密码也能接受，这显然是管理员不希望看到的。

导入密码策略schema

ldapadd -Y EXTERNAL -H ldapi:/// -D "cn=config" -f /etc/openldap/schema/ppolicy.ldif

加载模块，因为已经添加过syncprov模块了，所以只要追加ppolicy模块就可以了

dn: cn=module{0},cn=config
changetype: modify
add: olcModuleLoad
olcModuleLoad: ppolicy.la

ldapmodify -Y EXTERNAL -H ldapi:/// -f mod_ppolicy.ldif

指定默认策略dn名

dn: olcOverlay=ppolicy,olcDatabase={2}hdb,cn=config
changeType: add
objectClass: olcOverlayConfig
objectClass: olcPPolicyConfig
olcOverlay: ppolicy
olcPPolicyDefault: cn=default,ou=ppolicy,dc=yaoge123,dc=com
olcPPolicyHashCleartext: TRUE

ldapmodify -Y EXTERNAL -H ldapi:/// -f ppolicy.ldif

创建默认策略

dn: ou=ppolicy,dc=yaoge123,dc=com
objectClass: organizationalUnit
objectClass: top
ou: ppolicy

dn: cn=default,ou=ppolicy,dc=yaoge123,dc=com
cn: default
objectClass: top
objectClass: device
objectClass: pwdPolicy
objectClass: pwdPolicyChecker
pwdAllowUserChange: TRUE
pwdAttribute: userPassword
pwdCheckQuality: 2
pwdExpireWarning: 604800
pwdFailureCountInterval: 0
pwdGraceAuthnLimit: 5
pwdInHistory: 5
pwdLockout: TRUE
pwdLockoutDuration: 600
pwdMaxAge: 0
pwdMaxFailure: 5
pwdMinAge: 0
pwdMinLength: 8
pwdMustChange: FALSE
pwdSafeModify: FALSE
pwdCheckModule: check_password.so

ldapadd -Y EXTERNAL -H ldapi:/// -f defaultppolicy.ldif

修改/etc/openldap/check_password.conf，定义check_password.so规则
MirrorMode的两台LDAP均需进行上述同样的配置

Seafile集成卡巴斯基

Posted on 2018 年 4 月 2 日 (Updated 2019 年 1 月 17 日) by yaoge123

防病毒脚本 /opt/kaspersky/kav4fs_scan.sh

#!/bin/bash

VIRUS_FOUND=1
CLEAN=0
UNDEFINED=2
KAV4FS='/opt/kaspersky/kav4fs/bin/kav4fs-control'
if [ ! -x $KAV4FS ]
then
    echo "Binary not executable"
    exit $UNDEFINED
fi

SCAN_OUTPUT=`$KAV4FS --scan-file "$1"`
if [ "$?" -ne 0 ]
then
    echo "Error due to check file '$1'"
    exit 3
fi

while read line
do
	OUT1=`echo $line|cut -d':' -f 1`
	OUT2=`echo $line|cut -d':' -f 2|sed 's/ //g'`
	case "$OUT1" in
        "Threats found" )
                THREATS_C=$OUT2
                ;;
        "Riskware found" )
                RISKWARE_C=$OUT2
                ;;
        "Infected" )
                INFECTED=$OUT2
                ;;
        "Suspicious" )
                SUSPICIOUS=$OUT2
                ;;
        "Scan errors" )
                SCAN_ERRORS_C=$OUT2
                ;;
        "Password protected" )
                PASSWORD_PROTECTED=$OUT2
                ;;
        "Corrupted" )
                CORRUPTED=$OUT2
                ;;
	esac
done <<< "$SCAN_OUTPUT"

if [ $INFECTED -gt 0 ]
then
    exit $VIRUS_FOUND
elif [ $THREATS_C -gt 0 -o $RISKWARE_C -gt 0 -o $SUSPICIOUS -gt 0 -o $SCAN_ERRORS_C -gt 0 -o $CORRUPTED -gt 0 ]
then
    exit $UNDEFINED
else
    exit $CLEAN
fi

/opt/seafile/conf/seafile.conf 添加防病毒配置

[virus_scan]
scan_command = /opt/kaspersky/kav4fs_scan.sh
virus_code = 1
nonvirus_code = 0
scan_interval = 60

每天crontab清除kav4fs的日志/etc/cron.d/kav

30 0 * * * root find /var/log/kaspersky/kav4fs/supervisor_trace.log* -exec rm {} \;
40 0 * * * root /opt/kaspersky/kav4fs/bin/kav4fs-control -S --clean-stat

齐治堡垒机应用发布服务器IE组策略建议配置

Posted on 2018 年 3 月 7 日 (Updated 2018 年 3 月 7 日) by yaoge123

应用发布服务器组策略，路径如下：

本地计算机策略-用户配置-管理模板-Windows组件-Internet Explorer

启用以下策略：

关闭加载项性能通知
自动激活新安装的加载项
禁止用户启用或禁用加载项
阻止运行“首次运行”向导，选择直接转到主页

浪潮刀片和机架的一些问题

Posted on 2018 年 3 月 5 日 (Updated 2020 年 3 月 15 日) by yaoge123

用了四年的浪潮NF5270M3机架服务器、I8000刀箱和NX5440刀片服务器，总结一下碰到的管理问题

浪潮认为刀片BMC的IP应该紧跟着刀箱管理模块的IP顺序增加，比如刀箱管理模块是192.168.1.10，那么第一个刀片就应该是192.168.1.11。不这样设置会出现一些问题，如按刀片上的KVM按钮会亮红灯无法切换，需要SSH到刀片的BMC里用命令行修改一些配置文件
使用浏览器访问刀片的BMC必须用IP，用hostname的访问打开IP KVM会报错无法使用
在Linux下打开刀片的IP KVM报错无法使用，Windows下则正常，新的刀片已解决此问题
刀箱管理模块无法发送报警邮件，NTP配置无法保存且也没有同步时间，无发送syslog功能
机架BMC发送报警测试邮件正常，但是实际出现故障（如移除电源模块）时却没有发送邮件
刀箱电源风扇模块故障时前面板报警灯不亮，只在刀箱背后的电源风扇模块上有指示灯变红
机架RAID卡故障，如硬盘故障，前面板报警灯不亮

Veeam 不同备份方式的负载

Posted on 2017 年 10 月 30 日 (Updated 2017 年 10 月 31 日) by yaoge123

IO负载

Method	I/O impact on destination storage
Forward incremental	1x write I/O for incremental backup size
Forward incremental, active full	1x write I/O for total full backup size
Forward incremental, transform	2x I/O (1x read, 1x write) for incremental backup size
Forward incremental, synthetic full	2x I/O (1x read, 1x write) for entire backup chain
Reversed incremental	3x I/O (1x read, 2x write) for incremental backup size
Synthetic full with transform to rollbacks	4x I/O (2x read, 2x write) for entire backup chain

Reversed Incremental Backup：每次备份对备份存储的IO压力很大，备份窗口时间长，但是备份空间占用最少，只有一个最新的完整备份。

Forward Incremental Backup：每次备份对备份存储的IO压力最小，备份窗口时间最短，可能会需要额外备份空间存储多个完整备份。
Forever forward incremental Backup：对源存储无压力，如果虚拟机变化很大，合并最后一个增量和完整备份可能压力大，只有一个最老的完整备份。
Synthetic Full Backup：对源存储无压力，对备份存储IO压力较大，因为不是备份过程所以没有备份窗口，一般会保留有多个完整备份。
Transforming Incremental Backup Chains into Reversed Incremental Backup Chains：对源存储无压力，对备份存储IO压力极大，因为不是备份过程所以没有备份窗口，只保留一个完整备份。
Active Full Backup：完全从源存储创建一个完整备份，需要从源读取所有数据，对备份存储是顺序IO写因此压力不大，但是备份窗口时间非常长，对生产系统源存储性能有负面影响，一般会保留有多个完整备份。

VCSA 6.0 升级 6.5

Posted on 2017 年 10 月 23 日 (Updated 2020 年 3 月 15 日) by yaoge123

密码重置

重置VCSA OS GRUB密码
http://www.unixarena.com/2016/04/reset-grub-root-password-vcsa-6-0.html
重置VCSA OS root密码
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2069041
重置administrator@vsphere.local的密码
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2146224

vCenter Update Manager迁移

VCSA 6.5开始Update Manager被集成到VCSA中，所以需要迁移工具将原来独立的Update Manager迁移到VCSA 6.5中

如果修改过VCSA的密码，最好重新配置vCenter Update Manager，并重启它
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=1034605
在vCenter Update Manager上运行迁移工具，保持运行窗口打开状态，迁移完成程序会自动退出
https://docs.vmware.com/cn/VMware-vSphere/6.5/com.vmware.vsphere.upgrade.doc/GUID-6A39008B-A78C-4632-BC55-0517205198C5_copy.html
确保vCenter Update Manager有足够的空余空间，迁移时会打包文件

迁移时部署大小

迁移VCSA时到选择部署大小时，发现tiny/small等小的部署大小不现实，主要是因为原VCSA存储空间消耗过多
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2148587

设置时区

升级后登录VAMI时区显示空，并且无法设置，需要SSH登录到VCSA执行

cd /etc/
rm -rf localtime
ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

Shockwave Flash crashes

这是Adobe Shockwave Flash version 27.0.0.170已知的问题，只能升级到更新的版本或者降级到老版本
https://kb.vmware.com/selfservice/microsites/search.do?cmd=displayKC&externalId=2151945

GPFS 创建 CNFS

Posted on 2017 年 8 月 15 日 (Updated 2020 年 3 月 15 日) by yaoge123

GPFS有两种NFS导出方式，一是Cluster Export Services (CES) NFS，二是clustered NFS (CNFS)。CNFS使用Linux内核的nfsd，提供了较好小文件操作性能，当然也只支持NFS。CES使用用户空间Ganesha的nfsd，连续读写性能较好，CES还支持SMB和Object存储。

CNFS通过动态的调整IP地址来提供NFS的HA，只能提供故障转移不支持负载均衡，下面以nfs1,nfs2两个节点配置CNFS为例

确保所有服务端和客户端节点与同一个时钟源严格同步时间，服务端节点需要mmchlicense server
为了防止故障切换时出现写入问题，CNFS export共享目录的文件系统需指定syncnfs挂载选项
```
mmchfs fsyaoge123 -o syncnfs
```
在每个服务端上面配置相同的/etc/exports，不同目录的fsid必须不同，不同服务端上面同一个目录的fsid必须相同，1.1.1.10/1.1.1.11是客户端IP
```
/fsayaoge123/nfs 1.1.1.10(ro,fsid=11) 1.1.1.11(rw,fsid=11)
```
在每个服务端上面设置nfsd自动启动
```
systemctl enable nfs-server
```
定义CNFS的共享目录，最好是一个单独小的文件系统且不被NFS共享出去
```
mmchconfig cnfsSharedRoot=/fs2yaoge123/cnfs
```
每个服务端使用一个额外的静态IP(onboot=no)用于NFS共享，注意这个IP不能用于GPFS，将这个interface启动起来

在每个服务端上进行配置，ip_address_list为上面配置的专用于NFS的ip，node为这个节点在GPFS里面的主机名

mmchnode --cnfs-interface=ip_address_list -N node
mmchnode --cnfs-interface=1.1.1.1 -N nfs1  //配置nfs1使用1.1.1.1做为NFS专用IP

查一下rpc.mountd绑定的端口号，配置上去
```
mmchconfig cnfsMountdPort=mountd_port -N node
```
NFS客户端挂载时需加选项 -o sync,hard,intr，nfs1为主用
```
mount -o sync,hard,intr 1.1.1.1:/fsyaoge123/nfs /mnt
```
测试关机、停止nfsd、停止gpfs三种情况下是否会自动切换

查看CNFS节点

mmlscluster --cnfs

删除CNFS节点

mmchnode --cnfs-interface=DELETE -N "nfs1,nfs2"