首页>行情 >内容

EC2新诊断中断API可让用户触发OS核心错误方便为实例除错

行情2021-02-20 18:04:54
最佳答案

AWS为EC2增加了诊断中断(Diagnostic Interrupt)API,当EC2实例失去回应的时候,用户就能使用这个API,远端触发核心错误(Kernel Panic),并视作业系统的设定,进行记忆体倾印与重新启动等动作。

系统管理员在为没有回应的伺服器除错时,有时候必须实体按下非可封锁中断(non-maskable interrupt,NMI)按钮,或是透过序列介面向命令控制器发送讯号,以触发系统倾印核心状态到档案中,这个核心转储(Core Dump)的档案会包含崩溃程序的记忆体映像档、程式计数器以及系统暂存器等资讯,供系统管理员找出核心失去回应的原因。

而现在AWS为EC2增加了能让使用者远端触发核心错误的API,EC2:SendDiagnosticInterrupt API会发送类似按下实体NMI按钮的诊断中断讯号到EC2实例上,并让实例管理程式对作业系统发送NMI命令。当作业系统收到NMI中断后,根据作业系统的配置执行动作,一般会产生核心转储资料档案,并接着重载核心或是重新启动系统。

AWS提到,用户使用这个触发核心错误API,总共有三个步骤,分别是配置作业系统、触发核心错误,接着就能分析倾印的内容。在作业系统配置方面,EC2中的Windows Server AMI已经预设启用记忆体倾印功能,且会在储存完核心转储之后自动重新启动。而Amazon Linux 2的用户,则必须要自己安装倾印工具,进行一次性设置,设定包括保留给核心转储的记忆体大小,以及收到中断时触发核心错误等。

当配置完成,用户就能够透过AWS CLI或是SDK,使用这个API触发核心错误,系统会在倾印记忆体之后自动重新启动系统,CLI并不会收到任何回传值,AWS表示,这是正常的现象,而当实例重新启动之后,用户可以在/var/crash找到倾印的崩溃资料。最后,用户就能够分析倾印资料,在Linux上,用户必须额外安装分析核心转储用的公用程式。

AWS用户可以在IAM政策中,设定组织中有权限传送诊断中断的成员。目前这个API已经在所有公共AWS区域开放使用

免责声明:本文由用户上传,如有侵权请联系删除!