缺省情况下,WebSphere Application Server的挂起(hung)检测功能就已经是打开状态的了,当有线程持续运行超过10分钟时,在服务器的SystemOut.log日志里会打印线程挂起的警告(关键词为WSVR0605)并列出线程具体的执行代码/堆栈跟踪。您可以根据应用程序和环境配置相应的挂起检测策略,以便可以报告潜在的挂起,从而更好地检测故障服务器。例如,在发生hung线程时如果因为一些特殊原因无法及时手动收集诊断数据,则可以考虑配置对hung线程自动生成javacore文件的功能(缺省情况下不会在发生hung线程时自动生成javacore),配置后当服务器检测到挂起的线程时会自动生成javacore文件,以便对hung问题进行故障诊断。但是请注意,通常情况下还是更推荐在hung发生时手动执行数据收集脚本进行数据收集,因为脚本收集的数据更全面更完整,除了可以收集固定时长间隔的多个javacore文件来检查线程活动外,还可以收集系统内存和cpu资源等相关的信息供全面检查。
通常可以配置的相关属性有以下几个:
属性名称
com.ibm.websphere.threadmonitor.dump.java
设置值说明
此属性调用dumpThreads函数。设置为true可在检测到挂起线程并打印WSVR0605W消息时执行dumpThreads 函数生成javacore转储。进而可以通过分析javacore文件的线程部分,确定报告的hung线程和其他相关线程正在执行的操作。
设置为 1 到 Integer.MAX_VALUE 范围内的整数值,以便在检测到挂起的线程并打印WSVR0605W消息时执行dumpThreads函数。整数值表示将执行dumpThreads的最大次数。
注: 要关闭WSVR0605W消息,请设置com.ibm.websphere.threadmonitor.interval=0。
属性名称
com.ibm.websphere.threadmonitor.threshold
设置值说明
线程在被视为挂起之前可以处于活动状态的时间长度(以秒为单位)。任何被检测为活动时间超过此时间长度的线程都将报告为挂起。缺省设置为600秒(10 分钟)。
属性名称
com.ibm.websphere.threadmonitor.interval
设置值说明
对所选定的应用程序服务器中受管线程进行检查/查询的频率(以秒为单位)。缺省设置为180秒(3 分钟)。
自定义属性可以通过管理控制台进行设置
管理控制台->服务器->应用程序服务器->选定服务器名称->服务器基础架构->管理->自定义属性->新建

参考文档:
https://www.ibm.com/docs/en/was-nd/9.0.5?topic=tools-configuring-hang-detection-policy
https://www.ibm.com/support/pages/wsvr0605w-thread-may-be-hung-message-logs