一次web 服务器无法连接上oracle 数据库的故障处理

news/2024/5/18 21:49:27 标签: 数据库, web, oracle, 服务器, jdbc, server
 

今天早上维护人员打来电话说某移动的114 web server 无法连接到数据库web server 报一大堆jdbc 的错误,最后报 sql error,但是并没有明显的ORA- 的错误,第一反映应该不是oracle 数据库的问题,估计是web server数据库连接出现了问题

然后远程登陆数据库系统,使用top 发现数据库服务器很闲,基本上没有什么负荷,查看 v$session 目前一共有74个 连接,show parameter process 最大是400个,数据库分配的资源应该没有什么问题,查看v$session_wait 也没有发现什么异常的等待事件。

现场人员重新启动了web server 故障依旧,应该也不是web server 的问题,焦点又转移到oracle 数据库上面,查看v$session 发现从这台服务器连接过来的有22个连接,web server 应该是有连接的。而且连接数还没有达到最大的连接数,即使连接数不够的话,应该报ora- 错误的

仔细想想,既然从那台web server 有连接过来,说明连接没有问题,那么这个应用怎么连不上呢?

既然是连接的问题,于是查看listener的日志文件listener.log
发现web server 连接数据库很频繁
23-MAR-2007 09:51:03 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35605)) * establish * ora9ha * 0
23-MAR-2007 09:51:03 * service_update * ora9ha * 0
23-MAR-2007 09:51:13 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35606)) * establish * ora9ha * 0
23-MAR-2007 09:51:23 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35608)) * establish * ora9ha * 0
23-MAR-2007 09:51:33 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35609)) * establish * ora9ha * 0
23-MAR-2007 09:51:43 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35610)) * establish * ora9ha * 0
23-MAR-2007 09:51:53 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35612)) * establish * ora9ha * 0
23-MAR-2007 09:51:57 * service_update * ora9ha * 0
23-MAR-2007 09:52:03 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35613)) * establish * ora9ha * 0
23-MAR-2007 09:52:14 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35614)) * establish * ora9ha * 0
23-MAR-2007 09:52:24 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35616)) * establish * ora9ha * 0
23-MAR-2007 09:52:34 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35617)) * establish * ora9ha * 0
23-MAR-2007 09:52:44 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HOST=192.168.18.5
)(PORT=35618)) * establish * ora9ha * 0
23-MAR-2007 09:52:54 * (CONNECT_DATA=(SID=ora9ha)(CID=(PROGRAM=)(HOST=__jdbc__)(USER=))) * (ADDRESS=(PROTOCOL=tcp)(HO
基本上几秒一次,既然web server 有自己的连接池,从web server 过来的连接应该是长连接(也就是一直在连接)为什么连接如此频繁呢?询问应用人员,他说他的程序无法连接?既然他的程序无法连接,那么是不是有其他的程序也在这台web server 部署了应用程序呢?询问一下,果然有新的应用部署到了这台web server 上面。
但是如果新部署的应用程序如果连接池正常的话,即使增加了新的应用,也不会造成web server 连不上数据库的情况,仔细询问开发人员,把情况给他一说,问“为什么连接数据库如此频繁”开发人员说“他的程序为了保证应用连接数据库正常,每打开一个网页,都要手工的关闭连接,然后再连接”

这下原因找到了,原来开发人员怕网络出现中断影响程序,在前台网页打开一次,程序就关闭连接,然后重新再连接,所以才造成连接如此频繁,以至于web server 频繁的disconnect ,connect 数据库,造成数据库频繁的分配,释放资源,造成原来的应用无法连接数据库

由于数据库服务器web server 在同一个网络内,网络出现问题的可能性很小,开发人员修改了新的程序,配置了连接池,问题解决


http://www.niftyadmin.cn/n/1552488.html

相关文章

分析共享池脚本

分析共享池脚本 参考《oracle性能优化实务》 SQL> col "avg size" format a30 truncate; SQL> col siz format 999999999999 SQL> SELECT KSMCHCLS CLASS, COUNT(KSMCHCLS) NUM, SUM(KSMCHSIZ) SIZ,2 To_char( ((SUM(KSMCHSIZ)/COUNT(KSMCHCLS)/1024)),999…

oracle数据库常见故障处理

一、定位数据库故障原因。定位原因大概可以分三步走:1、如果有oracle错误号或者alert日志中有详细的出错信息,则可以根据这些去定位数据库故障原因;2、如果没有,则可以运行awr工具或者statspack工具生成报告,根据报告去…

共享池碎片化分析脚本

共享池逐渐碎片化是正常现象,oracle有自动合并内存的机制来解决碎片化,如果这个机制解决不了问题,那么考虑业务少的时候刷新共享池(alter system flush shared_pool;)或重启实例。 SQL> set line 200 SQL> col s…

drop user cascade出现ORA-04043问题的解决

问题: SQL> drop user hbylinit cascade;drop user hbylinit cascadeORA-00604: 递归 SQL 级别 1 出现错误ORA-04043: 对象 SYS_YOID0000104160$ 不存在分析:ora-4043就是提示对象不存在,一般在写错对象名的时候都会报这个错误。推测出…

优化sql解析

使用绑定变量调整CURSOR_SHARING 1)、EXACT:通常来说,exact值是Oracle推荐的,也是默认的,它要求SQL语句在完全相同时才会重用,否则会被重新执行硬解析操作。 2)、SIMILAR:similar是在Oracle认为某条SQL语句…

共享池抖动分析脚本

参考自《oracle性能优化实务》 SQL> set line 200 SQL> alter session set nls_date_formatyyyy-mm-dd hh24:mi:ss;Session altered.SQL> col component format a40 truncate; SQL> select component,oper_type, oper_mode, start_time, end_time, trunc(target_si…

数据库缩小表空间

案例环境:今天启动应用程序,程序报错如下:ExceptionMessageORA-01653: 表 HBXNB_CS.BZ29 无法通过 1024 (在表空间 USERS 中) 扩展ORA-06512: 在 "HBXNB_CS.DBMS_CONTEXT", line 40ORA-01653: 表 HBXNB_CS.BZ29 无法通过 1024 (在表…

v$session - 你看到的event真的是session当前的等待事件么?

转自 https://blogs.oracle.com/database4cn/vsession-%E4%BD%A0%E7%9C%8B%E5%88%B0%E7%9A%84event%E7%9C%9F%E7%9A%84%E6%98%AFsession%E5%BD%93%E5%89%8D%E7%9A%84%E7%AD%89%E5%BE%85%E4%BA%8B%E4%BB%B6%E4%B9%88-v2 当数据库出现性能问题的时候,几乎所有的DBA都…