Background Image

FORUM

조회 수 188 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Redhat 7.6 Enterprise
CUBRID Ver.
10.1.5.7809
CUBRID TOOL Ver.
10.2.0.0001
응용 환경(API)
JAVA


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
 

안녕하세요. 현재 가상화 서버 2대를 HA 구성하여 운영중에 있습니다.

현재 새벽마다 hb_thread_check_disk_failure 오류가 발생하고 있습니다.

ha_ping_hosts 옵션은 추가되어있는 상태입니다.

 

원인이 어떤것인지, 어떻게 해결해야할지 잘 모르겠어서 문의드립니다.

 

시스템 로그(/var/log/messages)에서 확인된 오류는 아래와 같습니다.

#DB01 Master 서버

May 10 01:02:39

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 10 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffff9b2831fb4200        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff918d2ba0>] ? task_rq_unlock+0x20/0x20

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

 

#DB02 Slave 서버

May 10 01:05:31

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

 

-------- 다음날 새벽 --------

 

#DB01 Master 서버

May 11 01:03:09

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 11 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

May 11 01:08:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

#DB02 Slave 서버

오류 로그 없음.

 

  • ?
    오명환 2022.05.11 13:51
    올려주신 메세지를 보면 사용하는 시스템에서 해당 시간대에 fsync 수행시 file system이 block되는 현상이 발생하는 것 같습니다.
    $CUBRID/conf/cubrid.conf의 설정값 중 ha_check_disk_failure_interval의 기본값은 15초입니다.
    즉, 15초동안 disk 관련 행위에 응답이 없으면, timeout이 발생하여 fail-over가 발생합니다.

    우선적으로 해당 시간대에 어떤 행위에 의해 file system이 block되는지 원인을 파악해보세요.
    차선잭으로는 cubrid.conf의 ha_check_disk_failure_interval 의 값을 늘려보세요. (설정값을 적용하려면 restart 하셔야 합니다.)

List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 admin 2024.04.23 118
공지 SQLGate for CUBRID 영구 무료 라이선스 제공 file admin 2020.04.09 4474
3780 php에서 cubrid_connect 이부분이 조금.. 2 레드오리 2008.12.19 18095
3779 primary key 가 중복으로 들어가네요.. 3 file 봉보로봉봉 2017.01.04 18091
3778 자동증가 컬럼수정후 자동증가값이 들어가게 하려면? 7 초보 2010.02.27 18072
3777 trunc 함수 질문입니다. 1 BI 2016.11.02 18028
3776 데이터바인딩? 2 우페 2008.12.12 18025
3775 컬럼명을 한글로 하였을 경우 쿼리 속도에 영향을 받을 수 있을까요? 1 spowner 2009.04.07 18016
3774 호스트 추가 1 karay2k 2011.12.17 17929
3773 설치관련 다시 질문 올립니다. 2 해바라기 2008.12.05 17858
3772 웹서버(Win)와 DB서버를 분리할 때 odbc설치 방법 2 안지민 2009.06.26 17828
3771 Fedra 10 에서 8.1.4 설치 문의 2 스나이퍼 2009.03.26 17804
3770 execute 실행시 Attribute column was not found 에러 관련 문의 3 file 도미켄 2021.02.25 17782
3769 우분투 릴리즈 설치 지원 안되나요? 3 Hoya 2009.05.19 17739
3768 php 5.3.1 / php extension 컴파일 오류 있네요... 1 disablerain 2009.12.11 17729
3767 PHP 버젼에 따라.. 값을 인식하지 못하는 현상(?) 3 레드오리 2008.12.24 17693
3766 JDBC드라이버 접속에러... 1 서종률 2009.01.07 17661
3765 큐브리드 포트에 대해서... 3 레드오리 2008.12.23 17653
3764 AUTO_INCREMENT 컬럼 이용시 2 hyperhand 2009.12.22 17649
3763 업데이트 보완 문제 해결요청 1 가라 가라~ 2009.01.20 17592
3762 erwin xml 스키마 내보내기 기능 1 chocob 2014.04.02 17591
3761 service tray 실행 안됨 3 file 바부대왕 2009.02.24 17574
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 200 Next
/ 200

Contact Cubrid

대표전화 070-4077-2110 / 기술문의 070-4077-2113 / 영업문의 070-4077-2112 / Email. contact_at_cubrid.com
Contact Sales