Background Image

FORUM

조회 수 4370 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Redhat 7.6 Enterprise
CUBRID Ver.
10.1.5.7809
CUBRID TOOL Ver.
10.2.0.0001
응용 환경(API)
JAVA


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
 

안녕하세요. 현재 가상화 서버 2대를 HA 구성하여 운영중에 있습니다.

현재 새벽마다 hb_thread_check_disk_failure 오류가 발생하고 있습니다.

ha_ping_hosts 옵션은 추가되어있는 상태입니다.

 

원인이 어떤것인지, 어떻게 해결해야할지 잘 모르겠어서 문의드립니다.

 

시스템 로그(/var/log/messages)에서 확인된 오류는 아래와 같습니다.

#DB01 Master 서버

May 10 01:02:39

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 10 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffff9b2831fb4200        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff918d2ba0>] ? task_rq_unlock+0x20/0x20

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

 

#DB02 Slave 서버

May 10 01:05:31

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

 

-------- 다음날 새벽 --------

 

#DB01 Master 서버

May 11 01:03:09

cub_master : [CUBRID] hb_thread_check_disk_failure () at /home/jenkins/workspace/cubrid_release_10.1/src/executables/master_heartbeat.c:4471

 

May 11 01:06:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

May 11 01:08:13

kernel: INFO: task cub_admin:3978 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

kernel: cub_admin        D ffffffff91f86e76        0 3978       1 0x00000080

kernel: Call Trace:

kernel: [<ffffffff91f87169>] schedule+0x29/0x70

kernel: [<ffffffffc06038c5>] jbd2_log_wait_commit+0xc5/0x140 [jbd2]

kernel: [<ffffffff918c6d10>] ? wake_up_atomic_t+0x30/0x30

kernel: [<ffffffffc0604f52>] jbd2_complete_transaction+0x52/0xa0 [jbd2]

kernel: [<ffffffffc06a6bd2>] ext4_sync_file+0x292/0x320 [ext4]

kernel: [<ffffffff91a83a07>] do_fsync+0x67/0xb0

kernel: [<ffffffff91a83cf0>] SyS_fsync+0x10/0x20

kernel: [<ffffffff91f93f92>] system_call_fastpath+0x25/0x2a

 

#DB02 Slave 서버

오류 로그 없음.

 

  • ?
    오명환 2022.05.11 13:51
    올려주신 메세지를 보면 사용하는 시스템에서 해당 시간대에 fsync 수행시 file system이 block되는 현상이 발생하는 것 같습니다.
    $CUBRID/conf/cubrid.conf의 설정값 중 ha_check_disk_failure_interval의 기본값은 15초입니다.
    즉, 15초동안 disk 관련 행위에 응답이 없으면, timeout이 발생하여 fail-over가 발생합니다.

    우선적으로 해당 시간대에 어떤 행위에 의해 file system이 block되는지 원인을 파악해보세요.
    차선잭으로는 cubrid.conf의 ha_check_disk_failure_interval 의 값을 늘려보세요. (설정값을 적용하려면 restart 하셔야 합니다.)

List of Articles
번호 제목 글쓴이 날짜 조회 수
공지 CUBRID 사용자를 위한 DBeaver 도구 출시 안내 21 admin 2024.04.23 143797
4028 api 결과 값 질문 5 11시38분 2024.06.19 4846
4027 데이터베이스 로드 관련 문의 3 file hwson 2024.06.19 5093
4026 batch에서 insert 작업할 때 1 mango 2024.06.19 5314
4025 시퀀스 nextval 할 때 특정 값 제외 하는 방법 있습니까? 1 mango 2024.06.18 4942
4024 컬럼의 DEFAULT 값 추출 문의 1 새옹지마 2024.06.17 4963
4023 큐브리드 매니저 호스트연결시 무한 로딩 3 file dfdfdd 2024.06.13 5179
4022 큐브리드 locale이 euckr일 때 cp949 문자도 지원하는 것인가요? 4 닉네임어려워 2024.06.10 5225
4021 view 실행 쿼리를 조회 하고 싶습니다. 3 mango 2024.06.10 5179
4020 CUBRID 기동 시 오류 1 steve 2024.06.07 5031
4019 문자셋 문의드립니다. 1 닉네임어려워 2024.06.04 4888
4018 Cubrid 재기동 관련 에러사항 2 yhpark 2024.05.31 5036
4017 파일 업로드시 브로커 오류 메시지 1 포스트잇 2024.05.29 5194
4016 큐브리드 사용중 정지 1 딴딴딴딴 2024.05.28 4989
4015 SQL 수행 이력 및 통계정보 1 ijuru 2024.05.24 5038
4014 버전 업데이트 이후 Conversion error in date format 에러 1 file 마로비 2024.05.20 4973
4013 큐브리드 엔진 디렉토리와 데이터파일 디렉토리를 분리하는 방법 1 DB구루 2024.05.19 4946
4012 데이터 베이스 백업시 에러 1 file 로컬백업 2024.05.17 4877
4011 백업작업시 Unable to mount disk volume 그런파일이나 디렉터리가 없습니다 라는 에러 발생합니다 7 로컬백업 2024.05.17 4994
4010 sql_id가 empty일 때 Tran time이 존재하는 경우? 1 푸우짱 2024.05.14 4906
4009 cubrid php driver 2 나라디 2024.05.14 4989
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 213 Next
/ 213

Contact Cubrid

영업문의 070-4077-2112 / 기술문의 070-4077-2148 / 대표전화 070-4077-2110 / Email. contact_at_cubrid.com
Contact Sales