콤마로 split하는 기능 구현 관련 문의

by 플레이어블 posted Mar 15, 2023


* 질문 등록 시 다음의 내용을 꼭 기입하여 주세요.

OS
Linux 64bit 등
CUBRID Ver.
9.1
CUBRID TOOL Ver.
10.1
응용 환경(API)
cubrid manager 사용


* CUBRID 응용 오류, SQL 오류 또는 SQL 튜닝 관련된 문의는 반드시 다음의 내용을 추가해 주세요. 비밀글이나 비밀 댓글도 가능합니다.
* 저희가 상황을 이해하고, 재현이 가능해야 알 수 있는 문제들이 많습니다. 가능한 정보/정황들을 부탁합니다.

 

에러 내용 및 재현 방법 재현 가능한 Source와 SQL
관련 테이블(인덱스, 키정보 포함) 정보 CUBRID 홈 디렉토리 아래 log 디렉토리 압축


-------------- 아래에 질문 사항을 기입해 주세요. ------------------------------------------------------------------------
콤마(,)로 연결된 varchar컬럼을  콤마 구분자로  split 하는 기능을 찾아보니 substring_index 를 이용하는 방법이 있어서 적용해보았습니다.

SELECT DISTINCT id
    , LEVEL AS seq
    , REPLACE(REPLACE(SUBSTRING_INDEX(code,',',LEVEL), SUBSTRING_INDEX(code,',',LEVEL -1),''),',','') code_split
FROM (
    SELECT 'A' AS id, 'a1,a2,a3,a4,a5' AS code 
    UNION SELECT 'B' AS id, 'b1,b2,b3,b4,b5' AS code
)
CONNECT BY LEVEL <= 5; -- 최대 5개

쿼리 실행하면 결과는 제대로 잘 나오는데요

A    1    a1    
A    2    a2    
A    3    a3    
A    4    a4    
A    5    a5    
B    1    b1    
B    2    b2    
B    3    b3    
B    4    b4    
B    5    b5

 

문제는 from 절 안의 대상의 갯수가 100개를 넘어가면 temp space 부족으로 쿼리 오류가 발생합니다.

Query failed due to insufficient temporary file space

cubrid spacedb DB명 명령어로 확인해보면 

 

Space description for database 'DB20230209' with pagesize 16.0K. (log pagesize: 16.0K)

Volid  Purpose   total_size   free_size  Vol Name

    0  GENERIC      512.0 M     367.1 M  /home/cub/DB/DB20230209
    1     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x001
    2    INDEX      512.0 M       0.0 M  /home/cub/DB/DB20230209_x002
    3     TEMP      512.0 M     486.8 M  /home/cub/DB/DB20230209_x003
    4     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x004
    5     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x005
    6     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x006
    7     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x007
    8     DATA      512.0 M     106.3 M  /home/cub/DB/DB20230209_x008
    9     DATA      512.0 M       0.0 M  /home/cub/DB/DB20230209_x009
   10    INDEX      512.0 M     400.6 M  /home/cub/DB/DB20230209_x010
   11     DATA      512.0 M     366.0 M  /home/cub/DB/DB20230209_x011
   12     DATA      512.0 M     365.9 M  /home/cub/DB/DB20230209_x012
-------------------------------------------------------------------------------
   13                 6.5 G       2.0 G

Space description for temporary volumes for database ' DB20230209' with pagesize 16.0K.

Volid  Purpose   total_size   free_size  Vol Name

32763     TEMP        5.8 G       5.8 G  /home/cub/DB20230209/DB20230209_t32763
32764     TEMP       22.0 G      22.0 G  /home/cub/DB20230209/DB20230209_t32764
32765     TEMP       22.0 G      22.0 G  /home/cub/DB20230209/DB20230209_t32765
32766     TEMP       22.0 G      22.0 G  /home/cub/DB20230209/DB20230209_t32766
-------------------------------------------------------------------------------
    4                71.7 G      71.7 G

 

이렇게 temp space가 72GB 가까이 나오는데 더 늘리면 해결이 될까요? (temp space 늘리는 방법도 궁금합니다.)

그게 아니면 split 기능을 구현하는 방법 중에 메모리를 덜 먹는 방법이 있으면 좀 알려주셨으면 합니다.

 

- OS : CentOS 64bit

- cubrid 버전 : 9.1

- manager 버전 : 10.1