방대한 로우 데이터를 가지고 있을 때 가장 빈번하게 수행하는 작업은 항목별 합계를 구하거나 평균을 산출하는 등의 통계 작업입니다. 일반적으로는 피벗 테이블을 사용하거나 SUMIF, COUNTIF와 같은 함수를 여러 번 복잡하게 사용해야 하지만, QUERY 함수의 집계 기능을 활용하면 수식 하나만으로 완벽한 요약 테이블을 생성할 수 있습니다. 이 글에서는 데이터 분석의 효율을 극대화하는 QUERY 함수의 심화 활용법을 상세히 살펴보겠습니다.
1. 데이터 요약의 기초: 집계 함수의 종류와 사용법
집계 함수는 여러 행의 데이터를 하나로 합쳐서 계산하는 함수입니다. QUERY 문법 안에서 사용되는 주요 집계 함수는 다음과 같습니다.
SUM: 지정한 열의 합계를 구합니다.
AVG: 평균값을 계산합니다.
COUNT: 데이터의 개수를 셉니다.
MAX / MIN: 최댓값과 최솟값을 찾습니다.
이러한 함수들은 SELECT 절 안에서 열 이름과 함께 사용됩니다. 예를 들어 E열에 급여 데이터가 있다면 아래와 같이 작성하여 전체 합계를 구할 수 있습니다. 에디터의 코드 블록을 사용하여 수식을 입력해 보시기 바랍니다.
=QUERY(A1:E100, "SELECT SUM(E)", 1)
이 수식은 지정된 범위 내의 모든 급여 데이터를 합산하여 단일 결과값으로 보여줍니다.
2. 항목별로 데이터 묶기: GROUP BY의 마법
단순히 전체 합계를 구하는 것을 넘어 부서별 급여 합계나 학년별 평균 점수와 같이 그룹 단위의 통계가 필요할 때 GROUP BY 절을 사용합니다. 집계 함수를 사용할 때는 집계되지 않은 다른 열들을 반드시 GROUP BY 뒤에 명시해 주어야 오류가 발생하지 않습니다.
[이미지 1: 부서별 급여 합계를 산출하는 QUERY 함수 적용 화면 / Alt: 구글 스프레드시트 QUERY 함수 GROUP BY 활용 사례]
부서명인 D열을 기준으로 급여인 E열의 합계를 구하는 수식은 다음과 같습니다.
=QUERY(A1:E100, "SELECT D, SUM(E) GROUP BY D", 1)
이 명령어를 입력하면 중복된 부서명들이 하나로 묶이면서 각 부서에 해당하는 급여의 총합이 나란히 표시됩니다. 피벗 테이블을 만드는 과정보다 훨씬 빠르고 간결하게 요약 보고서가 완성됩니다.
3. 집계 결과에 조건 걸기: WHERE와 GROUP BY의 조합
특정 조건을 만족하는 데이터들만 모아서 그룹화하고 싶을 때는 WHERE 절을 GROUP BY 앞에 위치시킵니다. 예를 들어 지역이 서울인 데이터들만 추출하여 부서별로 인원수를 세고 싶다면 아래와 같은 구조를 취합니다.
[이미지 2: WHERE 절과 GROUP BY를 동시에 사용하여 필터링된 통계를 내는 모습 / Alt: QUERY 함수 WHERE 및 GROUP BY 중첩 사용 방법]
=QUERY(A1:E100, "SELECT D, COUNT(B) WHERE C = '서울' GROUP BY D", 1)
여기서 주의할 점은 구문의 순서입니다. 반드시 SELECT, WHERE, GROUP BY 순서를 지켜야 구글 스프레드시트가 수식을 올바르게 인식합니다. 문법의 선후 관계를 명확히 이해하는 것이 전문적인 데이터 관리에 필수적입니다.
4. 레이블 지정으로 가독성 높이기: LABEL 절 활용
집계 함수를 사용하면 결과 테이블의 제목이 sum 급여나 count 성명과 같이 자동으로 생성되어 가독성이 떨어질 수 있습니다. 이때 LABEL 절을 사용하면 결과 표의 헤더 이름을 사용자가 원하는 대로 변경할 수 있습니다.
[이미지 3: LABEL 명령어를 사용하여 결과 표의 제목을 변경한 화면 / Alt: QUERY 함수 LABEL 구문으로 헤더 이름 수정하기]
=QUERY(A1:E100, "SELECT D, SUM(E) GROUP BY D LABEL SUM(E) '급여총액'", 1)
이처럼 LABEL을 활용하면 별도의 수정 작업 없이도 즉시 보고서로 활용할 수 있는 깔끔한 결과물이 출력됩니다. 작은 차이지만 데이터의 전달력을 높이는 매우 유용한 기능입니다.
결론 및 요약
QUERY 함수의 집계 함수와 GROUP BY 기능을 활용하면 복잡한 원본 데이터를 의미 있는 통계 정보로 변환하는 과정이 획기적으로 단축됩니다. 합계, 평균, 개수 산출은 물론이고 그룹화와 레이블 지정을 통해 수식 하나로 완성도 높은 보고서를 자동화할 수 있습니다.
이 가이드에서 다룬 내용을 실무에 적용해 보신다면 스프레드시트 활용 능력이 전문가 수준으로 향상될 것입니다. 다음 포스팅에서는 여러 시트의 데이터를 하나로 합쳐서 조회하는 방법과 날짜 데이터를 처리하는 특수한 쿼리 문법에 대해 알아보겠습니다.

댓글 없음:
댓글 쓰기