긍정적 사고, 음식의 절제, 규칙적인 운동

LAG 함수란?

LAG 함수는 SQL 윈도우 함수의 한 종류로, 현재 행을 기준으로 이전 행의 값을 가져오는 역할을 합니다. 주로 시계열 데이터나 순서가 중요한 데이터에서 이전 행의 값과 현재 행의 값을 비교하거나 계산할 때 사용됩니다.

LAG (scalar_expression [, offset] [, default]) OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)

scalar_expression: 이전 행에서 가져오고 싶은 컬럼의 이름.
offset: 현재 행으로부터 몇 칸 이전의 행을 참조할지 지정합니다. 기본값은 1입니다.
default: offset만큼 떨어진 이전 행이 없을 때(보통 첫 번째 행), 반환할 기본값입니다. 기본값은 NULL입니다.
PARTITION BY: 데이터를 특정 그룹으로 나눕니다. 그룹이 바뀌면 LAG 연산도 다시 시작됩니다.
ORDER BY: 행의 순서를 결정합니다. LAG 함수는 이 순서에 따라 이전 행을 식별합니다.

LAG(Amount, 1, 0): Amount 컬럼의 값을 가져오되, 1칸 이전 행의 값을 가져오고, 이전 행이 없을 경우 0을 반환합니다.
OVER (ORDER BY SaleDate): 데이터를 SaleDate 오름차순으로 정렬하여 LAG 함수가 순서를 인식하도록 합니다.

LAG 함수는 이처럼 이전 값과의 비교, 이전 대비 변화량 계산, 누적 합계 재계산 등 다양한 분석 작업에 매우 유용합니다.

저작자표시 비영리 (새창열림)

'프로그래밍 > DataBase' 카테고리의 다른 글

[SQL] 여러 개의 UPDATE 문을 실행한 후, 최종적으로 영향을 받은 전체 행의 개수를 세고 싶다 (1)	2025.08.22
[MSSQL] mssql ERD를 지원하는 오픈소스 프로그램 (0)	2025.05.28
[MSSQL] update 구문 여러개를 실행하고 그 결과 row의 총 개수를 구하라 (0)	2024.12.16
2025년을 위한 7개의 데이터베이스 (1)	2024.12.16
[MSSQL] PIVOT. a, b, count(1) 를 group by 할때 A 가 5 종류인데 각 카운트를 한 로우에 칼럼으로 다 보여질수 있도록 (0)	2024.10.21

[SQL] 여러 개의 UPDATE 문을 실행한 후, 최종적으로 영향을 받은 전체 행의 개수를 세고 싶다

@@ROWCOUNT는 직전에 실행된 SQL 문이 영향을 준 행의 개수를 반환하는 전역 변수예요. 여러 개의 UPDATE 문을 실행할 경우, 각 UPDATE 문 직후에 이 값을 변수에 누적해서 더하면 최종 결과를 얻을 수 있어요.

-- 총 업데이트된 행 수를 저장할 변수 선언
DECLARE @TotalRowCount INT = 0;

-- 첫 번째 UPDATE 문 실행
UPDATE dbo.Customers
SET CustomerStatus = 'VIP'
WHERE TotalPurchases >= 100000;

-- 첫 번째 UPDATE의 영향을 받은 행 수를 변수에 더하기
SET @TotalRowCount = @TotalRowCount + @@ROWCOUNT;

-- 두 번째 UPDATE 문 실행
UPDATE dbo.Customers
SET CustomerStatus = 'Gold'
WHERE TotalPurchases >= 50000 AND TotalPurchases < 100000;

-- 두 번째 UPDATE의 영향을 받은 행 수를 변수에 더하기
SET @TotalRowCount = @TotalRowCount + @@ROWCOUNT;

-- 최종적으로 업데이트된 총 행 수 출력
PRINT '총 ' + CAST(@TotalRowCount AS NVARCHAR(10)) + '개의 행이 업데이트되었습니다.';

저작자표시 비영리 (새창열림)

'프로그래밍 > DataBase' 카테고리의 다른 글

[SQL] LAG 함수란? 이전 행의 값을 가져오기. (0)	2025.09.03
[MSSQL] mssql ERD를 지원하는 오픈소스 프로그램 (0)	2025.05.28
[MSSQL] update 구문 여러개를 실행하고 그 결과 row의 총 개수를 구하라 (0)	2024.12.16
2025년을 위한 7개의 데이터베이스 (1)	2024.12.16
[MSSQL] PIVOT. a, b, count(1) 를 group by 할때 A 가 5 종류인데 각 카운트를 한 로우에 칼럼으로 다 보여질수 있도록 (0)	2024.10.21

MSSQL(마이크로소프트 SQL Server)에서 ERD(Entity Relationship Diagram) 생성을 지원하는 오픈소스 프로그램 중에서 추천할 수 있는 도구들은 다음과 같습니다:

✅ 1. DBeaver

라이선스: Apache License 2.0 (Community Edition 기준)
특징:
- 다양한 DB(MSSQL 포함) 지원
- ERD 자동 생성 및 편집 가능
- SQL 스크립트와 구조 동시 확인
- 플러그인 확장 가능
장점:
- 사용 편리
- 오픈소스이지만 기능이 풍부
웹사이트: https://dbeaver.io

✅ 2. DBDiagram.io (ERD 모델링 지원 웹 도구)

라이선스: 무료 온라인 도구 (오픈소스는 아니지만, 무료이고 간단하게 사용 가능)
특징:
- 간단한 마크다운 형식으로 ERD 작성
- SQL에서 가져오기/내보내기 가능
- 협업 지원
장점:
- 웹 기반으로 설치 없이 사용
웹사이트: https://dbdiagram.io

✅ 3. SQLPad

라이선스: MIT License
특징:
- 쿼리 실행 + 시각화 + ERD 기능 지원 (약간 제한적)
- MSSQL 포함 다양한 DB 연동
- 웹 기반 SQL 편집기
웹사이트: https://github.com/sqlpad/sqlpad

✅ 4. PgModeler (PostgreSQL 전용이나 일부 호환 시도 가능)

MSSQL 직접 지원은 아니나, ERD 기능 강력
오픈소스 구조 파악, 커스텀 DB 작업용으로 참고 가능
https://pgmodeler.io/

💡 기타 유료이지만 강력한 대안 (참고용)

dbForge Studio for SQL Server (유료, ERD 생성 좋음)
DataGrip (JetBrains, 유료 IDE, 강력한 ERD 지원)

1. PostgreSQL: 기본 데이터베이스

PostgreSQL은 기본적으로 사용되는 안정적인 기술
- "Just use Postgres"라는 문구는 널리 알려진 밈이자 신뢰성을 상징하는 표현임
- ACID를 준수하며 물리적 및 논리적 복제를 포함한 강력한 기능을 제공함
- 주요 벤더들 간에 광범위한 지원을 받고 있는 안정적 데이터베이스임
PostgreSQL의 가장 큰 매력: 확장성
- 확장 기능(Extensions)을 통해 독창적인 기능을 추가 가능함
- 주요 확장 기능 예시:
  - AGE: 그래프 데이터 구조와 Cypher 쿼리 언어 지원
  - TimescaleDB: 시계열 데이터 작업 지원
  - Hydra Columnar: 열 기반 스토리지 엔진 제공
- 확장 기능은 PostgreSQL을 타 데이터베이스와 차별화시키는 핵심 요소임
PostgreSQL의 유용성과 확장성
- 다양한 생태계를 갖추고 있으며, 기본 설정이 합리적이고 사용자 친화적임
- 비 PostgreSQL 서비스에서도 Postgres 와이어 프로토콜을 사용해 클라이언트 호환성을 제공함
- WebAssembly(Wasm) 환경에서도 설치 가능할 정도로 가벼움
PostgreSQL 학습 권장
- PostgreSQL의 가능성과 한계를 이해하기 위해 시간을 투자할 가치가 있음
- 예: MVCC(Multi-Version Concurrency Control)의 복잡성 이해
- 간단한 CRUD 애플리케이션 개발, PostgreSQL 확장 기능 작성 등을 추천함

2. SQLite: 로컬-우선 데이터베이스

SQLite는 "로컬 우선" 데이터베이스로 독립적으로 실행 가능
- 클라이언트-서버 모델을 벗어나 애플리케이션과 같은 환경에서 실행됨
- 예시: WhatsApp과 Signal은 기기 내부에 SQLite를 사용하여 채팅 데이터를 저장함
SQLite의 발전된 활용 사례
- 기본 ACID 준수 데이터베이스 이상의 창의적인 사용 가능
- 새로운 도구와 확장 기능:
  - Litestream: SQLite의 스트리밍 백업 제공
  - LiteFS: 분산 액세스를 지원하여 더욱 유연한 토폴로지 구현
  - CR-SQLite: CRDT(Conflict-free Replicated Data Types)를 사용해 변경 세트를 병합할 때 충돌 해결 필요성을 제거
SQLite의 인기 재조명
- Ruby on Rails 8.0 덕분에 다시 주목받고 있음
- 37signals: SQLite를 기반으로 Rails 모듈(Solid Queue 등)을 개발
  - Rails의 다중 SQLite 데이터베이스 관리 지원 (database.yml)
- Bluesky: 개인 데이터 서버(Personal Data Servers)로 사용자마다 개별 SQLite 데이터베이스 사용
SQLite 활용 학습 권장
- SQLite를 이용한 로컬 중심 아키텍처 실험
- 기존의 PostgreSQL 기반 클라이언트-서버 모델을 SQLite로 대체할 수 있는지 시도

3. DuckDB: 모든 것을 질의할 수 있는 데이터베이스

DuckDB는 OLAP에 특화된 임베디드 데이터베이스
- SQLite처럼 애플리케이션과 함께 작동하지만 OLTP 대신 OLAP 작업에 중점
- 데이터 분석 및 쿼리 중심으로 설계된 시스템
DuckDB의 "쿼리-애니씽(Query-Anything)" 특성
- 다양한 데이터 소스를 직접 SQL로 쿼리 가능:
  - CSV, TSV, JSON 등 일반 파일 형식
  - Parquet 등 고급 파일 형식 지원
- 이 기능은 유연성을 제공하며, 예: Bluesky의 데이터 스트림 분석
확장성 및 생태계
- DuckDB에도 확장 기능이 존재하나, Postgres만큼 풍부하지 않음 (상대적으로 젊은 프로젝트)
- 커뮤니티 기여 확장이 많이 있으며, gsheets(Google Sheets 연동)가 주목할 만함
DuckDB 활용 학습 권장
- Python 노트북이나 Evidence를 통해 데이터 분석 및 처리 실험
- SQLite와 결합: SQLite 데이터베이스의 분석 쿼리를 DuckDB로 위임해 성능 향상

4. ClickHouse: 컬럼형 데이터베이스

ClickHouse는 OLAP 작업에 특화된 데이터베이스
- OLTP는 PostgreSQL, OLAP는 ClickHouse라는 조합이 이상적임
- 대규모 분석 워크로드를 처리하며, 수평 확장과 샤딩을 통해 높은 데이터 삽입 속도를 지원함
ClickHouse의 주요 특징
- 계층형 스토리지 지원:
  - "핫 데이터"와 "콜드 데이터"를 분리해 저장 가능
  - 예: GitLab 문서에서 이를 활용한 사례를 자세히 다룸
- 대규모 데이터셋 처리 및 실시간 분석:
  - DuckDB로는 처리하기 어려운 크기의 데이터셋에 적합
  - 실시간 분석이 필요한 상황에서 강력한 성능 제공
운영의 편리함
- 배포, 확장, 백업 등 운영 관련 문서가 체계적이며 상세함
- 예: 적절한 CPU 설정 방법까지 다룬 문서 제공
ClickHouse 학습 권장
- 대규모 분석 데이터셋 실험 또는 DuckDB로 작업한 분석을 ClickHouse로 변환
- ClickHouse의 임베디드 버전인 chDB를 활용해 SQLite와 더 직접적으로 비교 가능

5. FoundationDB: 레이어드 데이터베이스

FoundationDB는 "데이터베이스의 기반" 역할을 하는 독특한 시스템
- 키-값 저장소로 설계되었으나 단순한 데이터베이스라기보다는 데이터베이스를 구축하는 "기초"로 작동
- 애플, Snowflake, Tigris Data와 같은 주요 기업에서 사용
주요 특징 및 한계
- 제한사항:
  - 트랜잭션 데이터는 10MB를 초과할 수 없음
  - 트랜잭션은 첫 번째 읽기 이후 5초를 넘길 수 없음
- 이러한 제한으로 인해 대규모 환경에서도 완전한 ACID 트랜잭션 지원 가능
  - 예: 100TiB 이상의 클러스터 운영 사례
FoundationDB의 설계와 테스트
- 특정 워크로드에 최적화되어 설계됨
- 시뮬레이션 테스트를 통해 안정성과 확장성을 입증:
  - Antithesis 및 다른 데이터베이스에서도 동일한 테스트 방법론 사용
  - 관련 참고 자료: Tyler Neely와 Phil Eaton의 문서
"레이어드" 데이터베이스로서의 FoundationDB
- 스토리지 엔진과 데이터 모델 간 결합이 느슨함:
  - 다양한 레이어에서 스토리지 엔진을 재매핑 가능
  - 예: Record 레이어, Document 레이어 (FoundationDB 조직에서 제공)
- Tigris Data에서 작성한 레이어 설계 사례가 참고할 만함
FoundationDB 학습 권장
- 튜토리얼을 진행하며 RocksDB 같은 시스템을 대체할 가능성 탐색
- 설계 방법(Design Recipes)과 관련 논문 읽기
- Anti-Features와 Features 문서를 통해 사용 제한과 해결 가능한 문제 이해

6. TigerBeetle: 철저하게 정확한 데이터베이스

TigerBeetle는 금융 트랜잭션에 특화된 단일 목적 데이터베이스
- 범용 데이터베이스와 달리 특정 목적, 특히 금융 거래에 초점
- 오픈 소스로 제공되며, 높은 수준의 신뢰성과 정확성을 목표로 설계
철저한 정확성을 위한 설계 철학
- NASA의 Power of Ten Rules 및 프로토콜 인지 복구(Protocol-Aware Recovery) 구현
- 엄격한 직렬화(strict serialisability) 와 Direct I/O 사용으로 커널 페이지 캐시 관련 문제 회피
- 안전성 문서(Safety doc)와 독특한 프로그래밍 방식 "Tiger Style"에서 철저함을 확인 가능
Zig 언어로 구현된 혁신적 접근
- Zig는 시스템 프로그래밍 언어로 비교적 신생이지만, TigerBeetle의 목표에 이상적으로 부합
- 간결성과 성능을 극대화하는 데 Zig의 장점을 활용
TigerBeetle 학습 및 활용 제안
- 로컬 배포 환경에서 금융 계좌 모델링 실험:
  - Quick Start를 따라 설치 및 사용
- 시스템 아키텍처 문서(System Architecture docs)를 참고하여 범용 데이터베이스와 결합 가능성 탐구
- 예: PostgreSQL 또는 FoundationDB와 함께 통합해 사용 사례 확장

7. CockroachDB: 글로벌 데이터베이스

CockroachDB는 글로벌 분산 데이터베이스
- PostgreSQL 와이어 프로토콜과 호환되며, 수평 확장과 강한 일관성을 지원
- Google Spanner에서 영감을 받은 설계로, 다중 지역에 걸친 데이터베이스 확장을 가능케 함
CockroachDB의 주요 기술적 특징
- 시간 동기화 기술:
  - Google Spanner는 원자 시계와 GPS 시계를 사용하지만, CockroachDB는 일반 하드웨어에서도 동작하도록 설계
  - NTP 기반 동기화 지연 보정, 노드 간 클록 드리프트 비교 및 최대 오프셋 초과 시 멤버 종료
- 다중 지역 구성:
  - 테이블 로컬리티(Table Localities) 기능을 통해 읽기/쓰기 트레이드오프에 따른 최적화 가능
  - 데이터가 사용자 지리적 위치에 맞게 분산되어 성능과 지연 시간을 개선
CockroachDB 활용 학습 제안
- MovR 예제 재구현:
  - 원하는 언어와 프레임워크를 사용해 MovR(분산 애플리케이션 예제)을 구현
- CockroachDB의 다중 지역 및 스케일링 전략을 활용하여 글로벌 애플리케이션 설계 실험
CockroachDB 선택 이유
- DynamoDB와 같은 다른 분산 데이터베이스와 달리 로컬 환경에서 무료로 실행 가능
- 강한 일관성과 글로벌 분산 지원이라는 차별화된 특성 제공

Wrap Up

소개된 데이터베이스는 각기 다른 문제와 요구 사항을 해결하기 위해 설계됨
2025년엔 이 데이터베이스들을 학습하며 더 흥미롭고 창의적인 문제 해결 방법을 탐구해보세요!

저작자표시 비영리 (새창열림)

'프로그래밍 > DataBase' 카테고리의 다른 글

[MSSQL] mssql ERD를 지원하는 오픈소스 프로그램 (0)	2025.05.28
[MSSQL] update 구문 여러개를 실행하고 그 결과 row의 총 개수를 구하라 (0)	2024.12.16
[MSSQL] PIVOT. a, b, count(1) 를 group by 할때 A 가 5 종류인데 각 카운트를 한 로우에 칼럼으로 다 보여질수 있도록 (0)	2024.10.21
[DataBase] Postgres를 검색엔진으로 활용하기 (2)	2024.09.02
[MS-SQL] mssql sum / 5 소수점 한자리까지. avg 소수점 한자리 (0)	2024.04.17

SQL Server에서 A, B, 그리고 각각의 A 값에 대한 카운트를 하나의 행에 열로 표시하려면, 피벗(PIVOT) 기능을 사용할 수 있습니다. 피벗을 사용하면 각 A 값이 열로 변환되며, 각 열의 값은 해당 A 값의 카운트가 됩니다.

가정: 테이블 구조

TableName 테이블에 A, B 열이 있다고 가정합니다.
A 열에는 여러 종류의 값이 있으며, 이 값들을 기준으로 카운트를 집계합니다.

예제: 피벗을 사용하여 A 값의 카운트를 열로 표시

SELECT 
    B,
    [A1],
    [A2],
    [A3],
    [A4],
    [A5]
FROM (
    SELECT 
        B,
        A,
        COUNT(1) AS CountA
    FROM 
        TableName
    GROUP BY 
        B, A
) AS SourceTable
PIVOT (
    SUM(CountA)
    FOR A IN ([A1], [A2], [A3], [A4], [A5])
) AS PivotTable
ORDER BY B;

설명:

서브쿼리: 먼저 B, A, 그리고 각 A 값의 카운트를 집계합니다.
- GROUP BY B, A: B와 A로 그룹화하여 각 A 값에 대한 카운트를 계산합니다.
피벗:
- PIVOT (SUM(CountA) FOR A IN ([A1], [A2], [A3], [A4], [A5])): 각 A 값이 열로 변환되며, 각 열의 값은 해당 A의 카운트입니다.
결과: 최종적으로 B와 각 A 값의 카운트를 열로 표시합니다.

주의사항:

IN 절에 지정된 A1, A2, A3, A4, A5는 실제로 A 컬럼에 있는 값으로 대체해야 합니다. 예를 들어, A 값이 'Type1', 'Type2', 'Type3' 등일 경우, 해당 값을 정확하게 열 이름으로 지정해야 합니다.
만약 A 값의 종류가 동적으로 변화한다면, 동적 SQL을 사용하여 피벗 쿼리를 작성해야 할 수 있습니다.

동적 피벗 예시

동적 피벗을 사용하면 테이블의 A 값이 변해도 자동으로 피벗을 적용할 수 있습니다.

DECLARE @cols AS NVARCHAR(MAX),
        @query AS NVARCHAR(MAX);

-- A 값 가져오기
SELECT @cols = STRING_AGG(QUOTENAME(A), ', ')
FROM (SELECT DISTINCT A FROM TableName) AS Temp;

-- 피벗 쿼리 생성
SET @query = 'SELECT B, ' + @cols + '
              FROM (
                  SELECT B, A, COUNT(1) AS CountA
                  FROM TableName
                  GROUP BY B, A
              ) AS SourceTable
              PIVOT (
                  SUM(CountA)
                  FOR A IN (' + @cols + ')
              ) AS PivotTable
              ORDER BY B;';

-- 실행
EXEC sp_executesql @query;

이 동적 피벗 예시는 A 값의 종류에 따라 자동으로 피벗 쿼리를 생성하고 실행합니다.

저작자표시 비영리 (새창열림)

'프로그래밍 > DataBase' 카테고리의 다른 글

[MSSQL] update 구문 여러개를 실행하고 그 결과 row의 총 개수를 구하라 (0)	2024.12.16
2025년을 위한 7개의 데이터베이스 (1)	2024.12.16
[DataBase] Postgres를 검색엔진으로 활용하기 (2)	2024.09.02
[MS-SQL] mssql sum / 5 소수점 한자리까지. avg 소수점 한자리 (0)	2024.04.17
[MSSQL] varchar nvarchar 차이점과 검색시 유리한 형태 (0)	2024.03.12

긍정적 사고, 음식의 절제, 규칙적인 운동

프로그래밍/DataBase

[SQL] LAG 함수란? 이전 행의 값을 가져오기.

LAG 함수란?

'프로그래밍 > DataBase' 카테고리의 다른 글

[SQL] 여러 개의 UPDATE 문을 실행한 후, 최종적으로 영향을 받은 전체 행의 개수를 세고 싶다

'프로그래밍 > DataBase' 카테고리의 다른 글

[MSSQL] mssql ERD를 지원하는 오픈소스 프로그램

✅ 1. DBeaver

✅ 2. DBDiagram.io (ERD 모델링 지원 웹 도구)

✅ 3. SQLPad

✅ 4. PgModeler (PostgreSQL 전용이나 일부 호환 시도 가능)

💡 기타 유료이지만 강력한 대안 (참고용)

추천 정리:

🔧 추천 조합:

'프로그래밍 > DataBase' 카테고리의 다른 글

[MSSQL] update 구문 여러개를 실행하고 그 결과 row의 총 개수를 구하라

'프로그래밍 > DataBase' 카테고리의 다른 글

2025년을 위한 7개의 데이터베이스

Table of Contents

1. PostgreSQL: 기본 데이터베이스

2. SQLite: 로컬-우선 데이터베이스

3. DuckDB: 모든 것을 질의할 수 있는 데이터베이스

4. ClickHouse: 컬럼형 데이터베이스

5. FoundationDB: 레이어드 데이터베이스

6. TigerBeetle: 철저하게 정확한 데이터베이스

7. CockroachDB: 글로벌 데이터베이스

Wrap Up

'프로그래밍 > DataBase' 카테고리의 다른 글

[MSSQL] PIVOT. a, b, count(1) 를 group by 할때 A 가 5 종류인데 각 카운트를 한 로우에 칼럼으로 다 보여질수 있도록

가정: 테이블 구조

예제: 피벗을 사용하여 A 값의 카운트를 열로 표시

설명:

주의사항:

동적 피벗 예시

'프로그래밍 > DataBase' 카테고리의 다른 글

+ Recent posts

티스토리툴바

DBeaver	✅	✅	✅	설치형
SQLPad	✅	제한적	✅	웹 기반
DBDiagram.io	❌ (무료)	✅	✅ (SQL import)	웹 기반