no image
[Tableau] Field
1. Field 변환 필드의 종류를 변경하는 것이 가능 1) 별칭 Aliases 날짜 등의 데이터를 직접 입력하게 하려면, 일관된 형식으로 쓰게 해야 한다. 별칭 만들기: 좌측 [DATA] > [Gender] 우클릭 > Aliases... > 별칭 입력 > 행 선반으로 2) 계산된 필드 만들기 기존의 데이터를 이용해서 새로운 데이터 만들어내는 것 파생 필드 IF와 CASE 자주 사용 IF [조건] THEN 값 ELSEIF [조건] THEN 값 ELSE 값 END CASE WHEN 값1 THEN 값2 END 이름: 국가브랜드 IF [Brand] = 'chevrolet' THEN '미국' ELSEIF [Brand] = 'bmw' THEN '독일' ELSEIF [Brand] = 'peugeot' THEN '프..
2024.02.02
no image
[Tableau] Filter
1) 원본 데이터 필터 - 태블로에서는 여러 개의 데이터를 조인해서 사용할 수 있다. - 필터 기능 : 데이터 원본에서 읽어올 때 필터링 가능 데이터 원본과 시트에서 모두 필터링 가능 그런데 필터링은 가능한 빠르게 하는게 좋기 때문에 시트가 하나라면 원본에서, 시트가 두개 이상이면 각자의 시트에서! 필터 ADD > Add.. > Type > Truck Exclude 트럭은 안나오게 필터링 2) 워크시트 페이지 필터 - 필터 이동 및 재생을 통해 워크시트 뷰를 동적으로 보이게 함 계산된 필드 만들기 이름: 매출액 계산식: [Price] * [Quantity] 열: 매출액 행: Type [매출액 합계] - Color 카드 [Type] - Label 카드 Page 카드에 Order Date > Month 오른..
2024.02.02
no image
Tableau - 히트맵 차트
1. 개요 - 테이블 형식으로 데이터 수치 차이를 색상으로 구분 - 열과 행에 범주값 배치 날짜 형식의 월, 일, 요일을 배치해서 다른 날짜와 비교하거나 추세를 파악 - 태블로에서 히트맵은 사각형 차트 2. 히트맵 만들기 Superstore_Sample.xlsx 카드 유형 Square Columns : Order Date Rows : Order Date 열(Columns) - 주문날짜(Order Date) 우클릭 > 불연속형(Discrete) 더보기 > 요일(WeekDay) 색상카드 합계(매출) 추세가 있긴 하지만 사실 불연속형이다. 파란 곳이 짙을수록 매출이 높음 / 빨간 곳이 짙을수록 매출이 낮음 수요일에 쉬어야겠군
2024.02.02
no image
Tableau - 박스 플롯
분포에 통계적 맥락 추가한 차트 의사별 대기 시간 산포도 Hospital Visit.csv 마크 유형 원 선택 계산된 필드: 진료 시간 입장 날짜 - 퇴장 날짜 (단위: day) DATEDIFF('day', [Date of Admit], [Date of Discharge]) 열: 계산된 필드(진료 시간) 행: Department Type 합계 > 측정값 > 평균 [Department Type] - 색상 카드 [Docter] - 세부정보 X축은 시간의 분포! 박스프롯 [분석] > 박스플롯 뷰 영역으로 드래그 IQR - 3/4 지점에서 1/4 지점을 뺀 값 - IQR +- 1.5를 곱한 범위 외의 값을 이상치로 판단
2024.02.02
no image
Tableau - 분산형 차트
1. 개요 - 행과 열 선반에 각각 1개 이상의 측정값을 활용 색상과 크기를 이용해서 세부 정보 표현 - 해당 데이터가 어떻게 분포되는지 파악, 데이터의 분포나 상관관계를 알아보고자 할 때 유용 - 2개의 측정값을 나열할 때 서로 관련성이 높은 데이터 배치 X축: 매출 Y축: 수익 버블의 색상: 평균 할인율 버블의 크기: 수량 2. 분산형 차트 만들기 마크 선반 유형 원으로 변경 분산형 차트는 일반적으로 숫자 데이터만으로 구성 열: 매출 행: 수익 범주는 세부정보에 배치 [도시] 마크 세부정보로 드래그 배치되는 모양 대각선 모양: 상관관계가 높다고 할 수 있음 사각형 / 원형: 상관관계가 거의 없음 → 클러스터링(군집) 3번째 특성을 적용하려면 크기에 배치 [할인율]을 마크 크기로 배치 유사한 상관관계 ..
2024.02.01
no image
Tableau - 영역 그래프
1. 개요 - 시계열에 따른누적 데이터가 어떻게 구성되는지 보여줄 때 사용 라인 그래프와 다른점은 추세와 더불어 누적데이터까지 표현 - 1 시계열 데이터, 1 차원, 1 측정값 열: 시계열 데이터 행: 측정값 색상: 차원(범주) 각 항목의 성질이 다르기 때문에 한번에 선택하고 영역 차트를 선택하면 태블로가 자동으로 배치 2. 영역 차트 생성 주문 날짜, 대분류, 매출 필드 선택 > 표현 형식 > 영역 차트 격자선 조정: 축 우클릭 > 서식 > 라인 시계열에서 일부 데이터를 사용하는 경우 X축 선택 > 마우스 우클릭 > 축 편집... > 범위 > 사용자 지정 Use Case HR 가상 데이터를 기반으로 최근 10년 미국 성별 및 인종별 구성 비율을 영역 차트로 표현한 대시보드 전반적으로 변화 폭이 크지 않..
2024.02.01
no image
Tableau - Word Cloud
1. 개요 - Tag Cloud - 단어의 빈도 수를 단어의 크기나 색상으로 표현하는 텍스트 데이터 시각화 - 이미지 위에 표현하기도 함 - 배제하는 단어(stop wrods)로 전처리하는게 필요 분류 > 텍스트 수치 > 크기 수치 > 색상 필터 > 도시 > 조건 '매출합계 > 50' Use Case 해리포터 비밀의방 책에서 언급된 단어를 클라우드 형식으로 표현 관사와 전치사 등을 제외하고 가장 많이 언급된 상위 500개 단어 빈도 횟수에 따라 그룹을 만들고 색상을 통해 가장 많이 언급된 단어가 선명하게 표현
2024.02.01
no image
Tableau - Tree Map
1. 개요 - 1 차원 1 측정값 - 측정값 크기에 따라 사각형의 색상과 크기를 다르게 표현 - 구성 비율 · 비중 파악 - 항목별 데이터 크기 차이가 커야 효과적 5개 이상의 항목은 트리 맵 차트가 효과적 5개 미만이면 누적막대나 파이차트가 효과적 2. 세그먼트 별 매출의 구성 비율 맵 차트로 구현 [세그먼트]와 [매출] 선택 > [표현 방식] > Tree Map - 여러 개의 차원을 하나의 계층으로 생성 python의 pandas에서는 멀티 인덱스라고 함 현재 대분류 - 중분류 - 제품 이름들 존재 3개를 선택 > 마우스 우클릭 > 계층 > 계층 만들기 계층을 마크 색상으로 드래그 대분류 중분류 (대분류 왼쪽 + 버튼)
2024.02.01

[Tableau] Field

0ㅑ채
|2024. 2. 2. 16:44

1. Field 변환

  • 필드의 종류를 변경하는 것이 가능  

 

1) 별칭 Aliases

  • 날짜 등의 데이터를 직접 입력하게 하려면, 일관된 형식으로 쓰게 해야 한다.

별칭 만들기:

좌측 [DATA] > [Gender] 우클릭 > Aliases... > 별칭 입력 > 행 선반으로

 

2) 계산된 필드 만들기

  • 기존의 데이터를 이용해서 새로운 데이터 만들어내는 것
  • 파생 필드
  • IF와 CASE 자주 사용
    • IF [조건] THEN 값
      ELSEIF [조건] THEN 값
      ELSE 값
      END
    • CASE 
      WHEN 값1 THEN 값2
      END

 

이름: 국가브랜드

  • IF [Brand] = 'chevrolet' THEN '미국'
    ELSEIF [Brand] = 'bmw' THEN '독일'
    ELSEIF [Brand] = 'peugeot' THEN '프랑스'
    ELSE '일본'
    END

 

이름: Price 평균

  • AVG([Price])

 

3) 그룹

  • 차원이나 측정값 필드를 그룹화할 때 사용
  • 일반적으로 차원을 그룹화하는 데 활용
  • 측정값도 그룹화할 수 있지만 일반적으로 범위를 이용하기 때문에 계산된 필드를 주로 그룹화함

[Brand (group)] 생성: 

[Brand] 우클릭 > Create > Group... > Group 

 

 

4) 집합

  • 동적집합과 고정집합
  • 동적집합을 주로 사용
    • 데이터가 변경되면 집합의 데이터가 자동으로 변경되는 집합
    • ex. 상위 N개
    • 필터를 이용해서도 비슷하게 만들 수 있음

매출액 상위 10개로 Model 집합 필드 생성: 

[Model] 우클릭 > Create > Set... > Top > By Field > 10

 

열: 매출액

행: Model 집합, Model

[Model 집합] - Color 카드

[매출액] - Color 카드

 

 

5) 구간 차원

  • 수치 데이터를 그룹화할 때 사용
  • 히스토그램 생성 시 주로 이용
  • Binnig이라고도 함

[Age] 

  • 수치 데이터
  • 연령대처럼 범주화하기도 한다.
    • 계산된 필드를 이용해서 만들 수 있지만 여러 범주로 분할하려면 수식이 복잡해진다.

 

[Brand] 우클릭 > Create > Bins... > 필드 이름: Age (연령대) > 차원 크기 10

연령대별 평균도 확인해볼 수 있다!

 

6) 매개변수

  • 사용자가 직접 변수를 활용해서 뷰를 필터링
  • 대부분의 경우 차원을 가지고 수행
  • 매개변수는 단독으로 사용 불가, 계산된 필드 필요

생성 방법: 

[필드] 마우스 우클릭 > 매개변수 or 사이드바 우클릭 > 매개변수

> 매개변수 생성 (시작일 2020-01-01) (종료일 2020-12-31)

> Show Parameter

 

행: Order date

[매출액] - text 

 

계산된 필드:

IF [Order Date] >= [시작일]
AND [Order Date] <= [종료일]
THEN 'Y' ELSE 'N' END

 

계산된 필드 - Filter로 드래그 > Y만 체크하면

  • 시작일, 종료일, 필터 값에 따라 동적으로 변함

 

 

7) 분할

  • 하나의 필드가 2개 이상의 데이터 조합인 경우 사용
  • 분할
    • 태블로가 반복되는 패턴을 찾아서 분할
  • 사용자 지정 분할
    • 분할 기호를 사용자가 직접 지정

 

Store Addr 분할:

[Store Addr] 우클릭 > Transform > Split

 

사용자 지정 분할: 

[Store Addr] 우클릭 > Transform > Costom Split

 

 

 

8) 계층

Store Addr 분할 1, Store Addr 분할 2 함께 우클릭 > 계층 > 계층 만들기 > 계층 행으로 > + 누르기

 

 

 

9) 데이터 유형 및 지리적 역할

데이터 유형: 숫자/날짜/문자열 변환

지리적 역할: 문자열 중에서 국가/시도/카운티(시군구) 등으로 역할 변환

  • 이때만 [표현방식]에서 지도 활성화

 

Store_Addr은 시·도+시 구조이므로 분할을 먼저 수행

Store_Addr1 > Graphic Role > State/Province

Store_Addr1 > Graphic Role > County

 

store_addr(계층) 필드 - color, detail

 

 

'Tableau' 카테고리의 다른 글

[Tableau] 세부 수준 계산  (0) 2024.02.05
[Tableau] Join  (0) 2024.02.02
[Tableau] Filter  (0) 2024.02.02
Tableau - 히트맵 차트  (0) 2024.02.02
Tableau - 박스 플롯  (0) 2024.02.02

[Tableau] Filter

0ㅑ채
|2024. 2. 2. 12:17

1) 원본 데이터 필터

 

- 태블로에서는 여러 개의 데이터를 조인해서 사용할 수 있다.

- 필터 기능 : 데이터 원본에서 읽어올 때 필터링 가능

  • 데이터 원본과 시트에서 모두 필터링 가능
  • 그런데 필터링은 가능한 빠르게 하는게 좋기 때문에 시트가 하나라면 원본에서, 시트가 두개 이상이면 각자의 시트에서!

필터 ADD > Add.. > Type > Truck Exclude

  • 트럭은 안나오게 필터링

 

2) 워크시트 페이지 필터

- 필터 이동 및 재생을 통해 워크시트 뷰를 동적으로 보이게 함

 

계산된 필드 만들기

이름: 매출액

계산식: [Price] * [Quantity]

 

열: 매출액

행: Type

[매출액 합계] - Color 카드

[Type] - Label 카드

 

Page 카드에 Order Date > Month 

  • 오른쪽에 애니메이션 관련 메뉴가 추가됐당

 

Model 별 매출액 막대 차트

열: 매출액

행: Model

[매출액 합계] - Color 카드, Label 카드

 

오른쪽 상단 SUM(매출액) > Edit Colors > Stepped Color > 10

 

Model 필드를 Filter로 드래그

General Wildcard Condition Top

특정 값 제거 - Traveller 제거

m으로 시작

매출액 합계 80억 이상

상위 5개까지

 

'Tableau' 카테고리의 다른 글

[Tableau] Join  (0) 2024.02.02
[Tableau] Field  (0) 2024.02.02
Tableau - 히트맵 차트  (0) 2024.02.02
Tableau - 박스 플롯  (0) 2024.02.02
Tableau - 분산형 차트  (1) 2024.02.01

Tableau - 히트맵 차트

0ㅑ채
|2024. 2. 2. 10:37

 

1. 개요

- 테이블 형식으로 데이터 수치 차이를 색상으로 구분

- 열과 행에 범주값 배치

  • 날짜 형식의 월, 일, 요일을 배치해서 다른 날짜와 비교하거나 추세를 파악

- 태블로에서 히트맵은 사각형 차트

 

 

2. 히트맵 만들기

Superstore_Sample.xlsx

카드 유형 Square

 

Columns : Order Date

Rows : Order Date

 

열(Columns)  - 주문날짜(Order Date) 우클릭 > 불연속형(Discrete) 더보기 > 요일(WeekDay)

색상카드 합계(매출)

  • 추세가 있긴 하지만 사실 불연속형이다.
  • 파란 곳이 짙을수록 매출이 높음 / 빨간 곳이 짙을수록 매출이 낮음
  • 수요일에 쉬어야겠군

 

 

 

 

 

 

 

 

 

 

 

 

 

'Tableau' 카테고리의 다른 글

[Tableau] Field  (0) 2024.02.02
[Tableau] Filter  (0) 2024.02.02
Tableau - 박스 플롯  (0) 2024.02.02
Tableau - 분산형 차트  (1) 2024.02.01
Tableau - 영역 그래프  (0) 2024.02.01

Tableau - 박스 플롯

0ㅑ채
|2024. 2. 2. 09:42

 

분포에 통계적 맥락 추가한 차트

 

의사별 대기 시간 산포도

Hospital Visit.csv

 

마크 유형 원 선택

 

계산된 필드: 진료 시간

입장 날짜 - 퇴장 날짜 (단위: day)

DATEDIFF('day', [Date of Admit], [Date of Discharge])

 

열: 계산된 필드(진료 시간)

행: Department Type

 

합계 > 측정값 > 평균

[Department Type] - 색상 카드

 

[Docter] - 세부정보

  • X축은 시간의 분포!

 

박스프롯

[분석] > 박스플롯 뷰 영역으로 드래그

 

 

IQR

- 3/4 지점에서 1/4 지점을 뺀 값

- IQR +- 1.5를 곱한 범위 외의 값을 이상치로 판단

 

 

'Tableau' 카테고리의 다른 글

[Tableau] Filter  (0) 2024.02.02
Tableau - 히트맵 차트  (0) 2024.02.02
Tableau - 분산형 차트  (1) 2024.02.01
Tableau - 영역 그래프  (0) 2024.02.01
Tableau - Word Cloud  (0) 2024.02.01

Tableau - 분산형 차트

0ㅑ채
|2024. 2. 1. 17:43

 

1. 개요

- 행과 열 선반에 각각 1개 이상의 측정값을 활용

  • 색상과 크기를 이용해서 세부 정보 표현

- 해당 데이터가 어떻게 분포되는지 파악, 데이터의 분포나 상관관계를 알아보고자 할 때 유용

- 2개의 측정값을 나열할 때 서로 관련성이 높은 데이터 배치

 

X축: 매출

Y축: 수익

버블의 색상: 평균 할인율

버블의 크기: 수량

 

 

 

 

2. 분산형 차트 만들기

마크 선반 유형 으로 변경

분산형 차트는 일반적으로 숫자 데이터만으로 구성

 

열: 매출

행: 수익

 

범주는 세부정보에 배치

[도시] 마크 세부정보로 드래그

 

 

배치되는 모양

대각선 모양: 상관관계가 높다고 할 수 있음

사각형 / 원형: 상관관계가 거의 없음 → 클러스터링(군집)

 

3번째 특성을 적용하려면 크기에 배치

[할인율]을 마크 크기로 배치

  • 유사한 상관관계 확인

4번째 특성을 적용하려면 색상에 배치

[수량] 마크 색상으로

[도시] 마크 레이블로

 

분포가 일정한 선의 모양이나 특정 영역에 몰려있는 경우 이상치 탐색

기울기가 바뀌는 임계점이 Threshold

데이터분석에서는 elbow

 

Use Case

1. 재난 지원금 비율과 아파트 평 단가를 시각화

  • 재난지원금이 높아질수록 아파트 평 단가가 낮아지는 음의 상관관계
  • 전혀 다른 2가지 측정값에서 새로운 관계상을 발견하는 데 유용

 

2. 물류 데이터를 활용한 분산형 차트

  • 16번 창고에서 시간당 처리 화물 수에 비해 화물당 비용이 높게 측정
  • 이상치 데이터를 확인해 문제를 파악하고 빠르게 조치하는 데 유용

 

 

'Tableau' 카테고리의 다른 글

Tableau - 히트맵 차트  (0) 2024.02.02
Tableau - 박스 플롯  (0) 2024.02.02
Tableau - 영역 그래프  (0) 2024.02.01
Tableau - Word Cloud  (0) 2024.02.01
Tableau - Tree Map  (0) 2024.02.01

Tableau - 영역 그래프

0ㅑ채
|2024. 2. 1. 17:01

1. 개요

- 시계열에 따른누적 데이터가 어떻게 구성되는지 보여줄 때 사용

  • 라인 그래프와 다른점은 추세와 더불어 누적데이터까지 표현

- 1 시계열 데이터, 1 차원, 1 측정값

열: 시계열 데이터

행: 측정값

색상: 차원(범주)

  • 각 항목의 성질이 다르기 때문에 한번에 선택하고 영역 차트를 선택하면 태블로가 자동으로 배치

 

 

2. 영역 차트 생성

주문 날짜, 대분류, 매출 필드 선택 > 표현 형식 > 영역 차트

 

격자선 조정: 축 우클릭 > 서식 > 라인

 

시계열에서 일부 데이터를 사용하는 경우

X축 선택 > 마우스 우클릭 > 축 편집... > 범위 > 사용자 지정

 

 

Use Case

  • HR 가상 데이터를 기반으로 최근 10년 미국 성별 및 인종별 구성 비율을 영역 차트로 표현한 대시보드
  • 전반적으로 변화 폭이 크지 않지만 대시보드 오른쪽에 있는 여성은 2019-2020 White 비율이 소폭 줄어들고 Black 비율이 소폭 늘어나는 모습
  • 시간의 흐름에 따라 비율의 변동성 표현 시 유용!

 

 

 

 

 

 

 

 

'Tableau' 카테고리의 다른 글

Tableau - 박스 플롯  (0) 2024.02.02
Tableau - 분산형 차트  (1) 2024.02.01
Tableau - Word Cloud  (0) 2024.02.01
Tableau - Tree Map  (0) 2024.02.01
Tableau - 라인 그래프  (0) 2024.02.01

Tableau - Word Cloud

0ㅑ채
|2024. 2. 1. 16:40

 

1. 개요

- Tag Cloud

- 단어의 빈도 수를 단어의 크기나 색상으로 표현하는 텍스트 데이터 시각화

- 이미지 위에 표현하기도 함

- 배제하는 단어(stop wrods)로 전처리하는게 필요

 

분류 > 텍스트

수치 > 크기

수치 > 색상

 

필터 > 도시 > 조건 '매출합계 > 50'

 

 

Use Case

  • 해리포터 비밀의방 책에서 언급된 단어를 클라우드 형식으로 표현
  • 관사와 전치사 등을 제외하고 가장 많이 언급된 상위 500개 단어
  • 빈도 횟수에 따라 그룹을 만들고 색상을 통해 가장 많이 언급된 단어가 선명하게 표현

 

 

 

 

'Tableau' 카테고리의 다른 글

Tableau - 분산형 차트  (1) 2024.02.01
Tableau - 영역 그래프  (0) 2024.02.01
Tableau - Tree Map  (0) 2024.02.01
Tableau - 라인 그래프  (0) 2024.02.01
Tableau - 막대 그래프  (2) 2024.02.01

Tableau - Tree Map

0ㅑ채
|2024. 2. 1. 16:16

 

1. 개요

- 1 차원 1 측정값

- 측정값 크기에 따라 사각형의 색상과 크기를 다르게 표현 

- 구성 비율 · 비중 파악

- 항목별 데이터 크기 차이가 커야 효과적

  • 5개 이상의 항목은 트리 맵 차트가 효과적
  • 5개 미만이면 누적막대나 파이차트가 효과적

 

2. 세그먼트 별 매출의 구성 비율 맵 차트로 구현

[세그먼트]와 [매출] 선택 >  [표현 방식] > Tree Map 

 

- 여러 개의 차원을 하나의 계층으로 생성

  • python의 pandas에서는 멀티 인덱스라고 함

현재 대분류 - 중분류 - 제품 이름들 존재

3개를 선택 > 마우스 우클릭 > 계층 > 계층 만들기

계층을 마크 색상으로 드래그

대분류 중분류  (대분류 왼쪽 + 버튼)

 

 

'Tableau' 카테고리의 다른 글

Tableau - 영역 그래프  (0) 2024.02.01
Tableau - Word Cloud  (0) 2024.02.01
Tableau - 라인 그래프  (0) 2024.02.01
Tableau - 막대 그래프  (2) 2024.02.01
Tableau - 주제에 적합한 시각화 방법  (0) 2024.02.01