AI TECH/Data Vizualization 4

[matplotlib] Scatter Plot

- Scatter Plot이란 - 실습 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt Scatter Plot이란 - 점을 사용하여 두 feature간의 관계를 알기 위해 사용하는 그래프로, 산점도라고도 불림 - .scatter()을 사용함 - 점의 속성 (1) 색상(color) (2) 모양(marker) 비추천 (3) 크기(size): 버블 차트라고 부름. 관계보다는 각 점간 비율에 초점을 둘 때 사용. SWOT 분석등에 활용 가능 비추천 fig = plt.figure(figsize=(7, 7)) ax = fig.add_subplot(111, aspect=1) np.random.s..

[matplotlib] Line Plot

- Line Plot이란 - 원칙 - 실습 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt Line Plot이란 - 연속적으로 변화하는 값을 점으로 나타내고 이를 선으로 연결한 그래프로, 꺾은 선 그래프, line chart, line graph 등으로 불림 - bar plot은 .bar()을 사용하지만 line plot은 .line()이 아닌 .plot()을 사용함 - Noise의 인지 방해를 줄이기 위해 smoothing을 사용함 - Line을 구별하는 요소는 세 가지 (1) 색상 (2) 마커 (3) 선의 종류: solid, dashed, dashdot, dotted, None ..

[matplotlib] Bar Plot

- bar plot이란 - multiple bar chart - 원칙 import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt Bar plot이란 - 막대 그래프, bar chart, bar graph의 이름으로 불리는 직사각형 막대를 사용해 데이터의 값을 표현하는 차트 또는 그래프 - 범주(category)에 따른 수치 값을 비교하기에 적합한 방법임 - 막대의 방향에 따라서 분류할 수 있음 - bar() : 기본적인 bar - plotbarh() : horizontal bar plot fig, axes = plt.subplots(1, 2, figsize=(12, 7)) x = list('A..

시각화와 matplotlib

Data Visualization 이해하기 1. 데이터 셋의 종류 - 정형 데이터 : csv 파일로 제공되는 테이블 형태의 데이터 (row가 데이터 1개의 item이고, column이 attribute(feature)임) - 시계열 데이터: 기온, 주가와 같이 시간의 흐름에 따른 데이터. 추세(trend), 계절성(seasonality), 주기성(cycle) 등을 살핌 - 지도/지리 데이터 - 관계 데이터: 객체와 객체 간의 관계를 시각화함(Graph visualization/ Network visualization). 객체는 node, 관계는 link로 표현하고 관계의 가중치를 크기, 색, 수 드응로 표현. 휴리스틱하게 노드 배치 구성 - 계층적 데이터: 관계 중에서도 포함 관계가 분명한 데이터. (e..