[Python] 파이썬 데이터 시각화, 그래프 - matplotlib, pandas, seaborn
안녕하세요.
이번 포스팅에서는 파이썬의 데이터 시각화 (그래프)에 대해 알아보겠습니다.
파이썬에서 데이터 시각화를 위한 모듈/패키지가 많이 있지만,
대표적인 모듈/패키지는 matplotlib, pandas, seaborn 등이 있습니다.
1. matplotlib
matplotlib은 numpy에서 그래프를 그릴 때 사용 합니다.
주로 2차원 데이터를 그래프로 생성합니다.
기본 용어는 다음과 같습니다.
matplotlib 공식 페이지에 상세 가이드와 튜토리얼을 참고하시면 기본적인 내용은 바로 사용이 가능합니다.
https://matplotlib.org/tutorials/index.html
간단한 사용법은 다음과 같습니다.
* 아래 예제들은 import matplotlib.pyplot as plt 를 통해 import 한 후 수행 가능합니다.
1-1. 그래프 생성 및 출력
기본적으로 plot() 함수를 통해 그래프를 생성하고, show() 함수를 통해 그래프를 출력 합니다.
히스토그램 출력 시엔 plot() 함수가 아닌 hist() 함수를 사용합니다.
plt.plot([x좌표], [y좌표], [옵션]) # 그래프 생성
plt.show() # 그래프 출력
의 형태로 그래프를 생성/출력 가능합니다.
그래프 생성을 여러번 한 다음 show()를 하시면 생성한 그래프가 중첩되어 보여집니다.
기본적인 옵션은 다음과 같습니다.
- 모양 관련
-- Default : 선 그래프
-- 'o' : 원형 점 그래프
-- 's' : 네모 점 그래프
-- '^' : 세모 점 그래프
-- '--' : 점선 그래프
- 색깔 관련
-- 각 색의 제일 앞글자를 통해 색 설정이 가능합니다. (r : red, b : blue, y : yellow, g : green 등)
각 옵션은 문자열로 한번에 전달 하셔도 적용 됩니다.
예를들어 'r--' 로 옵션을 주셨을 경우 빨간색 점선 그래프가 생성 됩니다.
1-2. 그래프 제목 및 축 이름 설정
그래프의 제목은 title() 함수를 통해,
x축과 y축은 각각 xlabel(), ylabel() 함수를 통해 정해줄 수 있습니다.
각 함수의 매개변수로 str 형의 변수를 입력해주시면 해당 이름으로 설정이 됩니다.
1-3. 그 외 기타 함수
- grid() : 그래프에 격자 무늬를 집어 넣는다.
2. Pandas
pandas의 시리즈와 데이터 프레임은 matplotlib의 함수들을 내장하고 있습니다.
plot() 함수의 매개변수는 label, ax, style, alpha, kind, xticks, yticks, xlim, ylim, grid 등이 있습니다.
3. Seaborn
seaborn은 matplotlib을 기반으로 하는 파이썬 시각화 라이브러리 입니다.
공식사이트의 튜토리얼이나 가이드를 참고하시면 다양한 형태의 그래프를 생성하실 수 있습니다.
https://seaborn.pydata.org/examples/index.html
'Computer Programming > Python' 카테고리의 다른 글
[Python] 파이썬 matplotlib.pyplot import 시 could not open display 에러 해결법 (0) | 2022.02.23 |
---|---|
[Python] 파이썬 Pandas 데이터프레임 그룹 연산 및 피봇 테이블 (DataFrame Grouping, Pivot Table) (0) | 2020.02.24 |
[Python] 파이썬 Pandas 데이터 구조. Series, DataFrame (0) | 2020.02.21 |
[Python] 파이썬 Numpy (0) | 2020.02.19 |
[Python] 파이썬 클래스 (class) (0) | 2020.02.17 |