본문 바로가기
728x90

공부 목록/IT & 프로그래밍99

데이터 순위나 변화를 가시화 하기 위한 matplotlib의 bar() 함수 데이터를 분석할 때 데이터의 순위나 변화를 한눈에 보기 위해 그래프를 사용하는데, 이때 막대바 형태의 그래프가 매우 유용합니다. 오늘은 maplotlib 라이브러리의 pyplot 모듈에서 이러한 그래프를 그릴 수 있는 bar() 함수에 대해 설명해 보려고 합니다. 1. 막대바 그래프는 언제 사용하는가? 범주형 데이터의 값을 시각화할 때 막대그래프는 각 카테고리별로 값을 비교하기에 적합합니다. 예를 들어, 다른 도시의 인구, 각 월의 판매량, 제품 카테고리별 매출 등을 시각화할 때 많이 사용됩니다. 데이터의 변화를 보여주기 위해 여러 그래프를 겹쳐 그릴 때 막대그래프를 겹쳐 그리면 다른 그룹의 값 비교 및 변화를 한눈에 파악할 수 있습니다. 예를 들어, 각 연도별 도시별 인구 변화를 비교하기 위해 막대그래.. 2023. 5. 21.
파이썬 Matplotlib pyplot의 scatter(산점) 함수 인자 및 사용법 설명 파이썬 프로그래밍을 데이터 분석에 사용하다 보면 데이터를 가시화해야 하는 경우가 있습니다. 일반적으로 많이 사용하는 함수는 2차원의 직선을 그려주는 plot일 겁니다. 사실 이는 직선이라기보다는 데이터의 점들을 잇는 선이라고 표현하는 것이 더 맞을 겁니다. 오늘은 또 다른 가시화 함수인 scatter(산점도)의 각 인자들이 어떻게 사용되는지 알아보겠습니다. 1. 산점도(scatter plot)란? 산점도(Scatter plot)는 두 변수 간의 관계를 시각화하기 위해 사용되는 그래프입니다. 산점도는 수치형 데이터로 이루어진 두 변수의 값들을 좌표 평면 상에 점으로 나타내며, 각 점은 변수 간의 상대적인 관계를 보여줍니다. 일반적으로 x축과 y축은 서로 다른 변수를 나타냅니다. 각 점의 위치는 해당 변수들.. 2023. 5. 20.
프로그램 개발 전 순서도(flow chart)를 작성해 보세요 프로그램을 개발하는 업무를 하다 보면 자신의 개발 프로그램을 타인에게 설명을 해야 할 때가 있습니다. 내부함수나 외부함수를 사용하고 클래스도 별도 정의한 라이브러리에서 읽어오는 등 조금 복잡한 코드의 경우 실행 순서를 쫓아다니기가 버거울 때가 있습니다. 순서도(flow chart)를 작성해 놓으면 프로그램 개발 시 내가 의도한 바가 잘 구성되어 있는지 확인할 수 있으며, 협업을 할 때 설명하기도 수월합니다. 또한, 업무 인수인계 시 순서도를 전달해 주면 업무를 받는 사람이 코드 이해를 보다 쉽고 빠르게 할 수 있습니다. 오늘은 이러한 순서도를 어떻게 작성하는지 정리해 보려고 합니다. 1. 순서도의 종류와 특성 Start/End : 타원 무슨 일을 하던지 시작과 끝을 알리는 것이 일반적일 겁니다. 순서도에.. 2023. 5. 17.
파이썬 그래프 라이브러리 matplotlib의 plot 함수 인자 설명 데이터 분석을 할 때 가장 많이 사용되는 것이 그래프를 확인하는 방법일 겁니다. 이것을 데이터의 가시화라고 하는데, 파이썬에서 사용되는 그래프 라이브러리인 matplotlib의 pyplot 중 plot 메서드 사용방법에 대해 알아보겠습니다. plot 메서드는 기본적으로 그래프를 그리는 것으로 그래프 창의 포맷을 변경하는 메서드는 별도로 존재합니다. 1. plt와 plot은? plt와 plot은 모두 Matplotlib 라이브러리의 기능을 사용하기 위해 제공되는 함수입니다. plt는 일반적으로 matplotlib.pyplot 모듈의 별칭(alias)으로 사용되며, pyplot은 Matplotlib에서 그래프를 그리고 조작하는 데 사용되는 다양한 함수와 도구를 제공합니다. plt를 사용하여 그래프를 생성하고.. 2023. 5. 6.
파이썬 데이터 병합 메서드 merge의 파라미터별 사용법 판다스의 데이터 프레임이 여러 개 있다는 것은 데이터 셋이 여러 개 존재한다는 것을 의미합니다. 데이터 분석을 잘하기 위해서는 여러 개의 데이터 셋을 하나의 데이터 셋으로 병합하는 것이 좋습니다. 이를 위해 판다스에서는 몇몇 메서드들이 존재합니다. merge, concat, join들이 그러한 역할을 해줍니다. 일반적으로 merge와 concat을 주로 사용하는데 그 용도가 조금 다릅니다. merge의 경우 두 개의 다른 형태의 데이터 셋을 병합할 때 사용하고 concat은 같은 포맷의 여러 데이터 셋을 병합할 때 사용합니다. 오늘은 우선 merge에 대한 설명을 정리해 보려고 합니다. 1. merge()의 기본 사용 데이터 분석에서는 종종 여러 개의 데이터프레임이 존재하며, 이를 병합하여 하나의 큰 데.. 2023. 5. 6.
파이썬 Matplotlib의 이미지 저장 메서드 savefig() 사용하기 Matplotlib는 파이썬에서 데이터 시각화를 위한 강력한 라이브러리 중 하나입니다. 이 라이브러리에는 그래프를 이미지 파일로 저장하는 savefig() 메서드가 있습니다. 이 메서드는 다양한 파일 형식을 지원하며 그림 크기, 해상도, 배경색, 압축 등의 다양한 옵션을 설정할 수 있습니다. 오늘은 해당 메서드에 대해서 알아보려고 합니다. 1. savefig() 메서는 기본 사용법 savefig() 메서드에 대한 설명은 다음과 같습니다. matplotlib.pyplot.savefig( fname, dpi=None, facecolor='w', edgecolor='w', orientation='portrait', papertype=None, format=None, transparent=False, bbox_.. 2023. 4. 30.
파이썬 데이터 프레임의 정렬을 위한 sort_values 메서드 사용법 데이터 분석을 위해 파이썬의 판다스 데이터 프레임은 상당히 좋은 라이브러리입니다. 데이터 분석 도중 통계 메서드를 이용해서 데이터의 특성을 살펴보기도 하는데, 데이터를 크고 작은 순으로 정렬할 수 있다면 데이터 특성을 가시화하는데 더 큰 도움이 될 겁니다. 오늘은 데이터 프레임의 메서드들 중 데이터 정렬을 도와주는 sort_values()의 사용에 대해 알아보겠습니다. 1. sort_values() 특징 sort_values()는 데이터 프레임을 특정 열의 기준으로 정렬하는 메서드입니다. 이 메서드의 기본 사용 모습은 아래 코드와 같습니다. 인자들에 값이 입력되어 있는 것은 기본값으로 세팅된 것이며 특정 인자값을 넣지 않으면 해당 값으로 메서드를 수행합니다. DataFrame.sort_values( by.. 2023. 4. 29.
파이썬 데이터 프레임 개수 확인 메서드 파이썬에서 데이터 프레임은 데이터 분석을 위해 필수적으로 사용되는 라이브러리입니다. 지난번에는 데이터 프레임의 통계값을 추출하기 위한 메서드에 대해서 정리를 해봤는데, 오늘은 데이터 프레임 내 데이터들의 개수와 관련된 메서드에 대해 얘기해 볼까 합니다. 1. unique() 데이터 프레임의 각 열의 고유한(unique) 값들을 반환하는 메서드입니다. df.unique() 형태로 사용하며, 각 열의 고유한 값들을 넘파이 배열(numpy array)로 반환합니다. import pandas as pd # 예제 데이터 프레임 생성 df = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6], 'B': [2, 4, 6, 6, 8, 8], 'C': ['a', 'a', 'b', 'b', 'c ']}).. 2023. 4. 27.
728x90