본문 바로가기
728x90

데이터 분석5

파이썬에서 암호화된 엑셀 파일을 포함한 여러 방법 정리 파이썬은 데이터 분석으로 많이 활용됩니다. 회사에서 데이터 분석을 위해 엑셀 파일의 데이터를 파이썬에서 읽어야 하는 경우가 있습니다. 삼성과 같은 대기업의 경우 파일이 암호화가 돼 있어 파이썬에서 호출 시 일반적인 방법으로 어려울 수 있습니다. 파이썬에서 암호화된 엑셀 파일은 물론 다양한 라이브러리에 대한 설명을 정리합니다.    Pandas 라이브러리 사용'Pandas'는 데이터 분석에 꼭 필요한 파이썬의 라이브러리로, 엑셀 파일을 읽고 쓰는 기능도 포함하고 있습니다. pandas 라이브러리를 사용하게 되면 자동으로 dataframe 형태로 데이터를 사용할 수 있습니다. 우선적으로 판다스를 사용하기 위해 판다스를 설치해야 합니다. pip install pandas 엑셀 파일을 열기 위해서는 파이썬 코드.. 2024. 8. 5.
맥북 M1, M2 칩에서 python pyqt5 설치와 백앤드 설정 맥북에서 파이썬을 이용하여 데이터 분석을 하거나 코딩을 하시는 분들에게 좋은 소식이 있습니다. 바로 pyqt5의 설치 관련인데요. 지금까지 맥북에서 바로 설치가 되지 않아 brew나 pyside를 설치해야 했습니다. 또한, 사용법도 윈도우와 조금 다르게 사용했는데 이제는 모든 사용이 윈도우와 동일하게 됐습니다. 해당 내용 자세히 알아보겠습니다. Vscode, Python에서 Pyqt5의 사용하는 목적 pyqt는 GUI를 위한 라이브러리입니다. 데이터 분석용으로 파이썬을 사용할 경우 GUI를 개발할 일은 별로 없습니다. 제가 pyqt를 사용하는 이유는 데이터의 그래프를 생성할 때 새창으로 띄우기 위해서입니다. 그래프를 새창에서 생성할 때 필요한 GUI를 pyqt 백앤드 설정으로 불러들이는 겁니다. 이렇게 .. 2023. 11. 26.
python plt.fill_betweenx()과 plt.fill() 함수로 그래프 영역 채우기 지난 글에서 plt.fill_between() 함수를 이용하여 그래프에 영역을 채우는 내용에 대해 다뤘습니다. plt.fill_betweenx()와 plt.fill() 함수를 이번에 따로 다루는 이유는 사용성 때문입니다. 기본적인 사용은 plt.fill_between()을 자주 사용할 것이기 때문입니다. 이번 글에서는 그래도 필요할 때 사용할 수 있도록 fill_betweenx와 fill 함수에 대해서도 정리하려고 합니다. 1. plt.fill_betweenx() 함수 plt.fill_betweenx() 함수는 Matplotlib 라이브러리에서 제공하는 함수 중 하나로, 주로 세로 방향으로 채워진 영역을 시각화할 때 사용됩니다. 이 함수를 사용하면 주어진 y 값 범위 내에서 x 값에 해당하는 영역을 특정.. 2023. 8. 12.
python 그래프 창 내에 텍스트 삽입을 위한 plt.text 함수 파이썬에서 데이터를 이용하여 그래프를 그릴 때 matplotlib 라이브러리를 사용하게 됩니다. 일반적으로 그래프의 설정을 위해 각 축의 범위를 조절하거나 타이틀 입력, 데이터 마커 설정 등이 있을 겁니다. 때에 따라서 그래프 내에 텍스트를 기입해야 할 경우도 있는데 이번 글에서 어떻게 텍스트를 넣는지 설명해 보려고 합니다. 1. plt.text 함수란? plt.text() 함수는 Matplotlib 라이브러리에서 제공하는 함수로, 그래프나 도표 위에 텍스트를 추가하는 데 사용됩니다. 이 함수를 사용하여 그래프 상에 주석, 제목, 축 레이블 등 다양한 텍스트를 삽입할 수 있습니다. 주로 데이터 시각화에서 특정 지점에 텍스트를 추가하거나 설명을 달 때 활용됩니다. 기본 사용형태는 다음과 같습니다. plt... 2023. 8. 10.
Matplotlib 새창에서 그래프 그리기와 subplot / subplots 사용 데이터 분석 의뢰를 받으면 의례적으로 데이터 경향성 확인한다는 말을 하곤 한다. 데이터 경향성이란 데이터가 갖는 특성을 의미하는 것으로 가시화(visualization)를 통해 확인할 수 있다. 일반적으로 엑셀에서 데이터 그래프를 그려보곤 하는데, 이와 같은 행위들이 경향성을 확인하는 것이다. 하지만, 엑셀에서 수많은 feature들의 경향성을 확인하는 데는 한계가 있다. 첫 번째로 여러 개의 데이터를 순차적으로 그려보기가 어렵다. 여러 칼럼의 데이터를 그래프로 그려보면 하나의 그래프 창에서 섞여서 나타나기 때문이다. 두 번째는 엑셀 그래프에 줌/이동 기능이 없기 때문에 이상 발생 시점의 데이터 경향을 확인하기 위해서는 행의 위치를 파악해 그 부분만 그래프로 그려본다. 1. Matplotlib의 Back.. 2022. 5. 22.
728x90