728x90 공부 목록/IT & 프로그래밍99 Matplotlib 새창에서 그래프 그리기와 subplot / subplots 사용 데이터 분석 의뢰를 받으면 의례적으로 데이터 경향성 확인한다는 말을 하곤 한다. 데이터 경향성이란 데이터가 갖는 특성을 의미하는 것으로 가시화(visualization)를 통해 확인할 수 있다. 일반적으로 엑셀에서 데이터 그래프를 그려보곤 하는데, 이와 같은 행위들이 경향성을 확인하는 것이다. 하지만, 엑셀에서 수많은 feature들의 경향성을 확인하는 데는 한계가 있다. 첫 번째로 여러 개의 데이터를 순차적으로 그려보기가 어렵다. 여러 칼럼의 데이터를 그래프로 그려보면 하나의 그래프 창에서 섞여서 나타나기 때문이다. 두 번째는 엑셀 그래프에 줌/이동 기능이 없기 때문에 이상 발생 시점의 데이터 경향을 확인하기 위해서는 행의 위치를 파악해 그 부분만 그래프로 그려본다. 1. Matplotlib의 Back.. 2022. 5. 22. Python 여러 개의 엑셀 파일을 하나로 취합하는 효율적인 방법 회사업무를 하다 보면 여러 개의 엑셀 파일을 취합해야 하는 경우가 많이 생긴다. 특히나 데이터 분석에 필요한 데이터를 저장할 때 달, 주, 일, 시간 등 일정 단위로 파일을 생성하기 때문에 전체 기간의 분석을 위해서 데이터 취합은 필수 과정이 된다. 주제는 하나의 파일로 취합한다고 했지만 여러 개의 파일을 불러와서 하나의 데이터 프레임으로 만든다고 얘기하는 것이 더 맞을 듯하다. 우선 여러 개의 데이터 파일을 취합하는데 앞서 늘 그렇듯 여러 개의 데이터 파일을 생성하는 것부터 포스팅 내용을 시작하려 한다. 취합 관련 내용은 아래에 있으니 그 부분만 필요한 분들께서는 해당 내용을 스킵해도 된다.(3. 폴더/파일명을 이용한 여러개의 파일의 데이터 취합하기에서 내용 확인) 매 포스팅마다 데이터 생성하는 방법.. 2022. 5. 14. Python을 위한 vscode 폰트, 테마 세팅 지난 포스팅에서 python과 vscode 설치에 관련된 기본적인 내용을 다루었다. 초기 입문을 하는 분이라면 별다른 세팅 없이 그냥 사용해도 무방하다. 코딩을 조금이라도 해 봤거나, 맥북 사용 경험자 또는 다른 에디터를 사용했던 분들 혹은 깔끔한 환경(화면)에서 이쁘장한 폰트로 멋스럽게 코딩을 하고 싶은 분들이라면 이번 포스팅이 도움이 될 것이다. 코딩이란 결국 프로그래밍 언어를 이용하는 것으로 자주 사용하는 사람에게는 코딩에 사용되는 글자들이 가독성이 좋아야 효율도 높일 수 있다. 이번 포스팅에서는 먼저 pycharm의 테마 설치 방법에 대해 설명하고, 코딩 시 추천되는 폰트를 이용한 vscode 폰트 변경 방법을 정리한 후 약간의 에디터 세팅에 대한 내용을 다루려고 한다. 1. vscode 테마 변.. 2022. 5. 3. python 프로그래밍 위한 vscode 사용법 지난번 포스팅에 해당 내용을 같이 다루려 했으나, 양이 많아 보는 분들께 지루함을 줄까 걱정돼 분할하여 작성하기를 결정했다. vscode 설치에 대한 내용은 아래 썸네일 클릭을 통해 확인할 수 있다. 지난번 포스팅의 줄거리는 python 프로그램 시 vscode or pycharm을 사용하는 이유, 그중 vscode를 선택한 이유에 대한 설명을 잠시 하였고, vsocde를 다운받고 설치하는 법과 한글 패치 및 pylance 세팅까지가 내용이었다. https://lifelong-education-dr-kim.tistory.com/22 Python 개발을 위한 vscode(visual studio code) 설치 및 세팅하기 지난번 포스팅에서 아나콘다가 아닌 순수한 파이썬 설치를 권장했고 그 방법에 대한 설.. 2022. 4. 24. Python 개발을 위한 vscode 설치 및 세팅 지난번 포스팅에서 아나콘다가 아닌 순수한 파이썬 설치를 권장했고 그 방법에 대한 설명을 했다. 혹시 해당 포스팅을 보지 못한 분들을 위해 아래 썸네일에 링크를 걸어 두었으니 클릭만으로 그 내용을 확인할 수 있다. https://lifelong-education-dr-kim.tistory.com/21 아나콘다 없이 파이썬(Python 3.0 version) 설치 하기 파이썬을 초기에 공부할 때 wikidocs의 강좌를 보곤 했다. 그 강좌에서 파이썬 설치와 세팅을 따라하며 배웠었고 당연스레 '파이썬 = 아나콘다'라는 인식을 하게 되었다. 사실 아나콘다가 뭔지도 lifelong-education-dr-kim.tistory.com 1. 파이썬 프로그래밍을 위해 vscode를 사용하는 이유 대부분의 아나콘다를 .. 2022. 4. 24. 아나콘다 없이 파이썬(Python 3.0 version) 설치 하기 파이썬을 초기에 공부할 때 wikidocs의 강좌를 보곤 했다. 그 강좌에서 파이썬 설치와 세팅을 따라 하며 배웠었고 당연스레 '파이썬 = 아나콘다'라는 인식을 하게 되었다. 사실 아나콘다가 뭔지도 파이썬과의 관계가 어떤지도 고민하지 않았다. 이제부터 아나콘다를 벗어난 이유와 방법에 대해 설명하려 한다. 1. 순수 파이썬을 설치하려는 이유 파이썬을 업무에서도 사용하다 보니 내가 코딩한 소스를 배포해야 하는 일도 발생했고 아나콘다를 사용하던 시절이라 컴파일한 하나의 파일 용량이 200MB를 넘는 것이 당연한 것인 줄 알았다. 고객사에 파일을 제출할 때도 문제(메일 전송 제약 용량 초과)가 많았고 솔직히 부끄러운 상황일 수밖에 없다. 무슨 오피스 프로그램 개발도 아닌 단순한 데이터 분석 및 가시화 프로그램인.. 2022. 4. 9. python, pandas series type에서 이상치(outlier) 제거 하기 데이터 관련하여 포스팅하면서 가장 어려운 부분이 대상 데이터를 만드는 것이다. 실제 데이터는 회사 내에서 추출이 안되니 내가 경험했던 것과 유사한 데이터를 임의로 만들야 하기 때문이다. 그래도 데이터를 생성하는 것도 하나의 재미를 주기 때문에 그리 나쁘지만은 않다. 이상치 제거를 하기 위해 이상치가 포함된 데이터를 우선 만들어 보기로 한다. 1. 정규분포를 갖는 일반 데이터 생성 자연계의 데이터들은 일반적으로 정규분포를 갖는다라는 이론이 있다. 실제 데이터 처리 및 분석 시 정규분포의 평균과 표준편차를 많이 이용한다. 데이터를 생성하기 위해 정규분포를 이용했다. python에서 사용할 라이브러리는 다음과 같이 import 시킨다. import numpy as npimport pandas as pdimp.. 2022. 3. 1. Python pandas로 csv, xlsx 불러오기 본 포스팅에서는데이터를 불러오기 위해 csv나 xlsx파일을 호출할 때 사용할 수 있는 reference file 관리에 대해 설명하려 한다. 물론 이는 config 파일과도 유사하지만 초기 데이터 분석을 위한 약간의 팁 정도로 생각하면 될 듯하다. 우선 현장에서 얻은 데이터가 필요하여, 그와 유사한 형태의 데이터를 만들고, 그 데이터를 이용하여 오늘의 포스팅 주제에 대해 얘기하려 한다. 1. data.csv 만들기 우선 python 코드를 위해 아래의 라이브러리를 호출한다. 대부분은 다 아는 라이브러리겠지만, string과 random은 생소할 수 있으니 설명을 한번 하겠다. string은 문자열을 생성시키는 것으로 string.digits는 숫자 문자열, string.ascii_lowercase와 s.. 2022. 2. 28. 이전 1 ··· 9 10 11 12 13 다음 728x90