본문 바로가기

데이터프레임8

데이터 프레임 가공을 위한 함수 적용 메서드 apply() 사용법 pandas.apply()는 Pandas 라이브러리에서 제공하는 함수로, 데이터프레임의 열 또는 행에 함수를 적용하기 위해 사용됩니다. 이 함수는 데이터 프레임의 가공을 위해 마련된 함수를 데이터프레임의 각 요소에 적용하고 결과를 반영할 때 사용합니다. apply() 함수의 기본 사용법을 확인한 후 각 사용 상황에 따른 사용법에 대해 정리해 보겠습니다. 1. dataframe.apply() 함수의 기본 사용법 dataframe.apply()의 기본 사용법은 다음과 같습니다 DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwds) 각 인자들과 그에 대한 설명은 아래와 같습니다. func: 적용할 함수 또는 함수 이름입니다. ax.. 2023. 5. 30.

데이터 프레임의 정보를 확인하는 pandas의 메서드들 파이썬의 라이브러리 중 pandas는 데이터 분석과 조작을 위한 강력한 라이브러리로, 다양한 메서드를 제공합니다. 오늘은 이러한 메서드들을 이용하여 데이터 프레임의 각종 정보를 확인하는 데 유용한 내용들을 정리해보려고 합니다. 오늘 확인할 메서드들은 다음과 같습니다. info / head / tail / describe / value_counts / unique / nunique / dtypes 1. pandas.info() 데이터프레임의 전반적인 정보를 제공합니다. 열의 개수, 열의 이름, 데이터 타입, 누락된 값의 개수 등을 확인할 수 있습니다. 이 메서드는 데이터프레임의 구조를 파악하는 데에 유용합니다. import pandas as pd # 데이터프레임 생성 data = {'Name': ['Joh.. 2023. 5. 30.

파이썬 데이터 병합 메서드 merge의 파라미터별 사용법 판다스의 데이터 프레임이 여러 개 있다는 것은 데이터 셋이 여러 개 존재한다는 것을 의미합니다. 데이터 분석을 잘하기 위해서는 여러 개의 데이터 셋을 하나의 데이터 셋으로 병합하는 것이 좋습니다. 이를 위해 판다스에서는 몇몇 메서드들이 존재합니다. merge, concat, join들이 그러한 역할을 해줍니다. 일반적으로 merge와 concat을 주로 사용하는데 그 용도가 조금 다릅니다. merge의 경우 두 개의 다른 형태의 데이터 셋을 병합할 때 사용하고 concat은 같은 포맷의 여러 데이터 셋을 병합할 때 사용합니다. 오늘은 우선 merge에 대한 설명을 정리해 보려고 합니다. 1. merge()의 기본 사용 데이터 분석에서는 종종 여러 개의 데이터프레임이 존재하며, 이를 병합하여 하나의 큰 데.. 2023. 5. 6.

파이썬 데이터 프레임의 정렬을 위한 sort_values 메서드 사용법 데이터 분석을 위해 파이썬의 판다스 데이터 프레임은 상당히 좋은 라이브러리입니다. 데이터 분석 도중 통계 메서드를 이용해서 데이터의 특성을 살펴보기도 하는데, 데이터를 크고 작은 순으로 정렬할 수 있다면 데이터 특성을 가시화하는데 더 큰 도움이 될 겁니다. 오늘은 데이터 프레임의 메서드들 중 데이터 정렬을 도와주는 sort_values()의 사용에 대해 알아보겠습니다. 1. sort_values() 특징 sort_values()는 데이터 프레임을 특정 열의 기준으로 정렬하는 메서드입니다. 이 메서드의 기본 사용 모습은 아래 코드와 같습니다. 인자들에 값이 입력되어 있는 것은 기본값으로 세팅된 것이며 특정 인자값을 넣지 않으면 해당 값으로 메서드를 수행합니다. DataFrame.sort_values( by.. 2023. 4. 29.

파이썬 판다스의 데이터 프레임 통계 값 관련 메서드 정리 파이썬에서는 수많은 라이브러리를 사용하는데, 각 라이브러리마다 갖고 있는 메서드들이 있습니다. 데이터 분석을 위해 파이썬을 이용하시는 분들이라면 이러한 메서드들의 종류와 사용 목적을 정확히 알아야 합니다. 오늘은 판다스 라이브러리 중 데이터 프레임의 메서드들 중에서 통계 관련된 것들을 정리해 보려고 합니다. 1. describe() 오늘 메서드를 설명하기 위한 기본 데이터는 아래와 같은 코드로 생성합니다. Pandas을 pd라는 이름으로 임포트를 하고, 딕션너리 형태의 데이터를 만들어 준 후 DataFrame이라는 메서드를 통해 df 객체를 생성해 줍니다. import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Ella'], '.. 2023. 4. 27.

파이썬 라이브러리 이용 시 메서드 사용법 및 판다스 일반 메서드들 파이썬은 오픈 소스로 구성되어 있으며 이에 따라 수많은 라이브러리가 제공되고 있습니다. 이러한 라이브러리를 'Import'해 사용할 때 우리는 각 라이브러리를 객체화해서 메서드를 사용합니다. 물론, 객체지향의 의미를 모르면서 말입니다. 오늘은 메서드의 사용 형태에 대해서 잠시 알아보고, 리스트와 판다스에서 일반적으로 사용되는 메서드에 대해 정리해 보려고 합니다. 1. 메서드란? 파이썬에서 "메서드"는 객체(Object)의 행위(behavior)를 나타내는 함수(function)를 의미합니다. 객체(Object)는 클래스(Class)의 인스턴스(Instance)로, 클래스는 객체의 특징을 정의하는 템플릿(template)입니다. 클래스 내에 정의된 함수들이 메서드(Method)로서, 해당 클래스의 객체들이.. 2023. 4. 27.

다차원의 데이터를 핸들링 하기 위한 파이썬의 리스트 활용 오늘은 많은 데이터를 한 번에 처리하는 좋은 방법을 소개해 보려고 합니다. 파이썬의 리스트는 어떠한 형태든 모두 담을 수 있는 특징이 있는데 이를 이용하여 데이터 구조를 1차원에서 다차원으로 관리하고 for문을 이용하여 핸들링할 수 있는 방법입니다. 1. 다차원 데이터 구조 설명에 앞서 다차원의 의미부터 확인해 보겠습니다. 1차원은 x축 한 개(직선) 위에 값들을 생각하면 됩니다. 2차원은 평면이겠죠. 1차원의 데이터 타입으로는 pandas의 Series가 있고, 2차원으로는 Dataframe이 있습니다. 그럼 3차원의 경우에는 어떤 타입의 변수를 써야 하나 고민하겠지만 3차원 단일 특성을 갖는 데이터 구조가 없기 때문에 list를 활용하게 됩니다. 파이썬의 데이터 구조 중 Series를 합쳐 놓은 게 .. 2023. 2. 11.

파이썬 데이터프레임 조건 추출 (Boolean indexing) 파이썬의 라이브러리 중 판다스의 데이터프레임은 데이터 분석을 위해 꼭 기억해야 할 부분이 있습니다. 특히 전처리나 필요한 부분의 데이터만 별도로 추출하는 기능은 꼭 알아두어야 합니다. 데이터 추출의 기본 기능은 아래 포스팅에 자세히 설명되어 있으니 참고하시면 됩니다. 본 포스팅에서는 특정 조건에 대한 데이터 추출 방법에 대해 설명하겠습니다. https://lifelong-education-dr-kim.tistory.com/entry/Pandas-데이터프레임-기본-인덱싱-이론과-방법 Pandas 데이터프레임 기본 인덱싱 이론과 방법 데이터 분석을 위해 파이썬을 사용하는 데 있어 판다스(pandas)는 핵심이라 할 수 있습니다.. 데이터를 불러와 전처리를 수행하고 데이터 관계 확인 및 데이터 가시화까지 모두.. 2023. 1. 5.

이전 1 다음

티스토리툴바