728x90 sklearn2 데이터 셋을 얻을 수 있는 파이썬 라이브러리들 파이썬 프로그래밍은 데이터 분석이나 머신러닝, 또는 딥러닝을 쉽게 다룰 수 있는 언어입니다. 복잡한 로직을 만들기 위해 프로그래밍 언어를 공부하거나 연습해야 하는데, 이때의 문제가 분석 또는 학습할 수 있는 데이터셋이 없다는 겁니다. 몇몇 라이브러리들이 이러한 문제를 해결하고자 데이터 셋을 제공해 줍니다. 오늘은 어떤 라이브러리가 데이터 셋을 제공하는지와 각 데이터 셋을 이용하는 방법에 대해 정리해 보고자 합니다. 1. scikit-learn or sklearn scikit-learn 라이브러리(sklearn)는 머신러닝 작업을 위한 다양한 내장 데이터셋을 제공합니다. 예를 들면 분류, 회귀, 클러스터링, 데이터 변환 등의 작업을 위한 데이터셋을 포함하고 있습니다. 위에서 언급한 iris, digits,.. 2023. 5. 27. 파이썬 데이터 셋 이용하여 분석 및 코딩 연습 (feat. iris dataset) 파이썬을 사용하여 데이터 분석이나 머신러닝을 공부하기 위해서는 데이터 셋이 필수적입니다. 파이썬의 몇몇 라이브러리들 중에는 이러한 데이터 셋을 제공해 주고 있습니다. 오늘은 이 중에서 가장 많이 사용되는 iris dataset(붓꽃 잎의 길이와 폭 데이터)에 대해 정리해 보려고 합니다. 1. Iris data set이란? Seaborn은 데이터 시각화를 위한 Python 라이브러리로, 기본적으로 많이 사용되는 데이터셋 중 하나인 iris 데이터셋을 제공합니다. iris 데이터셋은 통계학자 Ronald Fisher가 1936년에 도입한 붓꽃(iris)의 세 가지 종류에 대한 측정값을 포함하고 있습니다. iris 데이터셋에는 총 150개의 샘플이 있으며, 3가지 종류의 붓꽃(iris setosa, iris .. 2023. 5. 27. 이전 1 다음 728x90