Python | Создайте тестовые наборы данных с помощью Sklearn

Опубликовано: 25 Июля, 2021

Библиотека Python Sklearn предоставляет отличный генератор образцов данных, который поможет вам создать свой собственный набор данных. Это быстро и очень просто в использовании. Ниже приведены типы образцов, которые он предоставляет.
Для всех вышеперечисленных методов вам необходимо импортировать sklearn.datasets.samples_generator .

Python3




# importing libraries
from sklearn.datasets import make_blobs
# matplotlib for ploting
from matplotlib import pyplot as plt
from matplotlib import style

sklearn.datasets.make_blobs

Python3




# Creating Test DataSets using sklearn.datasets.make_blobs
from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
from matplotlib import style
style.use( "fivethirtyeight" )
X, y = make_blobs(n_samples = 100 , centers = 3 ,
cluster_std = 1 , n_features = 2 )
plt.scatter(X[:, 0 ], X[:, 1 ], s = 40 , color = 'g' )
plt.xlabel( "X" )
plt.ylabel( "Y" )
plt.show()
plt.clf()

Выход:

make_blobs с 3 центрами

sklearn.datasets.make_moon

Python3




# Creating Test DataSets using sklearn.datasets.make_moon
from sklearn.datasets import make_moon
from matplotlib import pyplot as plt
from matplotlib import style
X, y = make_moons(n_samples = 1000 , noise = 0.1 )
plt.scatter(X[:, 0 ], X[:, 1 ], s = 40 , color = 'g' )
plt.xlabel( "X" )
plt.ylabel( "Y" )
plt.show()
plt.clf()

Выход:

make_moons с 1000 точками данных

sklearn.datasets.make_circle

Python3




# Creating Test DataSets using sklearn.datasets.make_circles
from sklearn.datasets import make_circles
from matplotlib import pyplot as plt
from matplotlib import style
style.use( "fivethirtyeight" )
X, y = make_circles(n_samples = 100 , noise = 0.02 )
plt.scatter(X[:, 0 ], X[:, 1 ], s = 40 , color = 'g' )
plt.xlabel( "X" )
plt.ylabel( "Y" )
plt.show()
plt.clf()

Выход:

сделать _circle со 100 точками данных