Seminar 4 Python

Seminar
8/10 (1 vot)
Domeniu: Calculatoare
Conține 10 fișiere: docx, xml, iml, py, csv
Pagini : 10 în total
Cuvinte : 1753
Mărime: 462.43KB (arhivat)
Cost: Gratis

Extras din document

Exemplu instalare pachet scikit-learn

Din https://pypi.org/project/scikit-learn/ copiem pip install scikit-learn

În Command Prompt:

C:UsersSimona OpreaAppDataLocalProgramsPythonPython36-32Scripts>pip install scikit-learn

Alte pachete Python: scipy, six, cycler, pyparsing, kiwisolver, python-dateutil, matplotlib, pytz, pandas, seaborn, numpy, sklearn, statsmodels etc.

Upgrade PIP

https://datatofish.com/upgrade-pip/

Exemplu 1. Gruparea unui set de valori în 3 clustere

import matplotlib.pyplot as plt

import numpy as np

from sklearn.cluster import KMeans

X = np.array([[5,3],

[10,15],

[15,12],

[24,10],

[30,45],

[85,70],

[71,80],

[60,78],

[55,52],

[80,91]])

kmeans = KMeans(n_clusters=3)

kmeans.fit(X)

print(kmeans.cluster_centers_)

print(kmeans.labels_)

f1 = plt.figure()

plt.scatter(X[:,0],X[:,1], label='True Position')

f2 = plt.figure()

plt.scatter(X[:,0], X[:,1], c=kmeans.labels_, cmap='rainbow')

f3 = plt.figure()

plt.scatter(kmeans.cluster_centers_[:,0] ,kmeans.cluster_centers_[:,1], color='black')

plt.show()

Clusterizare k-means în Python cu pachetul scikit-learn

Scufundarea Titanicului în 1912 a dus la 1502 victime din cei 2224 pasageri și membri ai echipajului.

Se vor utiliza două seturi de date train.csv și test.csv, ce conțin informații legate de pasageri. Diferența majoră dintre cele două seturi la nivel de coloane constă în coloana Suvived prezentă doar în setul de antrenare. Se poate considera că supraviețuirea a fost influențată de anumite atribute, cum ar fi vârsta, sexul, clasa biletului de călătorie etc. Pornind de la aceste caracteristici, se vor grupa (clusteriza) pasagerii din setul de date de test în supraviețuitori și nesupraviețuitori, comparându-se rezultatele cu setul de date pentru antrenare.

Exemplu 2. Pas 1. Import biblioteci

import pandas as pd

import numpy as np

from sklearn.cluster import KMeans

from sklearn.preprocessing import LabelEncoder

from sklearn.preprocessing import MinMaxScaler

import seaborn as sns

import matplotlib.pyplot as plt

Exemplu 2. Pas 2. Citirea fișierelor și afișarea primelor 5 înregistrări

pd.options.display.max_columns = 12

test = pd.read_csv('test.csv')

train = pd.read_csv('train.csv')

print('*****test*****')

print(test.head())

print('*****train*****')

print(train.head())

Exemplu 2. Pas 3. Calcul statistici de bază

print('*****test_stats*****')

print(test.describe())

print('*****train_stats*****')

print(train.describe())

Anumiți algoritmi machine learning, inclusiv k-means, nu permit valori lipsă. Astfel, vor fi identificate valorile lipsă.

Exemplu 2. Pas 4. Vizualizare denumire coloane din setul train și indentificare valori lipsă

print(train.columns.values)

print('*****train_ valori_lipsă *****')

print(train.isna())

print('*****test_valori_lipsă*****')

print(test.isna())

Bibliografie

1 https://stackabuse.com/k-means-clustering-with-scikit-learn/

2 https://www.datacamp.com/community/tutorials/k-means-clustering-python

3 Wes McKinney, 2nd Edition of Python for Data Analysis DATA WRANGLING WITH PANDAS, NUMPY, AND IPYTHON, O’Reilley

4 https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc

5 https://www.statsmodels.org/dev/generated/statsmodels.regression.linear_model.RegressionResults.html

Preview document

Seminar 4 Python - Pagina 1
Seminar 4 Python - Pagina 2
Seminar 4 Python - Pagina 3
Seminar 4 Python - Pagina 4
Seminar 4 Python - Pagina 5
Seminar 4 Python - Pagina 6
Seminar 4 Python - Pagina 7
Seminar 4 Python - Pagina 8
Seminar 4 Python - Pagina 9
Seminar 4 Python - Pagina 10

Conținut arhivă zip

  • .idea
    • inspectionProfiles
      • profiles_settings.xml
    • misc.xml
    • modules.xml
    • Seminar Python 4-20200324.iml
    • workspace.xml
  • .idea
  • Seminar 4 Python.docx
  • Seminar4.py
  • test.csv
  • test1.csv
  • train.csv

Alții au mai descărcat și

Baze de Date

STRUCTURA CURSULUI : I. Fundamentele bazelor de date 3 cursuri II. Prezentarea SGBD – uluiVisual Foxpro. III. Prezentarea unui SGBD –ului...

Limbaje de Asamblare

Introducere. Necesitatea programării în limbaje de asamblare Modalităţile de programare s-au schimbat imens de la inventarea calculatorului, în...

Java

1.Ce este Java? - un limbaj de programare orientat-obiect cu utilizare larga - un mediu de execuţie pentru aplicaţiile Java - o platformă...

Inteligența artificială

Definirea inteligenței artificiale și a unor concepte de bază din inteligența artificială. Competențe: Cunoașterea noțiunilor introductive ce...

Retelistica

1960 - Paul Baran, Donald Davies, Joseph Licklider au publicat independent primele articole ce descriau ideea construirii reţelelor de calculatoare...

Laboratoare programarea orientata pe obiecte

1. Obiective - Formarea unei imagini generale, preliminare, despre programarea orientată pe obiecte (POO) și deprinderea cu noile facilitați...

Compilatoare

Evolutia vietii este insotita de o permanenta acumulare de experienta statistica, dobandita prin incercari directe ale unor subiecti activi....

Baze de Date

CAPITOLUL I. PROIECTARE (DESIGN) DE DATE CURS 1. Preliminarii Bazele de date reprezintă un instrument indispensabil pentru sistemele...

Ai nevoie de altceva?