Δείτε πώς λειτουργεί ο αλγόριθμος λογιστικής παλινδρόμησης

Δείτε πώς λειτουργεί ο αλγόριθμος λογιστικής παλινδρόμησης

April 16, 2023 0 By admin

Σε Μηχανική Μάθηση, Η Logistic Regression είναι ένα στατιστικό μοντέλο που χρησιμοποιείται για προβλήματα δυαδικής ταξινόμησης. Χρησιμοποιείται για την πρόβλεψη της πιθανότητας ενός αποτελέσματος με βάση τα χαρακτηριστικά εισόδου. Χρησιμοποιεί μια σιγμοειδή συνάρτηση για να χαρτογραφήσει τα χαρακτηριστικά εισόδου για την έξοδο της πιθανότητας. Έτσι, εάν είστε νέος στη Μηχανική Μάθηση και θέλετε να μάθετε πώς λειτουργεί ο αλγόριθμος Logistic Regression, αυτό το άρθρο είναι για εσάς. Σε αυτό το άρθρο, θα παρουσιάσω πώς λειτουργεί ο αλγόριθμος Logistic Regression με απλά λόγια και την υλοποίησή του χρησιμοποιώντας Python.

Δείτε πώς λειτουργεί ο αλγόριθμος λογιστικής παλινδρόμησης

Ας καταλάβουμε πώς λειτουργεί ο αλγόριθμος Logistic Regression παίρνοντας ένα παράδειγμα επιχειρηματικού προβλήματος σε πραγματικό χρόνο.

Φανταστείτε ότι είστε μια τράπεζα που θέλει να αποφασίσει εάν θα εγκρίνει ή όχι ένα δάνειο για έναν πελάτη. Θέλετε να χρησιμοποιήσετε τον πελάτη πιστωτικό σκορ ως παράγοντας στην απόφασή σας.

Για να προβλέψετε εάν θα εγκρίνετε ένα δάνειο, μπορείτε να χρησιμοποιήσετε την Logistic Regression. Θα ξεκινήσετε εξετάζοντας ιστορικά δεδομένα για να δείτε πώς σχετίζονται τα πιστωτικά σκορ με τις εγκρίσεις δανείων. Για παράδειγμα, μπορείτε να δείτε τα δεδομένα για το προηγούμενο έτος και να παρατηρήσετε ότι οι πελάτες με υψηλά πιστωτικά σκορ εγκρίθηκαν γενικά για δάνεια, ενώ οι πελάτες με χαμηλές πιστωτικές βαθμολογίες απορρίφθηκαν.

Έτσι, σε αυτή την περίπτωση, το μοντέλο λογιστικής παλινδρόμησης θα έπαιρνε το πιστωτικό σκορ του πελάτη ως χαρακτηριστικό εισόδου και θα παρήγαγε μια πιθανότητα για το εάν το δάνειο θα έπρεπε να εγκριθεί ή όχι.

Για παράδειγμα, ας υποθέσουμε ότι το μοντέλο προβλέπει πιθανότητα 90% να εγκριθεί το δάνειο με βάση το πιστωτικό σκορ του πελάτη. Στη συνέχεια, μπορείτε να χρησιμοποιήσετε αυτήν την πρόβλεψη για να λάβετε αποφάσεις για την τράπεζά σας.

Έτσι λειτουργεί ο αλγόριθμος λογιστικής παλινδρόμησης. Σας βοηθά να προβλέψετε εάν ένα συμβάν θα συμβεί ή όχι με βάση τα στοιχεία εισαγωγής που πιστεύετε ότι είναι σχετικά με το συμβάν.

Υλοποίηση Αλγόριθμου Logistic Regression με χρήση Python

Τώρα ας δούμε πώς να εφαρμόσουμε τον αλγόριθμο λογιστικής παλινδρόμησης χρησιμοποιώντας Python. Για να το εφαρμόσουμε χρησιμοποιώντας Python, μπορούμε να χρησιμοποιήσουμε τη βιβλιοθήκη scikit-learn στην Python, η οποία παρέχει τη λειτουργικότητα της υλοποίησης όλων των αλγορίθμων και εννοιών Machine Learning χρησιμοποιώντας Python.

Ας εισάγουμε πρώτα τις απαραίτητες βιβλιοθήκες Python και ας δημιουργήσουμε ένα δείγμα δεδομένων με βάση το παράδειγμα που συζητήσαμε παραπάνω:

import pandas as pd
import numpy as np

#sample dataset
credit_scores = np.random.randint(300, 850, size=1000)
loan_approved = np.random.binomial(1, p=1 / (1 + np.exp(-0.02 * (credit_scores - 700))), size=1000)

data = pd.DataFrame({
    'credit_score': credit_scores,
    'loan_approved': loan_approved
})

print(data.head())
   credit_score  loan_approved
0           495              0
1           816              1
2           741              1
3           625              0
4           651              0

Τώρα δείτε πώς να εκπαιδεύσετε ένα μοντέλο Μηχανικής Μάθησης χρησιμοποιώντας τον αλγόριθμο λογιστικής παλινδρόμησης:

from sklearn.linear_model import LogisticRegression

model = LogisticRegression()
model.fit(data[['credit_score']], data['loan_approved'])

Τώρα δείτε πώς μπορούμε να κάνουμε μια πρόβλεψη χρησιμοποιώντας τον αλγόριθμο Logistic Regression:

new_customer_credit_score = 750
new_customer_data = pd.DataFrame({'credit_score': [new_customer_credit_score]})
predicted_class = model.predict(new_customer_data[['credit_score']])[0]

# print the predicted class
if predicted_class == 0:
    print(f'A loan is not approved for a customer with a credit score of {new_customer_credit_score}.')
else:
    print(f'A loan is approved for a customer with a credit score of {new_customer_credit_score}.')
A loan is approved for a customer with a credit score of 750.

Έτσι λειτουργεί ο Αλγόριθμος Logistic Regression.

Πλεονεκτήματα & Μειονεκτήματα της Logistic Regression

Ακολουθούν ορισμένα πλεονεκτήματα και μειονεκτήματα του αλγόριθμου Logistic Regression που πρέπει να γνωρίζετε:

Πλεονεκτήματα:
  1. Λειτουργεί καλά για προβλήματα δυαδικής ταξινόμησης, όπου η μεταβλητή εξόδου έχει μόνο δύο πιθανές τιμές.
  2. Μπορεί να χειριστεί τόσο συνεχείς όσο και κατηγορικές μεταβλητές εισόδου.
Μειονεκτήματα:
  1. Η Logistic Regression υποθέτει ότι η σχέση μεταξύ της μεταβλητής εισόδου και της μεταβλητής εξόδου είναι γραμμική, κάτι που μπορεί να μην ισχύει σε όλες τις περιπτώσεις.
  2. Μπορεί να είναι ευαίσθητο σε ακραίες τιμές ή μεροληπτικά δεδομένα, γεγονός που επηρεάζει τις προβλέψεις.

Περίληψη

Ελπίζω να καταλάβατε πώς λειτουργεί ο αλγόριθμος Logistic Regression και πώς να τον εφαρμόσετε χρησιμοποιώντας Python. Η Logistic Regression χρησιμοποιείται για την πρόβλεψη της πιθανότητας ενός αποτελέσματος με βάση τα χαρακτηριστικά εισόδου. Χρησιμοποιεί μια σιγμοειδή συνάρτηση για να χαρτογραφήσει τα χαρακτηριστικά εισόδου για την έξοδο της πιθανότητας. Μη διστάσετε να κάνετε πολύτιμες ερωτήσεις στην παρακάτω ενότητα σχολίων.