Różnica między regresją liniową a regresją logistyczną - Różnica Pomiędzy

Różnica między regresją liniową a regresją logistyczną

The główna różnica między regresją liniową a regresją logistyczną jest to, że regresja liniowa jest używana do przewidywania wartości ciągłej, podczas gdy regresja logistyczna jest używana do przewidywania wartości dyskretnej.

Systemy uczenia maszynowego mogą przewidywać przyszłe wyniki w oparciu o szkolenie przeszłych danych wejściowych. Istnieją dwa główne typy uczenia maszynowego, zwane uczeniem nadzorowanym i uczeniem bez nadzoru. Regresja i klasyfikacja podlegają nadzorowanemu uczeniu się, podczas gdy klastrowanie podlega nauczaniu bez nadzoru. Nadzorowane algorytmy uczenia się wykorzystują oznakowane dane do szkolenia zestawu danych. Regresja liniowa i regresja logistyczna to dwa typy nadzorowanych algorytmów uczenia się. Regresja liniowa jest używana, gdy zmienna zależna jest ciągła, a model jest liniowy. Regresja logistyczna jest używana, gdy zmienna zależna jest dyskretna, a model jest nieliniowy.

Kluczowe obszary objęte

1. Czym jest regresja liniowa
- Definicja, funkcjonalność
2. Czym jest regresja logistyczna
- Definicja, funkcjonalność
3. Różnica między regresją liniową a regresją logistyczną
- Porównanie kluczowych różnic

Kluczowe terminy

Regresja liniowa, regresja logistyczna, uczenie maszynowe


Czym jest regresja liniowa

Regresja liniowa znajduje związek między zmiennymi niezależnymi i zależnymi. Oba są przylegające. Zmienna niezależna jest zmienną, która nie jest zmieniana przez inne zmienne. Jest oznaczony przez x. Może również istnieć wiele zmiennych niezależnych, takich jak x1, x2, x3 itd. Zmienna zależna zmienia się zgodnie ze zmienną niezależną i jest oznaczana przez y.

Gdy istnieje jedna zmienna niezależna, równanie regresji jest następujące.

y = b0 + b1x

Załóżmy na przykład, że x reprezentuje opady, a y oznacza plon.


Rysunek 1: Regresja liniowa

Zestaw danych będzie wyglądał jak powyżej. Następnie wybierana jest linia pokrywająca większość punktów danych. Ta linia przedstawia przewidywane wartości.


Rysunek 2: Odległość między rzeczywistymi punktami danych a przewidywanymi wartościami

Następnie znajduje się odległość od każdego punktu danych do linii, jak pokazano na powyższym wykresie. Jest to odległość między rzeczywistą wartością a przewidywaną wartością. Ta odległość jest również znana jako błąd lub reszta. Linia najlepszego dopasowania powinna mieć najmniejszą sumę kwadratów błędów. Gdy podana jest nowa wartość opadów (x), możliwe jest znalezienie odpowiedniej wydajności plonu (y) za pomocą tej linii.

W świecie rzeczywistym może istnieć wiele zmiennych niezależnych (x1, x2, x3…). Nazywa się to regresją liniową wielokrotną. Równanie wielokrotnej regresji liniowej jest następujące.

Czym jest regresja logistyczna

Regresji logistycznej można użyć do sklasyfikowania dwóch klas. Znany jest również jako klasyfikacja binarna. Sprawdzanie, czy wiadomość e-mail jest spamem lub nie przewiduje, czy klient kupi produkt, czy nie, przewidując, czy możliwe jest uzyskanie promocji, czy nie, to inne przykłady regresji logistycznej.


Rysunek 3: Regresja logistyczna

Załóżmy, że liczba godzin studiowanych przez studenta dziennie jest zmienną niezależną. W zależności od tego obliczane jest prawdopodobieństwo zdania egzaminu. Wartość 0,5 uważana za próg. Gdy podana jest nowa liczba godzin, możliwe jest znalezienie odpowiedniego prawdopodobieństwa zdania egzaminu za pomocą tego wykresu. Jeśli prawdopodobieństwo jest wyższe niż 0,5, jest uważane za 1 lub przechodzi. Jeśli prawdopodobieństwo jest mniejsze niż 0,5, uznaje się je za 0 lub nie.

Zastosowanie równania regresji liniowej do funkcji esowatej da równanie regresji logistycznej.

Funkcją sigmoidalną jest


Inną ważną kwestią, na którą należy zwrócić uwagę, jest to, że regresja logistyczna ma zastosowanie tylko do klasyfikacji 2 klas. Nie jest używany do klasyfikacji wieloklasowej.

Różnica między regresją liniową a regresją logistyczną

Definicja

Regresja liniowa jest podejściem liniowym, które modeluje zależność między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Natomiast regresja logistyczna jest modelem statystycznym, który przewiduje prawdopodobieństwo wyniku, który może mieć tylko dwie wartości.

Stosowanie

Podczas gdy regresja liniowa jest używana do rozwiązywania problemów regresji, regresja logistyczna jest używana do rozwiązywania problemów klasyfikacji (klasyfikacja binarna).

Metodologia

Regresja liniowa szacuje zmienną zależną, gdy występuje zmiana zmiennej niezależnej. Regresja logistyczna oblicza możliwość wystąpienia zdarzenia. Jest to jedna ważna różnica między regresją liniową a regresją logistyczną.

Wartość wyjściowa

Również w regresji liniowej wartość wyjściowa jest ciągła. W regresji logistycznej wartość wyjściowa jest dyskretna.

Model

Chociaż regresja liniowa wykorzystuje linię prostą, regresja logistyczna wykorzystuje krzywą S lub funkcję sigmoidalną. Jest to kolejna ważna różnica między regresją liniową a regresją logistyczną.

Przykłady

Przewidywanie PKB kraju, przewidywanie ceny produktu, przewidywanie ceny sprzedaży domu, przewidywanie wyniku to przykłady regresji liniowej. Przewidywanie, czy wiadomość e-mail jest spamem, czy nie, przewidywanie, czy transakcja kartą kredytową jest oszustwem, czy nie, przewidywanie, czy klient weźmie pożyczkę, czy nie, to przykłady regresji logistycznej.

Wniosek

Różnica między regresją liniową a regresją logistyczną polega na tym, że regresja liniowa jest używana do przewidywania wartości ciągłej, podczas gdy regresja logistyczna jest używana do przewidywania wartości dyskretnej. W skrócie, regresja liniowa jest używana do regresji, podczas gdy regresja logistyczna jest stosowana do klasyfikacji.

Odniesienie:

1. Analiza regresji liniowej | Regresja liniowa w Pythonie | Algorytmy uczenia maszynowego | Simplilearn, 26 marca 2018 r.,