Unterschied zwischen maschinellem Lernen und Varianz

Unterschied zwischen maschinellem Lernen und Varianz

Wir leben in einer Welt, in der Algorithmen überall sind und viele von uns sie benutzen, vielleicht sogar nicht, dass ein Algorithmus beteiligt ist. Um ein Problem auf einem Computer zu lösen, brauchen wir einen Algorithmus. Das maschinelle Lernen hängt von einer Reihe von Algorithmen zum Umwandeln von Datensätzen in Modelle ab. Voreingenommenheit und Varianz sind die beiden grundlegenden Konzepte für maschinelles Lernen. Es ist wichtig, die beiden zu verstehen, wenn es um Genauigkeit in einem Algorithmus für maschinelles Lernen geht.

Was ist Voreingenommenheit?

Der Vorhersagefehler für jeden Algorithmus für maschinelles Lernen kann in drei Teile unterteilt werden - Vorspannungsfehler, Varianzfehler und nicht reduzierbarer Fehler. Bias ist ein Phänomen, das im Modell des maschinellen Lernens aufgrund falscher Annahmen im maschinellen Lernprozess auftritt. Die Verzerrung ist wie ein systematischer Fehler, der auftritt, wenn ein Algorithmus aufgrund einiger falscher Annahmen im maschinellen Lernprozess systematisch verzerrt ist. Es handelt sich um Annahmen, die ein Modell getroffen haben.

Hohe Verzerrung bedeutet, dass der Fehler im Training sowie die Testdaten größer ist. Es wird immer empfohlen, ein Algorithmus niedrig voreingenommen zu sein, um das Problem der Unteranpassung zu vermeiden. Nehmen wir an, Sie haben ein Modell aufgenommen, das nicht einmal die wesentlichen Muster aus dem Datensatz herausgeben kann - dies wird als Unteranpassung bezeichnet. Einfach ausgedrückt, die Verzerrung tritt in einer Situation auf, in der Sie einen Algorithmus verwendet haben und er nicht richtig passt.

Was ist Varianz??

Varianz ist die Änderung der Vorhersagegenauigkeit des maschinellen Lernens zwischen Trainingsdaten und Testdaten. Wenn die Variation im Datensatz eine Änderung der Leistung des Modells einbringt, wird dies als Varianzfehler bezeichnet. Dies ist der Betrag, den die Schätzung der Zielfunktion ändert, wenn verschiedene Trainingsdaten verwendet wurden. Die Zielfunktion wird aus den Trainingsdaten durch einen Algorithmus für maschinelles Lernen angenommen, sodass eine gewisse Varianz im Algorithmus erwartet wird.

Die Varianz hängt von einem einzelnen Trainingssatz ab und bestimmt die Inkonsistenz verschiedener Vorhersagen anhand verschiedener Trainingssätze. Niedrige Varianz deutet auf kleine Änderungen an der Schätzung der Zielfunktion mit Änderungen am Trainingsdatensatz hin, während eine hohe Varianz auf große Änderungen an der Schätzung der Zielfunktion mit Änderungen am Trainingsdatensatz hinweist. Algorithmen für maschinelles Lernen mit hoher Varianz werden stark von den Besonderheiten der Trainingsdaten beeinflusst.

Unterschied zwischen Voreingenommenheit und Varianz

Bedeutung

- Bias ist ein Phänomen, das im Modell für maschinelles Lernen auftritt, in dem Sie einen Algorithmus verwendet haben, und es passt nicht richtig. Dies bedeutet, dass die hier verwendete Funktion für das Szenario von geringer Relevanz ist und nicht in der Lage ist, die richtigen Muster zu extrahieren. Varianz hingegen gibt die Variationsmenge an, die die Schätzung der Zielfunktion ändert, wenn verschiedene Trainingsdaten verwendet wurden. Es heißt, wie viel eine zufällige Variable von ihrem erwarteten Wert abweicht.

Szenario

- Verzerrung ist die Differenz zwischen vorhergesagten und tatsächlichen Werten. Niedrige Verzerrung deutet auf weniger Annahmen über die Form der Zielfunktion hin, während eine hohe Verzerrung mehr Annahmen über die Form der Zielfunktion vorschlägt. Die Instanz, in der das Modell im Trainingssatz keine Muster finden kann. Varianz ist, wenn das Modell die Schwankungen in den Daten berücksichtigt. Das Modell erbringt gut zum Testen von Daten und erhält eine hohe Genauigkeit, kann jedoch nicht auf neuen und unsichtbaren Daten ausgeführt werden.

Voreingenommenheit des maschinellen Lernens vs. Varianz: Vergleichstabelle

VoreingenommenheitVarianz
Bias ist ein Phänomen, das im maschinellen Lernmodell auftritt, bei dem ein Algorithmus verwendet wird und nicht richtig passt.Die Varianz gibt die Variationsmenge an, die die Schätzung der Zielfunktion ändert, wenn verschiedene Trainingsdaten verwendet wurden.
Die Verzerrung bezieht sich auf die Differenz zwischen vorhergesagten und tatsächlichen Werten.Varianz sagt, wie viel eine zufällige Variable von ihrem erwarteten Wert abweicht.
Das Modell kann Muster im Trainingsdatensatz nicht finden und scheitert sowohl für gesehene als auch für unsichtbare Daten.Das Modell findet die meisten Muster im Datensatz und lernt sogar aus den unnötigen Daten oder im Rauschen.

Zusammenfassung

Welches Modell Sie auch immer Sie haben, es sollte eine perfekte Balance zwischen Voreingenommenheit und Varianz sein. Das Ziel eines beaufsichtigten Algorithmus für maschinelles Lernen ist es, eine geringe Verzerrung und eine geringe Varianz zu erreichen. Dieses Szenario ist jedoch nicht möglich, da beide umgekehrt miteinander verbunden sind und es praktisch unmöglich ist, ein maschinelles Lernmodell mit einer geringen Verzerrung und einer geringen Varianz zu haben. Im Gegensatz zur Verzerrung ist die Varianz, wenn das Modell die Schwankungen der Daten und sogar das Rauschen berücksichtigt. Wenn Sie versuchen, den Algorithmus so zu ändern, dass ein bestimmter Datensatz besser passt.

Was ist Voreingenommenheit und Abweichung mit dem Beispiel?

Die Verzerrung im maschinellen Lernen ist ein Phänomen, das auftritt, wenn ein Algorithmus verwendet wird und nicht richtig passt. Einige Beispiele für Verzerrungen sind Bestätigungsverzerrungen, Stabilitätsverzerrungen und Verfügbarkeitsverzerrung. ML -Algorithmen mit geringer Varianz umfassen lineare Regression, logistische Regression und lineare Diskriminanzanalyse.

Was sind die 3 Arten von maschinellem Lernverzerrung?

Drei Arten von Verzerrungen sind Informationsverzerrung, Auswahlverzerrung und Verwirrung.

Wie kann maschinelles Lernen die Verzerrung und Varianz reduzieren?

Es ist unmöglich, ein maschinelles Lernmodell mit einer geringen Verzerrung und einer geringen Varianz zu haben. Um die Verzerrung des maschinellen Lernens zu minimieren, können Sie das richtige Lernmodell auswählen oder den richtigen Trainingsdatensatz verwenden.

Was sind die vier Arten von Verzerrungen im maschinellen Lernen??

Vier Arten von Verzerrungen umfassen Selektionsverzerrungen, Ausreißer, Messverzerrung, Rückrufverzerrung und mehr.