Now reading:
Algorytm Netflixa: wszystko co musisz wiedzieć o systemie rekomendacji najpopularniejszego portalu streamingowego

Algorytm Netflixa: wszystko co musisz wiedzieć o systemie rekomendacji najpopularniejszego portalu streamingowego

Avatar Arkadiusz Krysik
11 maja 2021
clock icon 9 min
system rekomendacji netflixa

Obecnie prawie każdy użytkownik platform streamingowych oczekuje, że będzie one w stanie zrozumieć jego preferencje i gusta i podpowie mu film czy serial, który najprawdopodobniej mu się spodoba. Słowem - bardzo przyzwyczailiśmy się do algorytmu rekomendującego.

Dlatego największe platformy takie jak Disney+, Hulu, Amazon Prime czy Netflix inwestują w rozwój systemów rekomendacji opartych o sztuczną inteligencję.

Przyjrzyjmy się bliżej silnikowi rekomendacji treści, który przez wielu jest uważany za najlepszy na rynku. Mowa tutaj oczywiście o systemie rekomendacji Netflixa.

Odpowiemy na takie pytania, jak:

  • Jak działa system rekomendacji Netflixa?
  • Co to jest algorytm Netflixa?
  • Jak system rekomendacji Netflixa zbiera i wykorzystuje dane o użytkownikach?
  • Jak skuteczne są rekomendacje Netflixa?
  • W jaki sposób inne serwisy rozrywkowe wykorzystują silniki rekomendacji?
algorytm rekomendacji netflixa


Co to jest algorytm Netflixa?


Statystyki mówią same za siebie, Netflix jest absolutnym liderem pośród różnych serwisów streamingowych.

W samym 2020 roku Netflix zdobył ponad 37 milionów nowych subskrybentów, z których aż ok. 80% pochodziło spoza Stanów Zjednoczonych. Dla przykładu, konkurencyjna platforma Hulu w sumie miała jedynie 36 milionów użytkowników.

Dużą część tego sukcesu może być przypisana silnikowi rekomendacji, który stale podpowiada nowe i ciekawe treści utrzymując uwagę użytkowników.

Netflix oferuje obecnie tysiące filmów i programów. Zbyt duży wybór może jednak okazać się przytłaczający dla większości niezdecydowanych użytkowników.

Przy ponad 15000 różnych filmów i seriali w katalogu Netflixa, jest prawie niemożliwe, aby użytkownicy mogli samodzielnie znaleźć filmy, które przypadną im do gustu i ich zainteresują.

Właśnie w tym aspekcie z pomocą przychodzi silnik spersonalizowanych rekomendacji.

System ten oparty jest o algorytm wykorzystujący sztuczną inteligencję i machine learning w celu proponowania użytkownikom treści dopasowanych do ich gustu i zainteresowań.


Początki: Netflix Prize 2006


Historia systemu rekomendacji Netflixa ma już ponad 20 lat. W 2000 roku firma wprowadziła pierwsze, przełomowe spersonalizowane rekomendacje filmów. Z kolei w 2006 roku stworzyła Netflix Prize, konkurs polegający na stworzeniu systemu spersonalizowanych rekomendacji opierający się o sztuczną inteligencję, w którym główną nagrodą był 1 milion dolarów.

Mimo że finalnie nikomu nie udało się uzyskać zadowalających wyników i dostatecznie niskiego odchylenia standardowego zbioru rekomendowanych treści, to jednak wysiłek uczestników nie poszedł na marne.

Zainspirował on bowiem tysiące zespołów na całym świecie do dalszej pracy i rozwoju algorytmów sztucznej inteligencji, widząc potencjał jaki znajduje się w tej technologii dla branży rozrywkowej.

Wiele doświadczeń zebranych dzięki Netflix Prize przyczyniło się także do udoskonalenia jego silnika rekomendacji, co z kolei wpłynęło na to, że jest on teraz uznawany za jeden z najlepszych systemów tego rodzaju na rynku.

rekomendacje netflixa
Źródło: NETFLIX system design, Medium

Układ rekomendacji nie jest przypadkowy


Z punktu widzenia użytkownika, pierwszy kontakt z systemem rekomendacji ma miejsce na już na stronie głównej Netflixa, na której są wyświetlane grupy filmów ułożone w poziomych rzędach.

Każdy poziomy zawiera filmy i seriale z różnych kategorii:

  • Wybrane dla ciebie - lista filmów i seriali dobrana specjalnie do preferencji danego użytkownika na podstawie jego historii przeglądania,
  • Trendujące - zbiór contentu cieszącego się obecnie największą popularnością w całym serwisie,
  • Podobne do - lista treści podobnych do serialu lub filmu, który wyraźnie przypadł w ostatnim okresie do gustu. System potwierdza to np. na podstawie czasu i częstotliwości oglądania odcinków danego serialu,
  • Nowości - nowo dodane, ciekawe treści, które serwis chce promować większej liczbie potencjalnie zainteresowanych użytkowników.
rekomendacje netflixa
Źródło: Netflix Binging on the Algorithm

Ułożenie miniaturek w rzędach także nie jest przypadkowe.

Badania wykazały, że użytkownicy najbardziej skupiają się na lewej, górnej części ekranu stąd materiały, które cechują się największym prawdopodobieństwem wybrania przez użytkowników, umieszczane są właśnie po lewej stronie rzędów rekomendacji.

Wszystkie oferowane modele zapewniają użytkownikom Netflixa szeroki wybór filmów i seriali dopasowanych do ich zainteresowań, spośród których na pewno będą mogli wybrać coś dla siebie.


Jak działa system rekomendacji Netflixa?


System rekomendacji Netflixa to owoc pracy setek inżynierów na przestrzeni ostatnich 20 lat oraz świetny przykład możliwości sztucznej inteligencji i machine learning w praktyce.

Silnik rekomendacji Netflixa składa się z kilku ważnych części, a każda z nich skupia się na innym rodzaju danych i aspekcie zachowań użytkowników.

rekomendacje netflixa

Netflix korzysta z różnych modeli filtrowania dostępnych danych, jednak na podstawie opublikowanych dokumentów oraz uzyskiwanych wyników, a także innych podobnych silników rekomendacji możemy założyć, że wykorzystuje on 2 najważniejsze modele:

  • Content based filtering (filtrowanie na podstawie treści) - porównuje on ze sobą dane dotyczące poszczególnych materiałów, np. opisy, komentarze lub recenzje,
  • Collaborative Filtering (Filtrowanie grupowe) - model starający znaleźć się zależności pomiędzy zachowaniami i preferencjami poszczególnych użytkowników.

Następnie Netflix sortuje przefiltrowane dane przy użyciu różnego rodzaju rankingów. Każdy z nich koresponduje z jedną z kategorii (rzędów) rekomendacji wyświetlanych na stronie głównej platformy.

Możemy więc wyróżnić następujące rodzaje rankingów rekomendacji treści stosowanych przez Netflixa:

Spersonalizowany ranking wideo (PVR)

Jest to ogólny algorytm, który segreguje dostępne w katalogu treści ne względu na daną cechę (np. Filmy science-fiction, komedie romantyczne itd.), łącząc je z osobistymi preferencjami i gustami danego użytkownika.


Ranking Top-N

Podobny do rankingu PVR, jednak bierze pod uwagę jedynie czołówki rankingów poszczególnych użytkowników, które determinują najpopularniejsze materiały w danej kategorii.


Ranking ciekawych materiałów do dalszego oglądania

Ten algorytm sprawdza, które z materiałów dana osoba włączyła, ale nie dokończyła oglądać. Następnie system oblicza prawdopodobieństwo tego, że poszczególny użytkownik będzie chciał do nich wrócić. Robi to, analizując szereg dostępnych danych na jego temat, a także czas, który upłynął od oglądania, punkt porzucenia, urządzenie, na którym obserwowano, itd.


Ranking filmów popularnych

Algorytm analizuje, jakiego rodzaju treści cieszą się w bieżącym czasie popularnością. Bierze pod uwagę różnego rodzaju trendy czasowe oraz inne informacje mogące świadczyć o tym, że treści danego rodzaju będą chętniej wybierane w tym czasie. Do najważniejszych predyktorów w rankingu filmów popularnych możemy zaliczyć:

  • Ważne wydarzenia ze świata (przykładowo pandemia koronawirusa spowodowała, że film Contagion cieszył się rekordową popularnością),
  • Święta i inne okazje (przykładowo w lutym, w czasie walentynek wyjątkową popularnością cieszą się komedie romantyczne)
    • rekomendacje netflixa

      Big Data: jakie dane wykorzystuje Netflix?


      Netflix używa wielu danych z różnych źródeł w celu określania prawdopodobieństwa obejrzenia danego tytułu.

      Dane te dotyczą zarówno materiałów w katalog, jak i informacji dotyczących poszczególnych użytkowników i ich zachowań oraz preferencji.

      Do najważniejszych rodzajów zbieranych danych możemy zaliczyć:

      • interakcje użytkowników z serwisem (historia przeglądania oraz wystawione oceny);
      • dane korelacyjne dotyczące związków i podobieństw między gustami i preferencjami poszczególnych grup użytkowników;
      • informacje o materiałach dostępnych w bibliotece Netflixa, czyli np. gatunek, długość, język, aktorzy itd.

      Co więcej, Netflix wykorzystuje także informacje dodatkowe, by lepiej spersonalizować doświadczenia swoich użytkowników.

      Do ich najważniejszych rodzajów możemy zaliczyć m.in.:

      • Porę dnia, w jakiej poszczególni użytkownicy korzystają z serwisu,
      • Rodzaj urządzenia, na którym użytkownicy oglądają materiały,
      • Średnią długość oglądania.

      Mówiąc o rodzajach danych wykorzystywanych przez system Netflixa do generowania rekomendacji treści, warto wspomnieć także o zupełnie nowych rozwiązaniach.


      Najnowszy algorytm Netlixa: rekomendacje na podstawie okładki filmów


      Platforma niedawno wprowadziła zupełnie nowy, innowacyjny algorytm rekomendacji opierający się na analizowaniu grafik.

      Badania pokazują, że jeśli użytkownik na platformie rozrywkowej w ciągu 90 sekund nie znajdzie czegoś ciekawego, prawdopodobnie straci on zainteresowanie i poszuka innego zajęcia.

      Mając tak krótki czas na wzbudzenie zainteresowania, obrazy stają się najskuteczniejszym sposobem na jak najszybsze zwrócenie uwagi użytkowników na interesujące ich tytuły.

      Nowy algorytm Netflixa, dołączony w ostatnim czasie do jego silnika rekomendacji, dostarcza swoim subskrybentom unikalne, dostosowane do ich gustów miniaturki filmów i seriali.

      Netflix tworzy kilka wersji miniaturki dla każdego serialu lub filmu. Następnie na podstawie danych dotyczących użytkowników prezentuje im taką, która najprawdopodobniej najbardziej im się spodoba.

      rekomendacje netflixa
      Źródło: Netflix Binging on the Algorithm

      Na przykładzie powyżej widzimy, jak film Pulp Fiction może być proponowany użytkownikom Netflixa z różnymi miniaturkami w zależności od tego czy dana osoba w swojej historii przeglądania ma sporo filmów z Umą Thurman lub Johnem Travoltą.

      Dzięki temu istnieje znacznie większe prawdopodobieństwo, że dany użytkownik zwróci na niego uwagę.

      Rozwiązanie to dotyczy również trailerów filmów i seriali.

      Dobrym przykładem może tutaj być popularny serial House of Cards. Jeśli dany użytkownik preferuje filmy i seriale z motywem silnej kobiety, zostanie mu wyświetlona zapowiedź przedstawiająca głównie Robin Wright, grającą w serialu Claire Underwood.

      Z kolei osoby lubiące dramaty o charakterze politycznym, zobaczą główny zwiastun z Kevinem Spaceyem w roli głównej.

      Ze statystyk wynika, że algorytm Netflixa gwarantuje, że nawet 90% użytkowników zwiastun przypadnie do gustu i będą zainteresowani obejrzeniem pierwszego odcinka.


      Skąd Netflix tak dobrze zna nasz gust filmowy i wie, co chcemy oglądać?


      Netflix korzysta z algorytmów sztucznej inteligencji i uczenia maszynowego w celu generowania rekomendacji treści.

      Problem stanowi natomiast zaproponowanie filmów i seriali użytkownikom, o których system ma jeszcze niewiele informacji.

      Ze względu na to, Netflix prosi każdego nowego subskrybenta o wybranie tytułów, które chcieliby obejrzeć. Te tytuły są używane jako pierwszy krok do spersonalizowanych rekomendacji.

      Później, gdy użytkownicy kontynuują oglądanie, w miarę upływu czasu, silnik rekomendacji zaczyna coraz lepiej rozumieć ich preferencje i gust, dostosowując listę polecanych materiałów na podstawie zebranych o nich danych.

      rekomendacje netflixs
      Czy wszystko to się opłaca i czy system rekomendacji Netflixa rzeczywiście przynosi firmie korzyści? Jak najbardziej.

      Szacuje się, że ponad 80 procent programów telewizyjnych, które ludzie oglądają w serwisie Netflixa, jest odkrywanych za pośrednictwem systemu rekomendacji platformy.

      Oznacza to, że na znaczącą większość decyzji widzów na platformie bezpośrednio wpływa silnik rekomendacji i jego algorytmy sztucznej inteligencji.

      Co więcej, według najnowszych danych, że silnik rekomendacji Netflixa generuje firmie oszczędności wynoszące ponad 1 miliard dolarów rocznie.

      Wiele platform streamingowych takich jak Hulu czy Disney+ posiada swoje systemy rekomendacji treści, jednak to właśnie silnik Netflixa okazuje się najskuteczniejszy.

      Ze statystyk wynika, że 47% mieszkańców Stanów Zjednoczonych woli korzystać z serwisu Netflix (wykazując przy tym imponujący wskaźnik retencji wynoszący aż 93%). Dla porównania, Amazon Prime zajmuje drugie miejsce z wynikiem zaledwie 14%, podczas gdy Hulu i Disney + wykazały odpowiednio 13,6% i 13%.


      Jak Netflix przewiduje trendy filmowe i serialowe


      Zaawansowany silnik rekomendacji produktowych zbierający terabajty danych dotyczących ruchu w serwisie daje Netflixowi jeszcze jedną bardzo ciekawą i unikalną przewagę nad konkurencją.

      Potrafi on znacznie skuteczniej przewidywać trendy i produkować oryginalne seriale na podstawie realnych preferencji użytkowników.

      Oryginalne treści Netflixa spotykają się z pozytywnym odbiorem widzów w aż 93% przypadków.

      Szacuje się, że program telewizyjny w normalnej telewizji ma zaledwie 35% szans na sukces. Wyraźnie to pokazuje, że wybory Netflixa dotyczące scenariuszy, które wejdą do fazy produkcji, nie są przypadkowe.

      Serwis opiera się na gigantycznej ilości danych dotyczącej obecnych trendów i gustów swoich użytkowników w celu przewidywania potencjalnego sukcesu produkowanych przez niego oryginalnych seriali.

      Jest to kolejna przewaga nad klasyczną telewizją, którą Netflix uzyskuje dzięki implementacji sztucznej inteligencji.

      Świetnym przykładem skuteczności tego podejścia jest wielki sukces Netflixowego serialu Stranger Things. Tutaj także, algorytm był w stanie w pewnym sensie przewidzieć jego sukces.

      Na podstawie zachowania milionów użytkowników Netflix był w stanie stworzyć profil osób, którym serial może się spodobać oraz określić ich liczbę. Następnie, to właśnie te osoby dostały rekomendacje w pierwszej kolejności zaraz po zalogowaniu się do platformy.


      Silnik rekomendacji w innych portalach streamingowych


      Inne portale rozrywkowe w sieci również, tak jak Netflix, mogą pochwalić się imponującymi i zaskakująco skutecznymi silnikami rekomendacji opartymi o sztuczną inteligencję i machine learning.

      Takim serwisem bez wątpienia jest Spotify.

      rekomendacje spotify
      Spotify to cyfrowa usługa muzyczna, podcast i wideo, która zapewnia dostęp do milionów piosenek i innych treści od twórców z całego świata.

      Silnik Spotify podobnie jak Netflixa łączy w sobie elementy różnych strategii i metod filtrowania danych używanych przez modele różnego rodzaju w celu stworzenia jednego skutecznego i kompleksowego rozwiązania.

      System ten odpowiedzialny jest za tworzenie unikatowej playlisty “Odkryj w tym tygodniu”. Składa się ona z 30 utworów dobranych na podstawie osobistych preferencji każdego użytkownika.

      Jak się okazuje, playlista ta przynosi dla serwisu niebywałe korzyści. W ciągu pięciu lat od jej premiery słuchacze przesłuchali ponad 2,3 miliarda godzin muzyki zaproponowanej im za pośrednictwem spersonalizowanych playlist między lipcem 2015 a 25 czerwca 2020 roku.

      Innym znanym serwisem z imponującym silnikiem rekomendacji jest YouTube. Rekomendacje YouTube są generowane przez Google Brain, który niedawno został udostępniony jako rozwiązanie open source pod postacią TensorFlow.

      System składa się z dwóch sieci neuronowych odpowiadających za różne rodzaje filtrowania danych.

      Podobnie jak w systemach Netflixa i Spotify pierwsza z nich, filtruje dane o użytkownikach, by szukać powiązań między ich gustami, a druga segreguje filmy na podstawie ich charakterystyki i danych biorąc pod uwagę ich oceny, liczbę wyświetleń, komentarzy oraz opis i tagi.

      System rekomendacji YouTube przeszedł wiele modyfikacji podczas całej historii działania serwisu.

      W 2011 głównym aspektem rankingowym była po prostu ogólna liczba wyświetleń.

      Od 2012 roku elementem mającym największy wpływ na rekomendacje wideo był całkowity czas oglądania.

      Z kolei, od 2015 r. to zaangażowanie widzów jest głównym czynnikiem branym pod uwagę przez algorytmy YouTube.

      Skuteczność silnika rekomendacji YouTube nie pozostawia żadnych wątpliwości. Zdaniem ekspertów większość ruchu wideo na platformie jest generowana przez system rekomendacji, a nie przez organiczne wyniki wyszukiwania.


      Podsumowanie


      Zaawansowane silniki rekomendacji mogą przetwarzać terabajty danych w celu poprawienia doświadczeń użytkowników oraz dostarczenia istotnych, z biznesowego punktu widzenia, danych analitycznych. To właśnie kompleksowe wykorzystanie analityki danych i zastosowanie sztucznej inteligencji w praktyce jest jednym z głównych powodem sukcesu Netflix.

      Rekordowe wyniki Netflixa wyraźnie pokazują, że zadbanie o doświadczenia użytkowników, personalizacja i machine learning stanowią obecnie jedne z najważniejszych trendów wspierania i rozwoju działalności w sieci.



arrow-up icon