Aktualizacja algorytmu treści. LinkedIn walczy ze spamem

Szacowany czas na przeczytanie: 8 minut

Linkedin walczy ze spamem i spamerami. Wypowiada też wojnę grupkom wzajemnej adoracji, mowie nienawiści oraz osobom, które polaryzują społeczność.

Jak to ma działać? Niedawno na blogu LinkedIn Engineering opublikowany został tekst, który pokazuje jaką aktualizację przeszedł algorytm w ostatnim czasie. A wzbogacony został o system detekcji spamu w treściach wirusowych.

Oznacza to, że wysoko zasięgowi twórcy, którzy stosują praktyki promocji swojego contentu, niezgodne ze standardami społeczności LinkedIn, będę wykrywani częściej przez system detekcji wirusowego spamu, a co za tym idzie ich treści nie będzie pokazywana tak szerokim grupom odbiorców.

Rozwijanie modeli do wykrywania wirusowych treści spamowych jest niezwykle ważne, ale też bardzo skomplikowane – pisze na blogu LinkedIn, Shilpi Agrawal.I dodaje: Dzięki zrozumieniu wirusowości i treści spamowej, udało nam się przeprowadzić kompleksowe analizy cech i sygnałów, które były pomocne w wykrywaniu tego typu treści, co umożliwiło nam radzenie sobie z tymi wyzwaniami.

W tym wpisie omówimy nie tylko artykuł Agrawal, ale także wyjaśnię Wam co te zmiany dla nas wszystkich oznaczają.

Jak LinkedIn walczy ze spamerami i spamem?

LinkedIn nie zaprojektowano, jako portal, do tworzenia wirusowych treści, czyli takich, które rozprzestrzeniają się szybko i prowadzą do znacznego zaangażowania w postaci polubień, reakcji, komentarzy i udostępnień. I w bardzo krótkim czasie mogą “zainfekować” portal lub dane sieci kontaktów.

Wykrywanie wirusowej treści spamowej to duży wysiłek, w ramach którego LinkedIn uruchomił wiele modeli sztucznej inteligencji, opartych na treściach naruszających zasady i rodzajach spamu obecnym na platformie.

Modele sztucznej inteligencji wykorzystywane do wykrywania naruszającej treści można podzielić na dwie główne kategorie:

obrony proaktywne,
obrony reaktywne.

W modelu proaktywnym wykrycie następuje natychmiast po pojawieniu się treści na feedzie LinkedIn, podczas gdy w modelu reaktywnym monitorowane są działania związane z opublikowaną treścią, a AI próbuje przewidzieć jej potencjalną zdolność do szerokiej dystrybucji.

Jak LikedIn Walczy ze spamem i spamerami — Rysunek 1: Ilustracja obron proaktywnych i reaktywnych oraz ich punktów operacyjnych

Obrony proaktywne

Na platformie LinkedIn obrony proaktywne działają, aby przewidzieć potencjalną wirusową treść spamową tak wcześnie, jak to możliwe. Obrony te składają się z dwóch rodzajów klasyfikatorów.

Pierwszy zestaw klasyfikatorów został wyszkolony w określonej kategorii spamu, takiej jak mowa nienawiści; drugi zestaw klasyfikatorów został wyszkolony w określonym rodzaju treści, takim jak filmy lub artykuły.

Oba rodzaje klasyfikatorów są szkolenie na różnych cechach, które dostarczają wczesnego sygnału dla wirusowej i spamowej treści, o czym będzie mowa w przyszłym dziale. Obrony te, to głównie głębokie sieci neuronowe. Modele te uruchamiane są na platformie co kilka godzin i podejmują odpowiednie działania, takie jak filtrowanie lub przekazywanie treści do ręcznej recenzji przez inne osoby użytkujące portal.

Obrona reaktywna

Obrona reaktywna stanowi dodatkową warstwę ochrony dla obrony proaktywnej i działa na treści po tym, jak zyskają sygnały zaangażowania wskazujące na ich wirusową naturę. Klasyfikatory reaktywne zapobiegają treści spamowej docieraniu do dużych grup członków i uzyskiwaniu dużej popularności.

Model reaktywny to kombinacja modelu uczenia maszynowego i heurystyk, które wykorzystują zachowanie użytkowników, cechy treści i wzorce interakcji z treścią, aby przewidzieć prawdopodobieństwo, że wirusowa treść jest spamem.

Wykrywanie treści wirusowych na LinkedIn

Poniżej znajdziecie diagram, który przedstawia drogę wykrywania treści na platformie po ich opublikowaniu.

LinkedIn walczy ze spamerami i spamem — Proces wykrywania spamu na LiknkedIn

Klasyfikatory uczenia maszynowego oceniając treści i działają na podstawie dostępnych cech, takich jak cechy autora i treści. Jeśli zostanie uznana za spam lub naruszającą politykę, podejmujemy odpowiednie działania, takie jak filtrowanie lub przesyłanie do ręcznej recenzji przez ludzi w celu podjęcia decyzji o dalszych działaniach. Nawet usunięcie takiej treści lub nałożenie na nią shadowbana.

Cechy służące do przewidywania wirusowości

Od momentu opublikowania, wiele czynników wpływa na interakcje z nią. Te czynniki obejmują:

typ treści(tekst, obraz, wideo, artykuł itp.),
interakcje osób użytkujących LinkedIn z daną treścią oraz sposób,
w jaki treść przepływa przez sieć członków w kilku kategoriach.

Cechy postów

Cechy postów obejmują typ treści, jej polaryzację i spam. Analizowanie tych czynników w celu identyfikacji potencjalnie wirusowych treści pozwala nam zobaczyć, jak treść staje się wirusowa w różnych tempach, zauważyć korelację między wynikami polaryzacji a jakością treści oraz wykorzystać zgłoszenia członków jako wskaźnik treści spamowych.

Jak LinkedIn walczy ze spamem — Reakcje dzięki, którym model przewiduje spam i wirusowość

Cechy użytkowników LinkedIn

To analiza cech użytkowników LinkedIn. I to jak w danym przedziale czasowym reagowali z postem (udostępnienia, komentarze lub reakcje). Dostarcza wczesny sygnał o możliwości wirusowego rozprzestrzeniania się danego posta.

Z tych interakcji wyodrębniane są poniższe cechy.

Cechy sieciowe

Cechy te wyznaczają wpływ i popularność tych członków w sieci LinkedIn. Ich działania mogą skutkować przyciągnięciem znacznie większej liczby członków i spowodowaniem efektu kaskadowego, który sprawia, że post staje się wirusowy. Tutaj używamy cech takich jak liczba obserwujących i połączeń, różnorodność branż, lokalizacja oraz poziom sieci (połączeń i obserwujących) tych członków.

Komentarz: Im większa sieć kontaktów, z którą nie rozmawiasz regularnie i której osoby członkowskie nie wchodzą z tobą w interakcje, tym trudniej będzie ci promować treści. Algorytm penalizuje więc osoby, które są LiONami (LinkedIn Open Networkers) czy osoby całkowicie przypadkowo budujące swoją sieć kontaktów. Dlatego sieć kontaktów buduj odpowiedzialnie.

Cechy aktywności

Obejmują one rodzaj aktywności w przeszłości, aktywność na platformie i czas, przez jaki dany członek jest już użytkownikiem LinkedIn.

Komentarz: W momencie, kiedy post jest zgłoszony, jako łamanie zasad społeczności LinkedIn, może być nałożony shadowban – widzi go tylko autor, aż do momentu podjęcia decyzji przez administrację serwisu. Dla takich profili spadają też zasięgi kolejnych publikacji według algorytmu LinkedIn. Dodam też, że LinkedIn toczy też walkę przeciw botom. Administracja częściej weryfikuje nowe konta. Zwłaszcza te, na których występują podejrzane czynności.

Cechy zaangażowania

Te cechy opierają się na zaangażowaniu postów w formie polubień/reakcji, udostępnień, komentarzy i wyświetleń. AI wyciąga z danych różne cechy. Są nimi sekwencje czasowe liczby, polubień/reakcji, udostępnień, komentarzy i wyświetleń oraz prędkość ich wzrostu. To najmocniejszy sygnał dla kaskadowego efektu, który zachodzi w sieci.

Komentarz: Bye, bye grupy wzajemnej adoracji! Penalizowane będą wpisy wpisy osób, które pozyskują np. reakcje z czatów grupowych w krótkim czasie. Dodatkowo, jeśli algorytm zauważy, że masz pod postem dwadzieścia komentarzy o treści „chcę” utnie zasięgi takie posta. Dużo lepiej założyć jest landing page. A jeśli koniecznie zależy nam na zasięgach, wrzucić np. e-booka, jako dokument na LinkedIn. Taki, który można pobrać, udostępnić i skomentować z poziomu LinkedIn.

Co te zmiany oznaczają w praktyce?

Mniej spamu. Dzięki wprowadzeniu modeli proaktywnych, jak i reaktywnych, LinkedIn udało się zmniejszyć procent wyświetleń spamu o 7,3%. Modele proaktywne były szczególnie skuteczne w wykrywaniu spamu we wczesnej fazie. Doprowadziło do zmniejszenia wyświetleń spamu o 7,6%, podczas gdy modele reaktywne zmniejszyły go o 2,2%.

Jako drugorzędny wpływ LinkedIn odnotował spadek raportów o braku zainteresowania ze strony użytkowników oraz raportów o naruszeniu zasad dotyczących zawartości. Treści, które naruszają standardy społeczności wyświetlane są teraz o 12% rzadziej.

Dodam o siebie, że świetnie, że LinkedIn walczy z mową nienawiści i spamem. Ale tutaj pewna uwaga. Jeśli zajmujesz się prawami człowieka, LinkedIn może stać się coraz mniej przyjaznym dla ciebie. Zwłaszcza, że nie wiadomo, jakie poglądy ma user recenzujący Twoją treść. Jest to więc znowu, nomen omen, miecz obosieczny.

Bo z jednej strony LinkedIn mówi nam – walczę z mową nienawiści. A z drugiej będzie wycinał w pień zasięgi publikacjom, które mogą skutkować pojawieniem się takowej (nie z winy osób autorskich). I ta zmiana jest „średnia”. Jak nie na gorsze.

Pożyjemy, zobaczymy.

A Wy? Co sądzicie o tej zmianie?

Jak LinkedIn walczy ze spamerami i spamem?

Obrony proaktywne

Obrona reaktywna

Wykrywanie treści wirusowych na LinkedIn