Przedziały ufności

Bartlomiej Zmuda
Official Allora Community
2 min read2 days ago

Dokumentacja Allora // Korekta tłumaczenia: Bart Zmuda

Przedziały ufności (CI) pomagają użytkownikom zrozumieć, jak duże są różnice między przewidywaniami różnych pracowników (workers). Zamiast podawać tylko jedną liczbę przewidywań, sieć zapewnia również zakres — okno, które informuje, jak blisko lub daleko od siebie są przewidywania pracowników. Pomaga to ocenić pewność przewidywań.

Jak generowane są przedziały ufności

Przedziały ufności nie są po prostu wyprowadzane z surowych prognoz pracowników. Sieć Allora stosuje podejście ważone, uwzględniające niezawodność poszczególnych pracowników, aby zapewnić, że mniej dokładne prognozy nie wpłyną nadmiernie na wynik końcowy. Oto, jak działa ten proces:

  1. Percentile jako kluczowe wskaźniki :
    Sieć używa konkretnych percentyli do określenia przedziałów ufności, naśladując granice 1σ i 2σ występujące w rozkładzie normalnym. Należą do nich:
  • 2,28% i 97,72% : Te percentyle reprezentują skrajne końce spektrum i uwzględniają niemal wszystkie przewidywania, łącznie z wartościami odstającymi.
  • 15,87% i 84,13% : Te percentyle reprezentują bardziej centralny zakres, skupiający się na podstawowym zestawie wniosków o najwyższym poziomie pewności.

Mimo że wnioski wyciągane przez pracowników mogą nie być zgodne z idealnym rozkładem Gaussa (krzywą dzwonową), percentyle te zapewniają ustrukturyzowany sposób opisu niepewności inherentnej dla zbiorowych prognoz.

2. Ważone prognozy pracowników :
Nie wszystkie wnioski pracowników są traktowane jednakowo. Pracownikom o udowodnionej historii dokładności przypisuje się wyższe wagi , co wzmacnia ich wpływ na ostateczny przedział ufności. Z kolei mniej wiarygodnym pracownikom przypisuje się niższe wagi, aby zapewnić, że ich prognozy nie rozszerzą sztucznie przedziału ufności.

3. Budowanie dystrybucji :
Po przesłaniu wniosków są one sortowane od najniższej do najwyższej, a waga każdego pracownika jest kumulowana w celu utworzenia funkcji dystrybucji skumulowanej (CDF), która umożliwia sieci mapowanie sposobu, w jaki przewidywania są dystrybuowane w bazie pracowników.

4. Określanie przedziału ufności :
Używając CDF, sieć oblicza wartości predykcji odpowiadające wybranym percentylom (np. 2,28%, 15,87% itd.). Aby zwiększyć precyzję, sieć stosuje interpolację — metodę szacowania wartości, które mieszczą się między dwoma znanymi punktami danych na posortowanej liście. Zapewnia to, że przedziały ufności odzwierciedlają rzeczywisty rozkład wniosków, a nie przybliżone zakresy.

Co to dla Ciebie oznacza?

Przedział ufności w Allora pozwala zorientować się, na ile sieć jest pewna prognozy.

  • Wąski przedział ufności oznacza, że ​​pracownicy w większości zgadzają się co do wyniku.
  • Szerszy przedział ufności wskazuje na większą zmienność przewidywań pracowników, co oznacza większą niepewność wyników.

Dzięki uwzględnieniu tych przedziałów ufności użytkownicy mogą podejmować bardziej świadome decyzje dotyczące konsensusu otaczającego wnioski przedstawione na dany temat.

Ostatnia aktualizacja: 26 września 2024

--

--