Forum:Inwentaryzacja Gry

Z Nonsensopedii, polskiej encyklopedii humoru
Ten wątek nie był edytowany od 1875 dni. Nie baw się w archeologa i nie odkopuj go. Zamiast tego możesz wrócić na stronę główną forum i założyć nowy temat.
Opisane strony w trybie klasycznym:  100%
 
(3457 / 3457)
Opisane redlinki w trybie klasycznym:  35,3%
   
(680 / 1929)


Zgodnie z zapowiedzią, bierzemy się za spis powszechny Gry. Pierwszy etap prac polega wyłącznie na spisaniu stron za pomocą tagów (typ strony, wątek i motywy). Jak to działa?

  1. Wchodzimy na https://dane.nonsa.pl i logujemy się za pomocą nonsowego loginu.
  2. Czytamy zawartość strony głównej, tam jest szczegółowo opisane, jak się to wszystko robi.
  3. Opcjonalnie Obowiązkowo: spamujemy moją dyskusję okrzykami ja chcę! oraz ja też chcę!, ewentualnie pytaniami i przechodzimy szkolenie.
  4. Bierzemy się za robotę. Przy dobrym tempie pracy robi się jedną-dwie strony na minutę. Ciekawostka: zakładając 2 minuty na stronę (jest ich 4500) powinno to zająć 150 roboczogodzin.

Doskonale rozumiem, że sesja, wyjazd, to, śmo – nie jest to zobowiązanie dożywotnie, jednak miło widzieć kilka dodatkowych rąk do pracy. Indywidualne pytania odnośnie pojedynczych stron możemy załatwiać via priv/query, natomiast sprawy sporne, godne przedyskutowania i nieprzewidziane – tutaj. Serscull 22:48, 30 maj 2019 (CEST)

Do zrobienia (czyli plan na długie lata)

Wszystko to będzie miało sens, jeśli będzie robione w takiej właśnie kolejności.

  1. Inwentaryzacja (czyli to, co robimy teraz).
  2. Ustandaryzowanie stron ze znacznikami <choose>. Sugerowane:
    • Jeśli wewnątrz znacznika znajduje się losowany opis sytuacji, należy go wyeksportować do osobnej strony, której będzie można przypisać motywy i do której będzie można normalnie linkować;
    • Jeśli wewnątrz znacznika znajdują się opcje, należy wyeksportować je jako szablon.
  3. Drobne, ale konieczne:
    1. Wycięcie nadmiarowych linków do strony 0,0009, a następnie utworzenie podobnej strony, żeby były dwie: pierwsza z you're an idiot jako krytyka kliknięcia ewidentnie głupiej opcji, a druga z ten idiota uwierzył, że to takie proste. Następnie przeglądamy linkujące i decydujemy, kiedy który link pasuje bardziej. To samo ze wszystkimi overlinkowanymi stronami, zwłaszcza śmierci.
    2. Przejrzenie stron zwycięstwa, zmniejszenie wyników procentowych – a może tylko jedna strona ze zwycięstwem i możliwość ukończenia Gry tylko i wyłącznie z wynikiem 76,6%? Taki absurd, który może śmieszyć.
  4. Poprawa stron ze znacznikami moderacji.
  5. Uzupełnienie opisanych redlinków, domknięcie otwartych wątków oraz próba ukończenia Gry.
    1. Stworzenie grafu wątków, pokazującego jak łączą się wątki, a nie poszczególne strony. Wyliczenie z tego mądrych cyferek (jak ciężko dotrzeć do danego wątku).
    2. Analiza poszczególnych wątków oddzielnie – zidentyfikowanie ślepych zaułków, sterczących redlinków i innego badziewia.
    3. Różne mądre cyferki dotyczące całego grafu Gry, można na przykład wyliczyć PageRank (no, prawie) każdej ze stron i tak określić jak silnie jest linkowana, również przez wiele generacji linków i wliczając w to popularność stron do niej linkujących.
    4. Porównanie tego wszystkiego z danymi z Google Analytics (czy nasze teorie o popularności się sprawdzają?). Do tego będzie trzeba bardzo dużo danych.

Blog

08.06.2019

Z okazji ukończenia 5% prac (czyli ok. 230 stron z 4,5 tys.) dzielę się garścią ciekawostek:

  • Przewidywaliśmy, że będziemy potrzebować 5 typów stron – zrobiło się 10.
  • Opisano 37 wątków (w tym 9 jako podwątki) oraz 242 motywy. Najstarsze z wątków są jednocześnie najdłuższymi i najbardziej hermetycznymi – przeważa konwergencja poziomu 1.
  • Odkrywamy kolejne istoty posiadające zdolność fagocytozy. Oprócz Dzikiego Serogłowego Słonia możemy być sfagocytowani przez: dziką Marylę Rodowicz, beznosego Michaela Jacksona, dziki ser ze słoniem zamiast głowy, dziki medal oraz przez dzikiego Putina z kapeluszem w kształcie sera z promocji w H&M.
  • Póki co, 38 stron potrzebuje grafik.
  • Czas zainwestowany w przedsięwzięcie jest prawie żaden – wszystko robię na telefonie jadąc tramwajem, zamiast przeglądać fejsa. Przewidywałem tempo 1,5 strony na minutę i było to założenie dosyć celne, tak więc teoretycznie spędziliśmy przy tym łącznie 7-8 roboczogodzin (nie licząc spraw logistycznych).

Serscull 01:46, 8 cze 2019 (CEST)

17.07.2019

Mamy 10%! Z tej okazji kolejne ciekawostki:

  • Okazuje się, że zdolność fagocytozy posiada ponad 20 istot. Istnieje również Uniwersytet Fagocytozy, zarządzany przez Tadeusza Rydzyka i Słonia Dyrektora.
  • Istnieją dwa zupełnie ze sobą niepowiązane wątki z Tarzanem oraz trzy wątki z placówkami dla psychicznie chorych – również bez powiązań.
  • Na tej samej zasadzie zaistniało dwóch mężczyzn z podziemi.
  • Jeśli utrzymamy tempo 5% na miesiąc, to za półtora roku skończymy (teraz był taki dłuższy miesiąc, ale mniej jeżdżę komunikacją miejską).
  • Doszedł jeszcze jeden rodzaj strony – ślepy zaułek.
  • 86 stron potrzebuje moderacji pod kątem grafik (czy osoby przesądne powinny się bać i tej liczby?), 138 potrzebuje moderacji ogólnej, 83 potrzebuje humoru, zaś większej ilości wyjść potrzebuje 86 (znowu) stron.
  • Możemy odwiedzić kraje takie jak Francja, Rosja (kilka miast), Albania (znaczy, nie możemy, bo jej nie ma, ale w końcu Gra to świat nieco fikcyjny), Azerbejdżan (średniowieczny), Chiny, Indie, RPA, Rumunia i oczywiście USA.
  • Możemy zrobić zakupy w Lidlu, Biedronce i Empiku.

Serscull 19:32, 17 lip 2019 (CEST)

2.08.2019

I cyk, 15%! Po raz pierwszy mój udział okazał się mniej znaczący dzięki pracy Adoora i Ryka.

  • 11 typów stron Gry, 92 wątki i 708 motywów.
  • Motywy wymagały już zrobienia przeglądu celem usystematyzowania.

Nie znalazłem niestety zbyt wielu perełek z tej racji, że tym razem skupiłem się na nadzorowaniu prac. Serscull 12:48, 2 sie 2019 (CEST)

16.09.2019

Wyjątkowo wetnę się Sersowi i sam trochę pomarudzę, he, he, he.

Mamy już ponad 27% zinwentaryzowanych stron! Nagły skok z 20% wynika z tego, że błędnie napisałem formułkę liczącą strony Gry i okazało się, że mamy ich jakieś 2000 mniej. Spokojnie, nie zmieniło to w żaden sposób faktycznej ilości pracy do wykonania, tylko licznik był krzywy. Do tego wprowadziłem parę usprawnień:

  • Bot od teraz kasuje niepotrzebne już strony w ND (czyli takie, które nie mają odpowiadającej strony Gry na Nonsie lub redlinka). Dzięki temu ubyło jakieś 180 niepotrzebnych stron.
  • Bot uzupełnia teraz kilka nowych rubryk związanych z historią edycji strony: data utworzenia, data ostatniej edycji, ilość wersji, lista autorów i pierwszy autor.
  • Udało się to wszystko też podpiąć pod Google Analytics, skąd bot pobiera kilka statystyk powiązanych z daną stroną.
    • Odwiedziny – ilość wszystkich wyświetleń danej strony.
    • Unikalne odwiedziny – ilość sesji, w czasie których użytkownik zahaczył o daną stronę choć raz.
    • Odsetek wyjść – procent użytkowników, którzy po wyświetleniu danej strony wyszli z Nonsy. Im mniej tym lepiej. Ten wskaźnik może potencjalnie pomóc znaleźć strony, którym brakuje wyjść, są frustrujące, bądź źle napisane.
    • Średni czas spędzony na stronie – no chyba wiadomo.
  • Ogarnąłem nieco strukturę stron opisu Gry, teraz ma to jakieś ręce, nogi i sekcje.
  • Doszło nowe małe narzędzie na prośbę Sersculla – najstarsze linkujące do danej strony. Link do tego zestawienia znajduje się na każdej stronie opisu Gry. Pokazuje ono linkujące posortowane według daty ich utworzenia.

Dane z Google Analytics dotyczą okresu od początku istnienia nonsa.pl, także nie ma ich jakoś zatrważająco dużo, ale coś jest. Bot teraz sobie to wszystko spokojnie wypełnia, także za chwil kilka powinno być powpisywane. Ostrzyciel | Dyskusja 19:09, 16 wrz 2019 (CEST)

18.09.2019

Jeszcze trochę nowinek. Bot od teraz wydusza z Google Analytics dodatkowe dane o tym, skąd użytkownik na danej stronie się wziął. Pozwala to zbudować dla każdej strony indeks linkujących wraz z przypisanymi faktycznymi ilościami klików w nie.

Dane te znajdziecie klikając w linki Pokaż statystyki wejść na tę stronę oraz Pokaż statystyki wyjść z tej strony. Bot śledzi dokładnie tylko linki wewnątrz Gry, pozostałe wejścia do Gry oznaczane są jako (inne), natomiast wejścia do Gry bezpośrednio spoza Nonsensopedii jako (wejście). Bot sobie powoli te dane uzupełnia, powinien skończyć yyy koło godziny 22–23 dzisiaj. Jeśli chodzi o statystyki z GA to to już chyba powinno wystarczyć, więcej tego dłubać nie będę.

Powoli też mi się kończą pomysły na inne dane, jakie mógłby zbierać bot, więc jak ktoś ma jakieś sugestie, to chętnie przyjmę. Ostrzyciel | Dyskusja 17:36, 18 wrz 2019 (CEST)