Forum:Inwentaryzacja Gry
Opisane strony w trybie klasycznym: 100% | |
|
Opisane redlinki w trybie klasycznym: 35,3% | ||
|
Zgodnie z zapowiedzią, bierzemy się za spis powszechny Gry. Pierwszy etap prac polega wyłącznie na spisaniu stron za pomocą tagów (typ strony, wątek i motywy). Jak to działa?
- Wchodzimy na https://dane.nonsa.pl i logujemy się za pomocą nonsowego loginu.
- Czytamy zawartość strony głównej, tam jest szczegółowo opisane, jak się to wszystko robi.
OpcjonalnieObowiązkowo: spamujemy moją dyskusję okrzykami ja chcę! oraz ja też chcę!, ewentualnie pytaniami i przechodzimy szkolenie.- Bierzemy się za robotę. Przy dobrym tempie pracy robi się jedną-dwie strony na minutę. Ciekawostka: zakładając 2 minuty na stronę (jest ich 4500) powinno to zająć 150 roboczogodzin.
Doskonale rozumiem, że sesja, wyjazd, to, śmo – nie jest to zobowiązanie dożywotnie, jednak miło widzieć kilka dodatkowych rąk do pracy. Indywidualne pytania odnośnie pojedynczych stron możemy załatwiać via priv/query, natomiast sprawy sporne, godne przedyskutowania i nieprzewidziane – tutaj. Serscull 22:48, 30 maj 2019 (CEST)
Do zrobienia (czyli plan na długie lata)
Wszystko to będzie miało sens, jeśli będzie robione w takiej właśnie kolejności.
- Inwentaryzacja (czyli to, co robimy teraz).
- Ustandaryzowanie stron ze znacznikami <choose>. Sugerowane:
- Jeśli wewnątrz znacznika znajduje się losowany opis sytuacji, należy go wyeksportować do osobnej strony, której będzie można przypisać motywy i do której będzie można normalnie linkować;
- Jeśli wewnątrz znacznika znajdują się opcje, należy wyeksportować je jako szablon.
- Doskonałym przykładem jest Strona 520.
- Drobne, ale konieczne:
- Wycięcie nadmiarowych linków do strony 0,0009, a następnie utworzenie podobnej strony, żeby były dwie: pierwsza z you're an idiot jako krytyka kliknięcia ewidentnie głupiej opcji, a druga z ten idiota uwierzył, że to takie proste. Następnie przeglądamy linkujące i decydujemy, kiedy który link pasuje bardziej. To samo ze wszystkimi overlinkowanymi stronami, zwłaszcza śmierci.
- Przejrzenie stron zwycięstwa, zmniejszenie wyników procentowych – a może tylko jedna strona ze zwycięstwem i możliwość ukończenia Gry tylko i wyłącznie z wynikiem 76,6%? Taki absurd, który może śmieszyć.
- Poprawa stron ze znacznikami moderacji.
- Uzupełnienie opisanych redlinków, domknięcie otwartych wątków oraz próba ukończenia Gry.
- Stworzenie grafu wątków, pokazującego jak łączą się wątki, a nie poszczególne strony. Wyliczenie z tego mądrych cyferek (jak ciężko dotrzeć do danego wątku).
- Analiza poszczególnych wątków oddzielnie – zidentyfikowanie ślepych zaułków, sterczących redlinków i innego badziewia.
- Różne mądre cyferki dotyczące całego grafu Gry, można na przykład wyliczyć PageRank (no, prawie) każdej ze stron i tak określić jak silnie jest linkowana, również przez wiele generacji linków i wliczając w to popularność stron do niej linkujących.
- Porównanie tego wszystkiego z danymi z Google Analytics (czy nasze teorie o popularności się sprawdzają?). Do tego będzie trzeba bardzo dużo danych.
Blog
08.06.2019
Z okazji ukończenia 5% prac (czyli ok. 230 stron z 4,5 tys.) dzielę się garścią ciekawostek:
- Przewidywaliśmy, że będziemy potrzebować 5 typów stron – zrobiło się 10.
- Opisano 37 wątków (w tym 9 jako podwątki) oraz 242 motywy. Najstarsze z wątków są jednocześnie najdłuższymi i najbardziej hermetycznymi – przeważa konwergencja poziomu 1.
- Odkrywamy kolejne istoty posiadające zdolność fagocytozy. Oprócz Dzikiego Serogłowego Słonia możemy być sfagocytowani przez: dziką Marylę Rodowicz, beznosego Michaela Jacksona, dziki ser ze słoniem zamiast głowy, dziki medal oraz przez dzikiego Putina z kapeluszem w kształcie sera z promocji w H&M.
- Póki co, 38 stron potrzebuje grafik.
- Czas zainwestowany w przedsięwzięcie jest prawie żaden – wszystko robię na telefonie jadąc tramwajem, zamiast przeglądać fejsa. Przewidywałem tempo 1,5 strony na minutę i było to założenie dosyć celne, tak więc teoretycznie spędziliśmy przy tym łącznie 7-8 roboczogodzin (nie licząc spraw logistycznych).
Serscull 01:46, 8 cze 2019 (CEST)
17.07.2019
Mamy 10%! Z tej okazji kolejne ciekawostki:
- Okazuje się, że zdolność fagocytozy posiada ponad 20 istot. Istnieje również Uniwersytet Fagocytozy, zarządzany przez Tadeusza Rydzyka i Słonia Dyrektora.
- Istnieją dwa zupełnie ze sobą niepowiązane wątki z Tarzanem oraz trzy wątki z placówkami dla psychicznie chorych – również bez powiązań.
- Na tej samej zasadzie zaistniało dwóch mężczyzn z podziemi.
- Jeśli utrzymamy tempo 5% na miesiąc, to za półtora roku skończymy (teraz był taki dłuższy miesiąc, ale mniej jeżdżę komunikacją miejską).
- Doszedł jeszcze jeden rodzaj strony – ślepy zaułek.
- 86 stron potrzebuje moderacji pod kątem grafik (czy osoby przesądne powinny się bać i tej liczby?), 138 potrzebuje moderacji ogólnej, 83 potrzebuje humoru, zaś większej ilości wyjść potrzebuje 86 (znowu) stron.
- Możemy odwiedzić kraje takie jak Francja, Rosja (kilka miast), Albania (znaczy, nie możemy, bo jej nie ma, ale w końcu Gra to świat nieco fikcyjny), Azerbejdżan (średniowieczny), Chiny, Indie, RPA, Rumunia i oczywiście USA.
- Możemy zrobić zakupy w Lidlu, Biedronce i Empiku.
Serscull 19:32, 17 lip 2019 (CEST)
2.08.2019
I cyk, 15%! Po raz pierwszy mój udział okazał się mniej znaczący dzięki pracy Adoora i Ryka.
- 11 typów stron Gry, 92 wątki i 708 motywów.
- Motywy wymagały już zrobienia przeglądu celem usystematyzowania.
Nie znalazłem niestety zbyt wielu perełek z tej racji, że tym razem skupiłem się na nadzorowaniu prac. Serscull 12:48, 2 sie 2019 (CEST)
16.09.2019
Wyjątkowo wetnę się Sersowi i sam trochę pomarudzę, he, he, he.
Mamy już ponad 27% zinwentaryzowanych stron! Nagły skok z 20% wynika z tego, że błędnie napisałem formułkę liczącą strony Gry i okazało się, że mamy ich jakieś 2000 mniej. Spokojnie, nie zmieniło to w żaden sposób faktycznej ilości pracy do wykonania, tylko licznik był krzywy. Do tego wprowadziłem parę usprawnień:
- Bot od teraz kasuje niepotrzebne już strony w ND (czyli takie, które nie mają odpowiadającej strony Gry na Nonsie lub redlinka). Dzięki temu ubyło jakieś 180 niepotrzebnych stron.
- Bot uzupełnia teraz kilka nowych rubryk związanych z historią edycji strony: data utworzenia, data ostatniej edycji, ilość wersji, lista autorów i pierwszy autor.
- Udało się to wszystko też podpiąć pod Google Analytics, skąd bot pobiera kilka statystyk powiązanych z daną stroną.
- Odwiedziny – ilość wszystkich wyświetleń danej strony.
- Unikalne odwiedziny – ilość sesji, w czasie których użytkownik zahaczył o daną stronę choć raz.
- Odsetek wyjść – procent użytkowników, którzy po wyświetleniu danej strony wyszli z Nonsy. Im mniej tym lepiej. Ten wskaźnik może potencjalnie pomóc znaleźć strony, którym brakuje wyjść, są frustrujące, bądź źle napisane.
- Średni czas spędzony na stronie – no chyba wiadomo.
- Ogarnąłem nieco strukturę stron opisu Gry, teraz ma to jakieś ręce, nogi i sekcje.
- Doszło nowe małe narzędzie na prośbę Sersculla – najstarsze linkujące do danej strony. Link do tego zestawienia znajduje się na każdej stronie opisu Gry. Pokazuje ono linkujące posortowane według daty ich utworzenia.
Dane z Google Analytics dotyczą okresu od początku istnienia nonsa.pl, także nie ma ich jakoś zatrważająco dużo, ale coś jest. Bot teraz sobie to wszystko spokojnie wypełnia, także za chwil kilka powinno być powpisywane. Ostrzyciel | Dyskusja 19:09, 16 wrz 2019 (CEST)
18.09.2019
Jeszcze trochę nowinek. Bot od teraz wydusza z Google Analytics dodatkowe dane o tym, skąd użytkownik na danej stronie się wziął. Pozwala to zbudować dla każdej strony indeks linkujących wraz z przypisanymi faktycznymi ilościami klików w nie.
Dane te znajdziecie klikając w linki Pokaż statystyki wejść na tę stronę oraz Pokaż statystyki wyjść z tej strony. Bot śledzi dokładnie tylko linki wewnątrz Gry, pozostałe wejścia do Gry oznaczane są jako (inne), natomiast wejścia do Gry bezpośrednio spoza Nonsensopedii jako (wejście). Bot sobie powoli te dane uzupełnia, powinien skończyć yyy koło godziny 22–23 dzisiaj. Jeśli chodzi o statystyki z GA to to już chyba powinno wystarczyć, więcej tego dłubać nie będę.
Powoli też mi się kończą pomysły na inne dane, jakie mógłby zbierać bot, więc jak ktoś ma jakieś sugestie, to chętnie przyjmę. Ostrzyciel | Dyskusja 17:36, 18 wrz 2019 (CEST)
11.10.2019
Mamy 30%! Przeciągnęło się, a to za sprawą uzupełniania paru rzeczy, które nie nabijały procentów.
- Przeglądnąłem strony zawierajace znacznik choose. Teraz dopiero odkryliśmy, jak wielki potencjał za sobą kryje jego użycie i że ogarnięcie stron zawierających go będzie trzeba poważnie przemyśleć.
- Jestem w trakcie opisywania już trzeciego wątku, którego akcja toczy się w szpitalu psychiatrycznym. Oprócz tego możemy też udać się do poradni.
- Osiągnęliśmy 1000 motywów. Trzeba ich doglądać co jakiś czas – jest kilka par motywów synonimicznych, które będzie trzeba połączyć, na przykład:
- Dupa rzyć pośladki oraz Dupa
- Ekran oraz monitor
- Ciekawy przypadek: cheat, czity oszustwo, kody i oszustwo. Niby synonimy, ale tak nie do końca.
- Pojawiły się dwie pary zdublowanych motywów, gdzie jeden zawiera błąd w pisowni (wrzechświat).
- Mało znanym scenariuszem jest ten, w którym możemy rozgościć się w gabinecie demonicznego Admina. Opisanie wszystkich jego odnóg jest porównywalne do strony 1. W ogóle jest bardzo dużo wątków piekielnych.
- A propos wątków – opisaliśmy ich 123.
Serscull 15:43, 11 paź 2019 (CEST)
3.12.2019
Chyba ostatni wpis dekady w tym temacie, a przynajmniej ode mnie. Poparcie rośnie – mamy 35%! Tradycyjnie ciekawostki:
- Wciąż istnieją strony w zasięgu dwóch kliknięć od strony głównej, które nie zostały zinwentaryzowane.
- Najstarsze wątki dało się łatwo skatalogować tak, że nie natrafimy na żadną nieopisaną stronę, choćbyśmy się starali.
- Poprzednie dwie ciekawostki wynikają z tego, że nowsze wątki bardzo często linkują do innych, istniejących już odnóg Gry – zawsze więc da się jakoś „wypłynąć na powierzchnię” lub sprawnie przeskoczyć do innej, wielkiej odnogi.
- Zbliża się rok 2020, a motywów mamy 1212 (przybyło 212), wątków jest 147 (przybyło 24). Nazwy wątków zazwyczaj bardzo prosto opisują fabułę, ale niektóre z nich po prostu… przyciągają uwagę, tak jak Awokado vs. Wściekłe zwierzątko, Mrówka ze Snickersem, Trzymetrowe zielone macki, Ptaszysko z głową pijaczka spod sklepu czy Kraina pianek Jojo, który mi oraz Ostrzycielowi narobił smaka na wspomniany wyrób z syropu glukozowo-fruktozowego.
- Są aż trzy wątki, w których podejmujemy interakcje z Adminem Nonsensopedii (w jednym z nich rzeczony admin został porwany), i dwa, w których stajemy się więźniami koreańskiego obozu pracy.
Oprócz tradycyjnych ciekawostek będzie też garść pierwszych refleksji, spisanych mięci kupa.
- Dużo, naprawdę dużo stron, jest po prostu badziewnych. Mimo to mają w większości (99%) zerowy odsetek wyjść – znaczy to, że nikt nie ragequituje i nie zamyka karty z Nonsensopedią. Ale nie liczy to wyjść z Gry przy pozostaniu na Nonsie.
- Dużo, naprawdę dużo stron, to suche opisy. One są w Grze oczywiście potrzebne, ale jeśli wątek składa się z samych opisów, to granie się staje jedynie odmóżdżającym klikaniem. A nawet tak niewielkie edycje nadają im wartość. Mam wrażenie, że uśmiesznienie opisów mogę podpiąć pod teorię humoru – dostrzegam tu pewien mechanizm, którego działanie zarysowuje mi się coraz wyraźniej. Jak się uda, to będziemy to robić maszynowo (kind of).
- Brakuje nam takich stron. Byłoby złoto, ale jest platyna.
- Sporo wątków nic nie wnosi. Będziemy ciąć. Tak, Grę czeka TRE w trybie blokowym.
Na sam koniec: moja reakcja podczas oglądania kolejnego bezsensownego odniesienia do strony z uciekaniem.
Serscull 21:38, 3 gru 2019 (CET)