Keskustelu wikiprojektista:Tonnikerho

Wikipediasta
Siirry navigaatioon Siirry hakuun

Hienoa, että tälle löytyi projektiksi asti kiinnostusta! Ehdottaisin ensimmäiseksi yhteisponnistukseksi artikkeli Joulupukki; Tiede-lehden viimeisimmässä numerossa olisi mukavasti viitemateriaalia (joskaan artikkeli ei ole aivan täysin tieteellisen metodin mukainen ;)) --Pitke (keskustelu) 13. joulukuuta 2012 kello 20.09 (EET)[vastaa]

Joulupukki on hyvä kohde: ajankohtainen ja suosittu (kuukaudesta riippuen 700–20 000 käyntiä). Nykyinen artikkeli on kyllä pitkä, mutta kovin lähteetön. Sisältöön en ole tutustunut.
Yleisesti ottaen, tämä Tonnikerho-projekti ei ole sinänsä pelkkä yhteistyöprojekti, vaan tonniartikeleja voidaan muokata yhdessä tai yhden käyttäjän voimin. Jopa vandalismin torjunta tonniartikkeleista on projektiin osallistumista. Omasta mielestäni usein paras tapa korjata artikkeli on se, että yksi käyttäjä ottaa sen aluksi haltuunsa ja kohentaa sitä omien lähteidensä pohjalta niin paljon kuin jaksaa ja pystyy. Sitten kun hän on valmis, muut voivat täydentää sitä vielä omien lähteidensä pohjalta. Mutta osallistujat voivat tietysti valita keskenään parhaan toimintamuodon. Itse olen viime aikoina lainaillut kirjastosta muusikko- ym. elämäkertoja ja kirjoittanut artikkeleja uusiksi niiden pohjalta kappale kerrallaan. --Savir (keskustelu) 13. joulukuuta 2012 kello 20.27 (EET)[vastaa]
Miten tuo laatu-kohdan numerointi menee ? Valtioprojektissa olen kokenut hyödylliseksi listata suoraan viitteiden määrän. Lisäisin muutamia viitteitä, nyt ei pitäisi olla täysin lähteettömiä enää. --Tappinen (keskustelu) 15. joulukuuta 2012 kello 23.52 (EET)[vastaa]
Pitke laittoi taulukon kommentteihin nämä tiedot:
  • pääluokkiin perustuvat aihepiirit: kulttuuri, tekniikka, tiede, yhteiskunta, vapaa-aika, lienee viisasta erottaa urheilu, historia ja maantiet. paikat omiin luettelokohtiinsa?---->
  • kattavuus asteikolla 1-5: 1 on mt, 2 ta, 3 lyhyt tai varsin puutteellinen, 4 osin puutteellinen, 5 ok
  • laatu asteikolla 1-5: 1 on surkea (moniongelmainen tai erityisen häiritsevä laatu); 2 huonohko (useampia ongelmia); 3 esimerkiksi lähteetön tai huonoa kieltä, epätasainen; 4 lievästi heikko; 5 enimmäkseen ongelmaton (paikka listalla pertustuu pituuteen/kattavuuteen)
  • lukukerrat: suurin arvo edeltävän vuoden ajalta, pyöristys satoihin -- päivittämisen helpottamiseksi merkitse piiloon kuukausi/vuosi jolloin pyör. arvo viimeksi oli sekä tarkistamasi ajanjakso
Minun mielestäni kohentelija voisi toki myös itse halutessaan päättää, kuinka paljon ja millä tavalla artikkeli hänen mielestään kaipaa kohentamista. --Savir (keskustelu) 16. joulukuuta 2012 kello 00.07 (EET)[vastaa]

Automatisoinnista

[muokkaa wikitekstiä]

Harmin paikka että tuo nyt käyttämämme työkalu ilmoittaa olevansa testiversio, joka saattaa rikkoutua tai poistua käytettävistä varoittamatta... muutoin olisi voitu automatisoida lukuhuippujen ja keskiarvojen lisääminen ja päivittäminen...

--Pitke (keskustelu) 16. joulukuuta 2012 kello 00.21 (EET)[vastaa]

Täysi testiversio tämäkin, mutta Wikistats -tilastoni sattuu pitämään kuukauden datat tallessa, josta saa tehtyä ajantasaisen TOP 1000 -tilaston koska haluaa. --Harriv (keskustelu) 16. joulukuuta 2012 kello 23.57 (EET)[vastaa]
Se olisi hyvä aputyökalu, joskin Suomen TOP 1000 antaisi ilmeisesti vain n. 4000+ lukukertojen artikkeleja? --Savir (keskustelu) 17. joulukuuta 2012 kello 00.06 (EET)[vastaa]
1000. luetuin artikkeli näyttää olevan hiukan alle 4000 kertaa luettu viimeisen kuukauden aikana. Koko listassa näyttää olevan noin 3,5 miljoonaa riviä. --Harriv (keskustelu) 17. joulukuuta 2012 kello 00.10 (EET)[vastaa]
Käyttäjä:Harriv/Tonniartikkelit. Yllätysnimi kärjessä. --Harriv (keskustelu) 17. joulukuuta 2012 kello 00.37 (EET)[vastaa]
Jopas tosiaan. Tuo on jo luonnotonta ;) Tosta voisi kuoria automaattisesti päivittyväksi listaksi vaikka kaikki yli viistonniset (noin kuusisataa kohtaa), laittaa tuon meidän taulukon tyyliin aakkostuvaksi, lukukerrat {{nts}}-mallineen sisään, ja lisäksi omat sarakkeet automaattisesti luetulle tasolle akselilla mt-ta-perustaso-la-ha-sa (mielellään järjestyksessä aakkostuvaksi esim 1 mt, 2 ta jne) sekä ongelmamallineille erotuksella lähteistys-muu-molemmat. Voisi päivittyä vaikka kuukauden välein. Onnistuisko? --Pitke (keskustelu) 17. joulukuuta 2012 kello 01.49 (EET)[vastaa]
Kaikki on mahdollista, täytyy katsoa miten ehtii ja mikä on oikeasti hyödyllistä. Joskus tein tämmöisen: Käyttäjä:Harriv/TOP1000. --Harriv (keskustelu) 17. joulukuuta 2012 kello 08.24 (EET)[vastaa]
Olisi hienoa, jos voisit tehdä projektille tällaisen tukitoiminnon. Tämä olisi projektin määritelmän ja toimivuuden kannalta mielestäni ihanteellinen ratkaisu:
  • Tuo nykyinen 30 päivän lista voisi säilyä sellaisenaan. Siitähän on iloa tämän projektin ulkopuolellekin.
  • Sen lisäksi (samalla sivulla tai linkin takana) olisi "bubbling under" -lista (500–999 lukukertaa). Siltä löytyisi paljon tonniartikkeleita, jotka nousevat 1000 lukukerran kerhoon ohjaussivujensa tai aikaisempien kuukausien huippujensa ansiosta.
  • Joka kuukauden 1. päivänä syntyisi edellisen kalenterikuukauden (tai edes edellisten 30 vuorokauden) lista 1000 lukukerran artikkeleista. Yhdeltä etusivulta olisi helppo pääsy joka kuukauden listaan.
  • Kuukausittain päivittyisi myös kokonaislista, jossa on sarake joka kuukaudelle viimeisten 13 kuukauden ajalta, ja jossa on mukana jokainen artikkeli, joka on sinä aikana kerrankin päässyt 1000+ lukukertaan kalenterikuukauden aikana. Lyhennettykin taulukko riittäisi: artikkelin nimi ja huippukuukausi (ehkä myös keskiarvo).
  • Jokin tapa ottaa ohjaussivut mukaan. Ihannetapauksessa automaattinen summa, mutta edes linkki yhdestä sarakkeesta artikkelien "Tänne viittaavat sivut" -sivuille.
--Savir (keskustelu) 17. joulukuuta 2012 kello 09.42 (EET)[vastaa]
Ei sentään 500-999 lukukertaa? Ainakaan vielä? Yli tonnisissakin on jo melkein yhdeksäntuhatta artikkelia, puhutaan "bubbling under" -listasta kun ne yhdeksän tonnia on saatu kaikki ainakin LA-tasolle. Koska tuo 500-999 lukukertaa olisi arvatakseni kymmenien tuhansien, ehkäpä 50 000 kohdan lista. Mitä sellaisella tekisi? Ellei ajaisi botteja? Hmm... toisaalta... jos vain löytyisi bottiajuri niin siitä voisi tehdä kertaluontoisesti vaikka nykyisten Wikiprojektien intressien mukaiset listat (luokkapuiden perusteella), ja luoda projektialasivu seulotulle luettelolle joululahjaksi \o/ --Pitke (keskustelu) 17. joulukuuta 2012 kello 17.18 (EET)[vastaa]
Tonniartikkelihan tarkoittaa sitä, että artikkelia on jonkin kuukauden aikana luettu vähintään 1000 kertaa, ei vain viimeisen kuukauden. Viimeisten 30 päivän tilastoissa olevissa 500–999 lukukerran artikkeleissa on monta sellaista tonniartikkelia, etenkin kun ohjaussivut ottaa mukaan. Isomman listan joukosta voi itse kukin bongata tonniartikkeleita ja saada enemmän valinnanvaraa. Esimerkiksi Capri ja Kastilaitos ovat tällaisia 500–999-artikkeleja 30 päivän listalla, mutta silti aitoja tonniartikkeleita. Sitten jos ja kun Harriv:n tilastoja on pitkän aikavälin huippukuukausilta, ei epävarmoja artikkeleja ole enää tarpeen luetella. --Savir (keskustelu) 17. joulukuuta 2012 kello 17.47 (EET)[vastaa]
Näyttäisi olevan >1000 artikkeleita noin 9000, ja >500 artikkeleita noin 21000. (>100 98000, >10 430000). --Harriv (keskustelu) 17. joulukuuta 2012 kello 22.56 (EET)[vastaa]
Näyttäisi siltä että tuolla datassa on kaikki hakupyynnöt, myös ohjaussivut (löytyy erikseen esimerkiksi 13_eaa ja 13_eaa.). Lisäksi sama artikkeli voi olla eri merkistökoodausversioilla ja mukana on myös pyynnöt olemattomiin sivuihin. Joten tuota dataa pitää vähän pureskella. --Harriv (keskustelu) 17. joulukuuta 2012 kello 22.51 (EET)[vastaa]
Lisäksi, voisiko jokainen alaviiva _ korvautua tuossa listassa välilyönnillä? --Savir (keskustelu) 17. joulukuuta 2012 kello 09.53 (EET)[vastaa]
Voit tehdä itsekin, homma hoituu Notepadissa tai geditissä Ctrl+H (korvaa-toiminto), "replace all/korvaa kaikki". --Pitke (keskustelu) 17. joulukuuta 2012 kello 17.18 (EET)[vastaa]
Tietysti, mutta sellainen on epäkäytännöllistä. Listahan päivittyy kerran päivässä. --Savir (keskustelu) 17. joulukuuta 2012 kello 17.47 (EET)[vastaa]
Kerran päivässä??? Eikös se ole jo liioittelua? :I --Pitke (keskustelu) 17. joulukuuta 2012 kello 19.49 (EET)[vastaa]
Periaatteessa uutta dataa tulee kerran tunnissa.. --Harriv (keskustelu) 17. joulukuuta 2012 kello 19.52 (EET)[vastaa]
Jestas. Väittäisin kuitenkin, että kuukausittaisia lukukertoja tarkkailtaessa voidaan lista päivittää kerran kuussa aina edellisen 30 vrk lukumäärillä. Vai? Datahan saa virrata miten lystää, mutta koukun ei tarvitse olla koko ajan pinnan alla. --Pitke (keskustelu) 17. joulukuuta 2012 kello 19.54 (EET)[vastaa]
Minun mielestäni kaikki tonniartikkelit voisivat olla jopa tasa-arvoisia. Listasivulla ne voisivat olla vain aakkosjärjestyksessä, ja jos uutena kuukautena löytyy uusia tonniartikkeleita, ne voitaisiin käsin lisätä listalle oikeisiin kohtiin (se olisi helppo tehdä myös skriptillä, kuten itse teen omalla käyttäjäsivullani). Listan sarakkeisiin voisi sitten tehdä samanlaisia arvioita ja muistiinpanoja kuin tämän projektisivun pieneen taulukkoon. Tai jos automaattitoiminto osaisi hakea sarakkeisiin merkkimäärät ja ongelmamallineet, sen parempi. --Savir (keskustelu) 17. joulukuuta 2012 kello 20.06 (EET)[vastaa]
Kuten ylempänä jo mainitsin, botti lukee vaivatta mallineiden olemassaolon sivulla. Kattavuuserottelu mt-ta-perustaso-la-ha-sa, ongelmamallineissa esimerkiksi lähteistys-muu-molemmat. Kattavuus on ehdottomasti tärkeämpi kriteeri kuin merkkimäärä. --Pitke (keskustelu) 17. joulukuuta 2012 kello 21.33 (EET)[vastaa]
Tuo Alppien kärkisija on jokin virhe, sillä laskuri ilmoittaa 13.12. lukukerroiksi 250 000 ja koko muulle kuukaudelle 1400.
Ovatko nuo lukukerrat viimeisten 30 päivän ajalta? Se voisi silloin olla uusi vaihtoehtoinen lisäkriteeri tonniartikkelille: viimeiset 30 vrk.
Pystyykö tuollaista listaa tekemään saman tien viimeisiltä 13 kalenterikuukaudelta, alkaen viime vuoden joulukuulta? Tonniartikkeliksi riittää yksikin tonnilistalla esiintyminen, ja monet kausiartikkelit yltävät tonnikerhoon vain kerran vuodessa, ja ne olisi hyvä havaita etukäteen.
Noiden lisäksi tonnikerhoon pääsee artikkeleja, joilla on suosittuja aliaksia eli ohjaussivuja. Tuo lista ei taida laskea ohjaussivuja mukaan?
Tuon listan olisi hyvä arkistoitua, ja sillä tavalla että siitä pystyisi hakemaan jopa automaattisesti viimeisten 13 kuukauden suosituimman kuukauden kullekin artikkelille. --Savir (keskustelu) 17. joulukuuta 2012 kello 07.43 (EET)[vastaa]
Joku botti varmaan "innostunut" alpeista tuossa. Lukukerrat on viimeiset 30 pv ajalta. Periaatteessa pystyy ottamaan tilastot koko siltä ajalta kun on dataa tarjolla [1], käytännössä helpointa käyttää sitä arkistoa mikä minulla on tallessa, eli viimeiset 30 päivää. Lista on kooste raakadatasta, josta on suodatettu pois toimintosivut, kuvat yms. --Harriv (keskustelu) 17. joulukuuta 2012 kello 08.24 (EET)[vastaa]

Yllä on ideoitu kaikenlaista minkälaisia listoja voisi tehdä, saataisiinko näitä jotenkin listaan hyödyllisyysjärjestyksessä? --Harriv (keskustelu) 19. joulukuuta 2012 kello 19.30 (EET)[vastaa]

Minulle riittäisi aluksi tällainen. Tässä konkreettinen ehdotus.
Tammikuun 1. päivänä voisi tulla taulukko 1.–31.12. välisen ajan lukukerroista, tähän tyyliin (luvut keksittyjä):
◇ Artikkelitam 12
Movember12 000
Arnold Schwarzenegger10 000
Helmikuun 1. päivänä taulukko voisi korvautua tämäntyylisellä, lukukerrat väliltä 1.–31.1.:
 
◇ Artikkelimaks.kk.ka.
Movember 12 000 tam  8 500
Arnold Schwarzenegger 13 000 hel  11 500
Tuosta eteenpäin maksimikuukausi tulisi aina 1. sarakkeeseen ja jonkin ajanjakson (esim. 12 kuukauden) keskiarvo viimeiseen. Mahdollinen olisi myös sellainen että taulukossa olisi 12 saraketta, joihin tulisi jokaisen kuukaiden käyntikerrat, mutta sillä ei tämän projektin kannalta olisi merkitystä, vaan se olisi vain kiinnostavaa tilastotietoa. Oikeanpuolimmaisesssa sarakkeessa voisi sen sijaan olla artikkelin kaikki ongelmamallineet. --Savir (keskustelu) 19. joulukuuta 2012 kello 20.05 (EET)[vastaa]
Mitä artikkeleita taulukossa olisi? Tulee aika pitkä taulukko jos kaikki yli 1000 latauskerran artikkelit listataan kuukausittain (veikkaan että iso osa vaihtuu kuukaudesta toiseen) vuodenkin ajalta. --Harriv (keskustelu) 19. joulukuuta 2012 kello 20.08 (EET)[vastaa]
Muodostaako viisisarakkeisen ja monituhatrivisen taulukon koko teknisen esteen? Silloin sen voisi jakaa useammalle sivulle esim. käyntimäärien mukaan tai aakkosittain. Kerran tonniartikkeli, aina tonniartikkeli, joten listalta ei voisi koskaan pudota pois käyntimäärän perusteella. Mutta jos olisi mahdollista ylläpitää tietokantaa kunnossa olevista artikkeleista, ne voitaisiin jättää listasta automaattisesti pois, jolloin se lyhenisi ehkä puolella. Pelkkiin mallineisiin ei voi luottaa, sillä niitä on vain pienessä osassa huonoja artikkeleita. --Savir (keskustelu) 19. joulukuuta 2012 kello 20.16 (EET)[vastaa]
Tokihan lista voi olla tekstimuotoinenkin, jotta merkkimäärä pysyy pienenä. Silloin sarakkeet voidaan erottaa pilkuilla. --Savir (keskustelu) 19. joulukuuta 2012 kello 20.25 (EET)[vastaa]
Lähinnä mietin sitä, että onko siitä jotain iloa projektin kannalta, kun listassa on niin paljon artikkeleita että merkittävällä osalle ei vain ehdi tekemään mitään. Eli perimmiltään kai että onko projektin rajaus vähän turhan laaja? --Harriv (keskustelu) 19. joulukuuta 2012 kello 20.48 (EET)[vastaa]
Tämä on tonniartikkelien projekti. Mitä laajempi lista, sen useampi osallistuja löytää sieltä itselleen sopivia artikkeleita kohennettavaksi. Onhan pieni pensas tietysti helpompi tyhjentää marjoista kuin iso pensas, mutta isosta saa silti aina enemmän marjoja. Oikeastaan tämä ei olekaan projekti vaan ikuisuushanke. --Savir (keskustelu) 19. joulukuuta 2012 kello 21.10 (EET)[vastaa]
Periaatteessa jokainen Wikipedian artikkeli voi päätyä listalle :) --Harriv (keskustelu) 19. joulukuuta 2012 kello 21.16 (EET)[vastaa]
Harrvin ehdotus näyttää hyvältä, tykkään että olisi sekä maksimi että keskiarvo. Ṕitäisikö listauksista sulkea automaattisesti kaikki LA- ja ylempitasoiset artikkelit? --Pitke (keskustelu) 19. joulukuuta 2012 kello 21.24 (EET)[vastaa]

Mun mielestä Caprissa ei ole enää suuremmin vikaa. Toki historiaa pitäisi täydentää muinaisen rooman ja napoleonin välistä. --Tappinen (keskustelu) 16. joulukuuta 2012 kello 13.08 (EET)[vastaa]

Mainiota. Olisikohan paras käytäntö sellainen, että kaikki (osittainkin mutta silti merkittävästi) kohennellut tonniartikkelit lisättäisiin kohennettujen listaan, ja jos kohennettavaksi ehdotetusta artikkelista on tullut niin hyvä ettei se enää vaadi välitöntä huomiota, sen voisi samalla poistaa kohennettavien listalta? --Savir (keskustelu) 16. joulukuuta 2012 kello 13.19 (EET)[vastaa]
Erinomaista. Mielestäni näin vähäisillä lukukerroilla ei ole enää tarvetta erikoishuomioon kun on päästy näin hyvään tasoon. Täten myönnettäköön Tappiselle 1000 pistettä Capri-artikkelin vuoden lukuhuipun mukaan. --Pitke (keskustelu) 16. joulukuuta 2012 kello 19.32 (EET)[vastaa]

Päivitystä ?

[muokkaa wikitekstiä]

En löydä enää tuota kuukausityökalua. Käytin "luetuimmat 2016"-listaa sen sijaan. Lisäsin kommentteja viitteiden määristä, ja ryynimakkaran. --Tappinen (keskustelu) 8. huhtikuuta 2017 kello 08.17 (EEST)[vastaa]