Forumleden Top 10 ..

  • 14 november 2016
  • 41 reacties
  • 3879 x bekeken

Eindelijk tijd gevonden om dit bericht te plaatsen

Uit Forumleden top 10 ....

Misschien toch een keer tijd om het eens andersom te tonen? durven jullie dat aan?

Nadat Ben deze "uitnodiging" aan de forumleden deed over hoeveel reacties zij plaatsten, heb ik een programma gemaakt om die gegevens van het forum te halen.

Begonnen te testen op een eenvoudig topic (minder dan 25 reacties, dus één pagina). Uit de HTML-tekst is met wat zoeken de naam en het tijdstip van de plaatsing van elke reactie te halen. Daarbij die reacties die buiten de gezochten periode vallen, niet gebruiken. Dan is er een lijst met namen en datum+tijd.
De volgende stap is: uitbreiden naar een topic met veel reacties (diverse pagina's). Voor langlopende topics is het hierbij van belang een criterium te vinden om na te oude reacties (van vóór de gevraagde periode) de zoektocht te stoppen.
Dit bovenstaande moet voor alle topics in één rubriek worden gedaan, waarbij topics met een startdatum na de periode, of een laatste reactie datum van vóór de periode buiten beschouwing kunnen worden gelaten.
Dan alles herhalen voor de andere rubrieken. Er is dan een lange lijst met plaatsingsdata en auteursnamen. Om het aantal reacties per auteur te krijgen: sorteren op naam en dan tellen hoe vaak elke naam voorkomt.
Om deze resultaten te krijgen, is wel het lezen van flink wat bits nodig, b.v. voor september 380Mb, en dit kost bijna een uur om 3300 pagina's van het forum in te lezen.
Dit levert voor de maanden augustus, september en oktober de volgende top (gesorteerd op het totaal over drie maanden (alleen meer dan 50 in de lijst) en de moderatoren apart).


Er zijn nog meer gegevens uit deze lijst te halen, b.v. leden die in een maand maar één bericht hebben geplaatst. In oktober waren dit er 436 van de 1008 unieke namen.
Er zijn kleine verschillen (max 7) voor de moderatoren in het top 10 moderatoren topic en deze gegevens omdat de eerst genoemde telt op een willekeurig tijdstip op dag 1, en dit programma van middernacht tot middernacht. Alleen voor Jolien is het verschil groter, maar na een tijdje zoeken blijkt dat aan de Goldmembers Lounge te liggen. Die kan mijn programma door de beveiliging niet lezen.
Er zijn uit deze gegevens nog meer leuke gegevens te halen, daar komt nog een vervolg voor.

41 reacties

Reputatie 6
Badge +5
Super leuk om te zien WhTurner!
We zijn echt blij met je dat je zo veel data kan verzamelen en er altijd een mooi overzicht van kan maken.
Ziet er goed uit zeg! 🙂
cool 🆒
Reputatie 5
Badge +4
Wauw! Wat zal dat een werk geweest zijn!
Super leuk om te zien :):)
Reputatie 5
Badge +3
Dat moet i.d.d.een hele klus geweest zijn!

Aanvulling op het startbericht en een erratum: de genoemde 380 Mb moeten 380 MB (megabtye) zijn.

Uit de gemaakte database kan b.v. een overzicht per dag gemaakt worden, hieronder voor de maand oktober.



Ook kan een overzicht van de verdeling over de dag worden gemaakt. ook uitgesplitst naar weekend en werkdagen. Omdat dit over een verschillend aantal dagen gaat, heb ik het aantal geplaatste reacties gemiddeld over het aantal dagen, zodat in de grafieken het gemiddelde aantal reacties over de maanden augustus tot en met oktober in een klokuur zijn uitgezet



Reputatie 7
Badge +5
Ik zie een patroon WhTurner, erg opvallend zo met je grafieken.
Reputatie 5
Badge +3
Klopt, bij mij na 16.00 en wat meer in het weekend waarbij zondag nog iets meer.
Want de schoorsteen moet natuurlijk wel blijven roken#werken;)
Reputatie 5
Badge +4
Wauw! Wat moet dit een werk geweest zijn.
Super interessant om te zien. Ik heb dit ook even doorgestuurd naar iemand uit het team die helemaal in de statistieken en rapportages zit. Die vindt dit denk ik ook heel interessant!
Reputatie 6
Badge +5
Wow! Dat zijn zeker interessante statistieken en heel mooi weergegeven hier in overzichtelijke grafieken.
Daar mag je zeker wel trots op zijn.
Leuk om te zien 🙂
Reputatie 5
Badge +3
Dat ziet er goed uit 😃 Hoeveel tijd heb je erin gestoken?
Dat ziet er goed uit 😃 Hoeveel tijd heb je erin gestoken?
Als ik er continue aan gewerkt zou hebben, een dag of twee. De meeste tijd gaat zitten in het controleren of het automatisch ophalen en sorteren overeenkomt met wat je ziet als het handmatig zou worden gedaan.
Ook het vinden van de juiste "woorden" in de HTML, waarop de verschillende berichten worden gescheiden, heeft een tijdje geduurd.
Nu het draait, loopt het ophalen van een maand aan gegevens een klein uur maar automatisch..
Het genereren van de grafieken gaat nu in enkele seconden.
Reputatie 4
Badge +3
Dat ziet er goed uit 😃 Hoeveel tijd heb je erin gestoken?
Als ik er continue aan gewerkt zou hebben, een dag of twee. De meeste tijd gaat zitten in het controleren of het automatisch ophalen en sorteren overeenkomt met wat je ziet als het handmatig zou worden gedaan.
Ook het vinden van de juiste "woorden" in de HTML, waarop de verschillende berichten worden gescheiden, heeft een tijdje geduurd.
Nu het draait, loopt het ophalen van een maand aan gegevens een klein uur maar automatisch..
Het genereren van de grafieken gaat nu in enkele seconden.

Hier neem ik mijn spreekwoordelijke hoed diep voor af! Echt top 🙂
Hierbij de tabel voor de maanden augustus tot en met november, gesorteerd op totaal (en groter dan 60)



Voor de grafieken moet ik nog even kijken welke het interessantste zijn, die komen nog
Reputatie 4
Badge +3
xsjlo gaat lekker zeg!
Badge +4
Zeker! Hopelijk gaat hij nog even door! 😉
Reputatie 4
Badge +3
Zeker! Hopelijk gaat hij nog even door! ;)
Ik hoop het ook! 😃
Hierbij de volgende grafieken:
  1. verdeling over de maand
  2. gemiddelde over de dag voor werkdagen
  3. gemiddelde over de dag voor weekenddagen



Reputatie 4
Badge +3
Ze blijven maar komen, die grafieken :D

Heel interessant om te zien!
Hierbij wat gegevens voor december




Vanwege de hoge piek op 31 december een plaatje van de dag gegervens van 30 en 31 december



En de twee plaatjes voor werkdagen en niet werkdagen


Reputatie 7
Badge +4
Duidelijk dat moderators niet 24/7 in shifts werken 🙂
Reputatie 4
Badge +3
Duidelijk dat moderators niet 24/7 in shifts werken :)

Ja onze werktijden zijn goed af te lezen haha 😉
Reputatie 5
Badge +3
Haha, inderdaad. Wel weer heel leuk om te zien! 😃
Reputatie 6
Badge +5
Maar dan is een goede vraag... zou er 24 uur moderatie moeten zijn? Als ik het zo zie, is er tussen 00.00u en 07.00u nauwelijks activiteit.
Misschien alleen om te checken of er niks gerapporteerd wordt? Ik denk dat dat ook in de ochtend zou kunnen worden opgepakt.
Of is het wenselijk dat we hier 24/7 aanwezig zouden zijn? Wat denken jullie?
Reputatie 7
Badge +4
In deze 24 uurs economie is het een goed idee er altijd te zijn. Misschien in combinatie met Facebook/twitter medewerkers?
https://www.klm.com/travel/nl_nl/plan_and_book/klm_on_social_media/24_7_service_and_assistance/index.htm
Badge
24/7 Support klinkt natuurlijk heel interessant, misschien dat dit voor minder wachtende mensen voor de winkel zorgt op de vroege ochtend. :8 #scheeltmijweerwerk
Reputatie 6
Badge +5
Hey mikehoppezak,
Leuk om een berichtje van je te zien. Gaaf dat je werkt in de winkel in Rotterdam!
Hoe ben je hier terecht gekomen eigenlijk? Heb je verder dingen gezien hier op het forum wat je interessant vindt?
We horen graag meer van je 🙂
Groet, Ben

Reageer