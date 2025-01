Pubblichiamo a chiusura del 2024 una breve panoramica sull'uso del sito di PeaceLink. Da qualche anno abbiamo abbandonato Google Analytics, sostituito con una nostra installazione dedicata della piattaforma open-source Matomo, allo scopo di offrire ai nostri visitatori garanzie sul rispetto della loro privacy durante la navigazione del sito di PeaceLink. Al tempo stesso siamo estremamente stringenti nel filtrare richieste da “bot”, ovvero programmi che scaricano i contenuti del sito per scopi più o meno leciti, e quindi possiamo affermare con relativa confidenza che i dati mostrati in questa analisi corrispondano a visitatori reali e non virtuali.

Una novità importante, rispetto a resoconti simili pubblicati in passato, è l’attenzione che abbiamo dedicato quest’anno a comprendere come ChatGPT usi il sito di PeaceLink, e che trovate in fondo a questo articolo.

Page Views

Cominciamo dalla metrica più significativa, ovvero le pagine lette del sito, dove per pagina si intende l'articolo (e non le sue immagini o altre pagine accessorie).

Nel 2024 abbiamo avuto un ulteriore calo (17%), con una distribuzione mensile che riflette il calendario scolastico (il sito di PeaceLink è tradizionalmente visitato da studenti e insegnanti), e che in media si attesta intorno alle 50mila visite al mese.

Nel 2024, in media 1.5 azioni (lettura di pagine, download di documenti, ricerche interne) sono avvenute per ogni sessione di visita, e la durata della sessione è stata mediamente intorno al minuto (1 minuto e 10 secondi).

Provenienza

Il sito di PeaceLink esiste sin dagli albori di Internet e per questo motivo ha sempre avuto un'ottima visibilità sui motori di ricerca, rinforzata anche da tutta una serie di accorgimenti tecnici e redazionali che continuiamo a migliorare. La provenienza dei visitatori del sito è prevalentemente (68%) dai motori di ricerca, ma hanno avuto un leggero aumento negli accessi diretti (che possiamo attribuire a link condivisi direttamente in chat e simili applicazioni)

Considerando solo Google, nel corso del 2024 il sito di PeaceLink è apparso 14.1 milioni di volte tra i risultati di ricerca ed è stato cliccato 405mila volte, con un CTR (click-through rate) del 2.9%. peacelink.it è anche riconosciuto come sito di notizie e appare all’interno della sezione “news” della ricerca di Google. Nel 2024 è apparso 117mila volte, mediamente in posizione 12, ed è stato cliccato 4mila volte (CTR del 3.5%).

La visibilità di PeaceLink sui motori di ricerca si manifesta attraverso parole chiave che riflettono la nostra audience (studenti e attivisti nel mondo pacifista e ambientalista) con alcune sorprendenti eccezioni. Questo grafico mostra le parole chiave più cliccate su Google per quanto riguarda peacelink.it nel 2024.

Può essere interessante confrontare la “word cloud” delle ricerche generiche con quelle su Google News, che riflettono interessi più specifici.

Contenuti

L’uso del sito avviene prevalentemente da smartphone (58%).

La stragrande maggioranza dei visitatori (93.5% nel 2024) accede direttamente alle pagine interne e non all'homepage, che comunque resta la pagina complessivamente più visitata (con circa 49mila visite nel 2024)

A parte l'homepage, queste sono state le pagine più visitate nel 2024.

Si fanno notare la campagna contro i nuovi euromissili, pagine di cultura pacifista generale, il calendario, e alcuni articoli che hanno avuto particolare risonanza riguardo il coinvolgimento italiano nella fornitura di armi all’Ucraina.

Il sito di PeaceLink è organizzato in aree tematiche, raggruppate in macro-aree. Questa è la distribuzione degli articoli pubblicati nel 2024 al loro interno.

Nel 2024 sono stati complessivamente pubblicati 651 articoli, 621 eventi e 15 traduzioni.

Il numero di articoli pubblicati, e soprattutto gli eventi del calendario, sono in significativa crescita rispetto ai recenti anni.

ChatGPT

OpenAI ha addestrato i suoi modelli ChatGPT su contenuti massicciamente raccolti su Internet senza alcun permesso, né degli autori, né dei siti che li ospitavano. Da allora OpenAI ha gradualmente raggiunto accordi mirati con varie piattaforme editoriali per ottenere le liberatorie necessarie ad addestrare i propri modelli con contenuti altrui. I suoi bot continuano in ogni caso a rallestrare il web, e tra i siti che vengono usati come fonti c’è anche peacelink.it.

Come PeaceLink, abbiamo deciso di lasciare aperto il sito ai bot di OpenAI, preferendo “contaminare” i suoi modelli con i nostri contenuti piuttosto che restarne fuori, anche in vista di un probabile scenario futuro in cui i motori di ricerca tradizionali verranno sostituiti da AI.

Sebbene tutti i bot, inclusi quelli di OpenAI, vengono esclusi dalle statistiche di accesso di Matomo, abbiamo comunque cominciato, verso la fine del 2024, a tracciare per altre vie, per curiosità, come i bot di OpenAI usavano il sito di PeaceLink. Non abbiamo dati relativi a tutto il 2024, ma solo gli ultimi mesi, per cui riportiamo qui di seguito medie mensili o giornaliere relative al nostro periodo di osservazione.

OpenAI ha 3 bot:

GPTBot, usato per raccogliere contenuti allo scopo di addestrare i modelli.

OAI-SearchBot, per raccogliere contenuti da utilizzare per il motore di ricerca di ChatGPT.

ChatGPT-User, usato per rispondere alle conversazioni degli utenti. Quando un utente interagisce con il LLM, ChatGPT cerca, in tempo reale, contenuti aggiuntivi che possono servire a completare la risposta.

La stragrande maggioranza di visite (93.55%) è dovuta al bot di addestramento, che raccoglie in media 13,700 pagine al giorno. Per confronto, Googlebot (il bot indicizzatore di Google) passa in media 40,000 volte al giorno su peacelink.it.

L’addestramento di ChatGPT avviene con contenuti di tutto il sito. La pagina più spesso rastrellata è l’homepage (tutti i giorni), ma il bot ha spesso indicizzato gli eventi del calendario (1,500 volte al mese), le parole chiave (10,000 al mese), e le immagini presenti sul sito (15,000 al mese).



Il motore di ricerca di OpenAI indicizza gran parte del sito, incluse le sitemaps, in media un migliaio di pagine al giorno.

La parte più intrigante riguarda il cosiddetto RAG (Retrieval-Augmented Generation), ovvero quando ChatGPT prova in tempo reale a racimolare informazioni dalle sue fonti (incluso peacelink.it) mentre sta interagendo con un utente. Ciò avviene prevalentemente per argomenti di attualità, successivi ai contenuti su cui è stato addestrato il modello, o specialistici. In alcuni casi, le pagine di peacelink.it vengono usate più volte, segno che per qualche motivo sono state valutate come fonti rilevanti. In altre circostanze, ChatGPT passa dall’homepage di PeaceLink, forse pensando di trovare qualcosa di utile per la conversazione in cui è coinvolto.

Queste sono le top 20, le pagine più usate da ChatGPT in questi ultimi mesi nelle conversazioni con i suoi utenti. Troviamo alcune delle pagine che sono più popolari su Google (c’è da aspettarsi che ChatGPT stesso usi Google), ma troviamo anche alcune pagine specifiche di approfondimento curate da PeaceLink, segno di come il nostro lavoro editoriale di qualità sia in grado di avere un impatto anche nelle applicazioni moderne di intelligenza artificiale.