L’aggregorroico
19 October 2007 | 3 CommentiOggi, in autobus, stavo pensando a quante informazioni inutili passano dal mio aggregatore (che per la cronaca è Google Reader). In gergo tecnico si chiama Information Overload (o sovraccarico cognitivo), ovvero quell’eccesso di informazioni che ti impediscono di concentrare l’attenzione su informazioni davvero rilevanti.
Nel mio aggregatore conto 279 feed RSS, suddivisi tra blog personali e blog/siti tematici. In realtà ne avevo molti di più, ma ho dovuto sfoltire a causa dell’enorme quantità di “fuffa” che mi tocca macinare ogni giorno. Il fatto è che anche i blog meno utili ogni tanto fanno uscire dei post interessanti. Mi sembra assurdo però doversi sorbire kb e kb di informazioni inutili, solo per qualche sporadico, se pur utile post. Ad un certo punto però dici basta e fai pulizia nell’agregatore, cosciente che di lì prima o poi ci sarebbe passato qualcosa di interessante.
Pensavo a come risolvere il problema e mi sono venute in mente diverse soluzioni. La più plausibile, se pur ancora non esistente (almeno credo) è quella dell’ “aggregatore semantico autodidatta”, un sistema realizzabile senza neanche grossi problemi..
Per capire a cosa mi riferisco pensate ad un aggregatore in cui buttate dentro tutti i feed che volete, ma che è in grado di selezionarli per voi sulla base dei vostri gusti/preferenze. Come si realizza tutto ciò? Prendete Google Reader e la stellina con la quale selezionate i post etichettandoli come “preferiti”. Aggiungendo una stellina al post non fate altro che creare una copia di quel post in una cartella chiamata appunto preferiti, ma cosa succederebbe se invece con questa operazione al sistema venisse detto di prendere le keyword di quell’articolo (e non mi riferisco solo ai tag) e buttarle in un database? Avremmo la possibilità in questo modo di crearci un archivio pieno di keyword che descrivono i nostri gusti. L’aggregatore non dovrebbe far altro che selezionare dal nuovo articolo le sue keyword e confrontarle con quelle presenti nel database, decidendo così se è il caso di proporlo o di metterlo in una “coda degli esclusi” che potremmo comunque andare a visitare. Bisognerebbe solo definire qual’è il numero (e la qualità) delle keyword necessarie per rendere un articolo valido o inutile.
L’autoapprendimento è proprio questo. Nel giro di pochi mesi il sistema si affinerebbe abbastanza da riuscire a sfruttare una funzione che non solo confronta il numero di keyword rilevanti del nuovo articolo con quelle presenti nel database, ma che agisce anche sulla base della qualità della ricerca, ovvero sulle keyword più importanti presenti nel database. Se selezioniamo infatti molto più spesso articoli che parlano di “cavoli” il database traccerà anche il numero di volte che gli è stato detto di memorizzare la parola “cavoli” in modo da permettere anche un’analisi qualitativa. A quel punto la parola “cavoli” sarà molto più importante della parola “carote” (ad esempio), anche se “carote” è una cosa che ritengo comunque interessante.
Insomma sto solo pensando a come vorrei che fosse costruito il mio aggregatore, una cosa in grado di selezionare per me quali sono gli articoli più rilevanti escludendo la cosiddetta “fuffa”. Così facendo non mi dovrei preoccupare di dover leggere i titoli di migliaia di post al giorno per capire quali sono quelli interessanti e quali quelli da escludere.
Capisco, avendoli già affrontati in passato, che far ragionare semanticamente un software non è cosa facile, ma ci si sta avvicinando anche grazie all’applicazione in questo campo della logica fuzzy. Gli utenti Apple che conoscono Devon Think, sanno che molti di questi criteri sono già sfruttati intelligentemente. Allora perché non usarli per risolvere problemi come quello dell’Information Overload? Sarebbero dei piccoli passi che avvicinerebbero, finalmente, il freddo mondo dei calcolatori alla logica umana…anche se con molti limiti.





bravo, io sull’autobus dormo… e tu invece una ne pensi e cento ne scrivi!
)
Il punto è che ogni utente dovrebbe istruire il proprio aggregatore prima che questo funzioni da solo selezionando i giusti articoli…
Inoltre i gusti cambiano nel tempo e con essi le parole più comuni che l’aggregatore dovrebbe selezionare quindi o si accetta che questo nel tempo sbagli oppure ci deve essere un istruzione continuativa nel tempo da parte dell’utente
Insomma alla fine sarebbe sempre l’utente a dover selezionare gli articoli ricavandone un beneficio minimo.
perchè? ci sono già programmi che imparano costantemente. Il fatto di selezionare gli articoli più vicini ai propri gusti, sempre, permetterebbe di tenere costantemente aggiornato il sistema. Avendo la possibilità di guardare anche tra gli articoli che il sistema ha scartato e selezionando anche da li’ eventuali articoli interessanti, non si fa altro che (nel tempo) seguire i gusti dell’utente affinando i risultati.
Cmq la mia è un’idea di massima. Quello su cui volevo puntare non è la struttura informatica in se, ma sul concetto. Che poi sia fatto in un modo piuttosto che in un altro, non mi interessa tantissimo