Un formulario di statistica che potrebbe servire a un ingegnere informatico (dopo aver studiato la teoria ovviamente).
Versione Pdf
Versione TeX
“Applied Machine learning for web crawling”
Google ™ is considered the most used and effective web search engine of the last ten years. Its main task is web sites indexing through the page ranking system. Thing is that there are possibilities for a company to pay Google in order a query to return its website among the top ten results.
The system is clearly corrupted since results may be influenced by the fee payed by companies (or should i say Google’s customers?).
A solution? Machine learning!
Presentazione del progetto: “Apprendimento per rinforzo applicato allo spidering del web”
Il principale protagonista che oggigiorno si occupa di indicizzare i siti della rete e’ Google, una societa’ che permette, mediante il sistema del page ranking, di pagare una sorta di canone per comparire ai primi posti nei risultati di ricerca.
Il sistema e’corrotto poiche’ i risultati di una qualsiasi ricerca sono influenzati dal canone che i proprietari dei domini pagano a Google.
La soluzione? Machine learning…ovviamente.
La fine di un corso di studi solitamente lascia un ricordo legato alla didattica ma soprattutto al docente e ai suoi metodi di insegnamento, dai quali molto spesso si impara e raramente disimpara. Ho preso la possibilita’ che ha dato a noi studenti di esprimere un giudizio sul corso di Deontologia ed Etica della societa’ dell’informazione, DETI, come una buona occasione per dare un’ opinione personale che spero possa ritornare utile ai posteri. Avevo accolto il corso di DETI con grande entusiasmo nel mio piano di studi perche’ ero del parere che sarebbe stato importante per la completezza culturale di un ingegnere informatico.
Purtroppo, a fine corso appunto, non sono dello stesso parere per i motivi che cerchero’ di verbalizzare in questo documento.
Ho la netta sensazione che questo corso abbia avuto la pretesa di insegnare qualcosa di astratto e opinabile definito etica.
La stessa etica che ho appreso da personalita’ che tanto hanno fatto per diffondere il pensiero libero e l’etica informatica nel mondo, piuttosto che da docenti stipendiati.
Inoltre ritengo che sia il rapporto quotidiano con i nuovi media e con la tanto acclamata societa’ dell’informazione a permettermi di avere un’opinione inconfutabile sull’etica che questo corso voleva “insegnare”.
Il motivo fondamentale di questa mia lettera aperta e’ quello di denunciare le incongruenze etiche che Lei, Prof. Maggiolini, ha mostrato sin dal primo giorno del corso.
Criticare l’uso dei formati proprietari dalle ore 11:15 alle 13:30 e poi farne (ab)uso per tutto il resto della giornata mi e’ sembrata un’incongruenza etica.
Giustificare l’(ab)uso di cui sopra nominando Platone e i suoi problemi con la scrittura, mi e’ sembrata un’incongruenza etica.
Parlare di privacy e spedire mail con indirizzi in chiaro (ignorando l’esistenza di cio’ che tecnicamente e’ definito bcc) mi e’ sembrata un’incongruenza etica.
Ho notato inoltre un eccesso di pressapochismo, spesso di qualunquismo e meschinita’ anche in quegli studenti che hanno sbandierato la falce e il martello consci dei benefici che ne avrebbero tratto per le simpatie politiche.
Nonostante i poteri ufficiali che una istituzione come il Politecnico le ha conferito, non posso tacere di fronte al giudizio (insidacabile per carita’) di un docente poco attento nei confronti di quell’etica che pretende di insegnare a uno studente poco flessibile di fronte a quella stessa etica che, a detta di molti, ha gia’ capito.
Distinti Saluti
Milano, 2 Luglio 2005 Francesco Gadaleta

Nome ufficiale : AttyTheWalker dal tipico comportamento che il veicolo assume se all’interno di un’arena o una semplice stanza.
Descrizione:
Il progetto AttyTheWalker e’ composto da due sottoprogetti:
L’obiettivo da raggiungere era permettere al veicolo di aggirarsi all’interno di un’arena evitando ostacoli eventualmente presenti.
Requisiti: per compilare correttamente il codice sorgente si richiede l’installazione della libreria Gandalf, una libreria di calcolo numerico che consente l’utilizzo della memoria in modo ottimizzato oltre agli algoritmi standard per computer vision, reperibile su sourceforge.net.
Stato del progetto: il progetto e’ sicuramente da ottimizzare. L’implementazione del codice e’ molto spesso superficiale e ruba cicli di clock inutili non tanto nell’analisi delle immagini quanto nella generazione dei comandi di driving da spedire alla scheda di controllo per via seriale.
Allo stato attuale il software riesce a generare comandi tali da orientare il veicolo all’interno di un’arena, su pavimento a sfondo omogeneo e con buona luminosita’, requisito fondamentale della telecamera di cui e’ dotato.
Autori:
L’intero progetto e’ reperibile su sourceforge oppure http://attysoft.sourceforge.net.
Il progetto e’ stato terminato il 1 ottobre 2004 e pubblicato come tesi di laurea di I livello in Ingegneria Informatica presso il Politecnico di Milano.
Documentazione
Fotografie
Tutte (quasi) le foto relative al progetto sono reperibili qui
Video
Video girati durante le fasi piu’ … oscure della progettazione (video seri e non)
Qui
Video della prima versione di AttyTheWalker, comandata manualmente (via seriale), senza sensori ne’ telecamera
[old_version.avi]
Todos
Ogni suggerimento, commento o critica e’ ben accetto su francesco at gadaleta period org.