Archivio
ItaliaOra – statistiche in tempo reale sull’Italia
E’ nato da poco un nuovo sito di informazione statistica REALTIME! ItaliaOra.org fornisce dati in tempo reale basandosi su fonti (indicate) statistiche ufficiali. Il sito è parte del network RealTimeStatistic.

Personaggi e storia della statistica
John Aldrich, professore alla School of Social Science della UNiversity of Southampton, ha pubblicato una raccolta di personaggi e risorse utili per scoprire le origini e i “padri” della statistica. Il sito, in costante aggiornamento presenta i personaggi e i loro contributi allo sviluppo della probabilità e statistica dal 1650 ai giorni nostri.

Un’altra fonte interessante sulla storia della statistica: http://www.york.ac.uk/depts/maths/histstat/welcome.htm
I film più …
E’ notizia di questi giorni il record del film AVATAR come il maggior incasso di tutti i tempi. Però, l’incasso, ovvero il numero di biglietti moltiplicato per il costo del biglietto, è un’indicatore sufficientemente informativo? In altre parole, non sarebbe opportuno sapere “Quanti biglietti sono stati venduti per quel film?”. Oppure “Quante persone hanno visto quel film?”. Premesso che non ho idea di come sia possibile rilevare questi dati, premesso che è necessario distinguere tra film che ha incassato di più, film che ha generato il maggior numero di biglietti al cinema, film più visto (al cinema + noleggio + televisione + …), cercando sul web ho trovato ALLTIMEBOXOFFICE che stima alcuni di questi parametri.
Questa la classifica dei primi 30 film:
| Rank | Title (click to view) | Studio | Est. Tickets | Unadjusted Gross | Year^ |
| 1 | Gone with the Wind | MGM | 202,044,600 | $198,676,459 | 1939^ |
| 2 | Star Wars | Fox | 178,119,600 | $460,998,007 | 1977^ |
| 3 | The Sound of Music | Fox | 142,415,400 | $158,671,368 | 1965 |
| 4 | E.T.: The Extra-Terrestrial | Uni. | 141,854,300 | $435,110,554 | 1982^ |
| 5 | The Ten Commandments | Par. | 131,000,000 | $65,500,000 | 1956 |
| 6 | Titanic | Par. | 128,345,900 | $600,788,188 | 1997 |
| 7 | Jaws | Uni. | 128,078,800 | $260,000,000 | 1975 |
| 8 | Doctor Zhivago | MGM | 124,135,500 | $111,721,910 | 1965 |
| 9 | The Exorcist | WB | 110,568,700 | $232,671,011 | 1973^ |
| 10 | Snow White and the Seven Dwarfs | Dis. | 109,000,000 | $184,925,486 | 1937^ |
| 11 | 101 Dalmatians | Dis. | 99,917,300 | $144,880,014 | 1961^ |
| 12 | The Empire Strikes Back | Fox | 98,180,600 | $290,475,067 | 1980^ |
| 13 | Ben-Hur | MGM | 98,000,000 | $74,000,000 | 1959 |
| 14 | Return of the Jedi | Fox | 94,059,400 | $309,306,177 | 1983^ |
| 15 | The Sting | Uni. | 89,142,900 | $156,000,000 | 1973 |
| 16 | Raiders of the Lost Ark | Par. | 88,141,900 | $242,374,454 | 1981^ |
| 17 | Jurassic Park | Uni. | 86,205,800 | $357,067,947 | 1993 |
| 18 | The Graduate | AVCO | 85,571,400 | $104,901,839 | 1967^ |
| 19 | Star Wars: Episode I – The Phantom Menace | Fox | 84,825,800 | $431,088,301 | 1999 |
| 20 | Fantasia | Dis. | 83,043,500 | $76,408,097 | 1941^ |
| 21 | The Godfather | Par. | 78,922,600 | $134,966,411 | 1972^ |
| 22 | Forrest Gump | Par. | 78,545,600 | $329,694,499 | 1994 |
| 23 | Mary Poppins | Dis. | 78,181,800 | $102,272,727 | 1964^ |
| 24 | The Lion King | BV | 77,231,800 | $328,541,776 | 1994^ |
| 25 | Grease | Par. | 76,921,800 | $188,389,888 | 1978^ |
| 26 | Avatar | Fox | 76,421,400 | $554,981,691 | 2009 |
| 27 | Thunderball | UA | 74,800,000 | $63,595,658 | 1965 |
| 28 | The Dark Knight | WB | 74,282,100 | $533,345,358 | 2008 |
| 29 | The Jungle Book | Dis. | 73,679,900 | $141,843,612 | 1967^ |
| 30 | Sleeping Beauty | Dis. | 72,676,100 | $51,600,000 | 1959^ |
Sul sito è disponibile un tool per aggiustare l’incasso per il valore corrispondente in dollari per gli ultimi 100 anni. (fonte: http://www.boxofficemojo.com )
Statistiche su Internet 2009
Dal sito teachreaders.com un articolo con i principali indicatori sull’utilizzo di internet nel 2009.
- 90 trillion – Emails sent On the Internet in the year 2009
- 247 billion – Average number of email/day.
- 1.4 billion – Email users worldwide.
- 100 million – Number of email users added to previous year.
- 81% – Spam emails.
- 92% – Peak spam levels late in 2009.
- 24% – Increase in spam since 2009.
- 200 billion – Spam emails/day (assuming 81% Spam).
Websites
- 234 million –Number of websites as of December 2009.
- 47 million – Added websites in 2009.
Web Servers
- 13.9% – The growth of Apache websites in 2009.
- -22.1% – The growth of IIS websites in 2009.
- 35.0% – The growth of Google GFE websites in 2009.
- 384.4% – The growth of Nginx websites in 2009.
- -72.4% – The growth of Lighttpd websites in 2009.
Domain Names at the end of 2009
- .COM Domains: 81.8 million
- .Net Domains: 12.3 million
- .ORG Domains: 7.8 million
- Country Code Top-Level Domains i.e. .PK, .UK, .DE, .IN: 76.3 million
- All Top-Level Domains as of Oct. 2009: 187 million
- Increase in Domain Names: 8%
Internet Users
- Worldwide Internet Users as on Sept. 2009: 1,73 billion
- Increase in Internet Users since Previous Year: 18%
Continent-wise Internet Users
- Asia: 738,257,230 Users
- Europe: 418,029,796 Users
- North America: 252,908,000 Users
- Latin America / Caribbean: 179,031,479 Users
- Africa: 67,371,700 Users
- Middle East: 57,425,046 Users
- Oceania / Australia: 20,970,490 Users
Social Media
- Number of Blogs: 126 million
- Social Network Websites (more women than men): 84%
- Numbers of Tweets on Twitter/Day as of Nov. 2009: 27.3 million
- Twitter Users in USA: 50%
- Facebook Users: 350 million
- Number of Facebook Login Everyday: 50% (175 Million)
- Active Facebook Apps: 500,000
Images
- Images Hosted on Flickr as of Oct. 2009: 4 billion
- Images Uploaded each Month on Facebook: 2.5 billion
- Number of Images Uploaded on Facebook/Year: 30 billion
Videos
- Videos on Youtube: 1 billion
- Videos viewed per month as of Nov. 2009: 12.2 billion
- Videos viewed/ month on Hulu in US as of Nov. 2009: 924 million
- Average Video/Internet User in a month: 182 (USA)
- Internet Users Who View Online Videos: 82% (USA)
- Youtube Online Video Market Share (USA): 39.4%
- Youtube Videos on Blogs: 81.9%
Malicious Software
- Number of Zombie Computers Created per Day: 148,000
- Malicious Code Threats (viruses, Trojans, etc.) at the Start of 2009: 2.6 million
- Malicious Code Signatures Added by Symantec in Fourth Quarter of 2009: 921,143
Data sources: Website and web server stats from Netcraft. Domain name stats from Verisign andWebhosting.info. Internet user stats from Internet World Stats. Web browser stats from Net Applications. Email stats from Radicati Group. Spam stats from McAfee. Malware stats from Symantec(and here) and McAfee. Online video stats from Comscore and YouTube. Photo stats from Flickr andFacebook. Social media stats from BlogPulse, Pingdom (here and here), Twittercounter, Facebook,Sysomos and GigaOm.
“TUTTI” è la parola più usata nei discorsi …
… dei Presidenti della Repubblica! Dal 1949, la parola “tutti” è stata utilizzata 448 volte nei discorsi dei vari Presidenti. Repubblica.it, riprendendo dati dal Quirinale e elaborandoli con wordle, in attesa nel discorso di Napolitano, propone un’interessante statistica delle parole più utilizzate. Dal sito è possibile consultare tutti i discorsi ed elaborarli per ogni Presidente (fonte: http://www.repubblica.it). Queste le parole più usate:
| PAROLA | FREQUENZA |
| TUTTI | 448 |
| POPOLO | 321 |
| PACE | 228 |
| ANNO | 196 |
| PAESE | 175 |
| ITALIANO | 174 |
| STATO | 161 |
| GIOVANI | 116 |
| NOI | 116 |
| POLITICA | 115 |
Raccolta blog su R
Eureqa – software per trovare …
Eureqa è un software sviluppato da CCSL (Cornell Computational Synthesis Laboratory) e permette di trovare le equazioni che descrivono relazioni tra dati. Il programma è in inglese, scaricabile gratuitamente, offre una guida (inglese) ed ha un gruppo di discussione. Il video di presentazione illustra le principali funzioni e potenzialità.
Prima parte:
seconda parte:
Analisi dati GoogleTrends con R
“RGoogleTrends” è un package per scaricare direttamente da R i dati di GoogleTrends. In questo modo non è necessario scaricarli manualmente. Per chi non conosce GoogleTrends qui la presentazione.
fonte: