Archive

Archive for December, 2010

Nestrukturovaná data: Kolik jich je?

28/12/2010 13 comments

Už jste to slyšeli? Osmdesát až pětaosmdesát procent všech dat kolem nás je nestrukturovaných. Tedy jenom patnáct až dvacet procent dat sedí v pevně definovaných strukturách tabulek databází. Jednou se jako zdroj této informace uvádí Gartner, jindy IDC, Merrill Lynch nebo IBM.

Odkud se všechna ta čísla berou? A jak je prokázat?

Read more…

Analýza sentimentu: Barometr nálady

05/12/2010 Leave a comment

Počítačovému software to jde dobře s čísly a tvrdými daty vůbec. Bude se mu ale dařit u detekce nálad a pocitů? Analýza sentimentu je dnes součástí vyhledávacích enginů. Výběr zboží nebo dovolené se bez zelené a červené barvičky téměř neobejde. To platí i pro recenze knih, hudby nebo filmů. O hodnocení nálad dedikovaných internetových fór a diskusí ani nemluvě.

Read more…