Home > Information Retrieval > Kategorizace versus třídění

Kategorizace versus třídění

I když se to tak může zdát, pojmy kategorizace a klasifikace nejsou synonyma. Stejně jako pojmy kategorie a třída. Jejich společnou funkcí je organizace entit, zavedení řádu, resp. jeho formalizace.

Protože klasifikace má s kategorizací mnoho společného, bývají tyto pojmy často zaměňovány. Ve skutečnosti představují dva odlišné přístupy k organizaci objektů.

Třeba spontánně vytvářené štítky (tagy), např. u ad-hoc zvýrazněných výsledků vyhledávání – označené objekty neklasifikují, ale jenom kategorizují. Kategorizace rozděluje objekty do skupin jejichž členové v rámci daného kontextu sdílejí určité rozpoznatelné a společné vlastnosti.

Definice klasifikace / třídění

1.Uspořádání pojmů nebo jiných entit do tříd a dalších skupin (podtříd apod.) za účelem vyjádření jejich sémantických vztahů. Třídy a další skupiny jsou obvykle vyjádřeny notací.

2. Přidělování notací – znaků tříd – klasifikačního systému za účelem vyjádření obsahu dokumentu.

Zatímco hranice v klasifikačních schématech jsou předem dané a třídy v nich jsou exkluzivní – nepřekrývají se, rozostřené a neustále se měnící hranice mezi kategoriemi lépe odrážejí stav reálného světa.

Třídění je identifikace objektů s předem danou strukturou rozškatulkování. Na rozdíl od shlukování (clusteringu), kdy hledáme shluky v předem neznámé struktuře objektů. U shlukování ale hrozí nebezpečí umělého vnucování (naroubování) struktury.

Kategorizace je člověku mnohem bližší. Provádíme jí každodenně. Kategorizace je proces poznávání, který nám pomáhá zviditelnit poznání vůči okolnímu chaosu reality – a činit ji tak kognitivně zpracovatelnou.

Definice kategorizace

Klasický aristotelovský pohled říká, že kategorie jsou samostatné entity charakterizované sadou vlastností, které sdílejí její členové.

V analytické filosofii, tyto vlastnosti jsou předpokladem k založení podmínky, která je nezbytná a dostatečná k pochopení smyslu.

Aristoteles rovněž aplikuje klasické kategorizační schéma ve svém přístupu k životu otázkami typu: Je to živočich anebo rostlina? Má to peří nebo srst?

Ve  svém článku uvádí Jacob přehledné srovnání kategorizace a klasifikace.

KATEGORIZACE

KLASIFIKACE

PROCES

Kreativní syntéza entit založená na kontextu nebo vnímané podobnosti

Systematické uspořádání entit založené na analýze nutných a dostatečných charakteristik

HRANICE

Hranice jsou rozostřené:

Členství ve skupinách je nezávazné

Hranice jsou pevné:

Třídy jsou exkluzivní a nepřekrývají se

ČLENSTVÍ

Flexibilní: Členství v kategoriích je založeno na obecné znalosti a/nebo aktuálním kontextu

Přísné: Entita buď je, nebo není členem určité třídy na základě jejího určení

KRITÉŔIA PRO PŘIŘAZENÍ

Kritéria mohou být závislá i nezávislá na kontextu.

Kritérii jsou předem určené postupy / principy

TYPIČNOST

Jednotliví členové mohou být řazeni podle typičnosti (odstupňovaná struktura)

Všichni členové jsou stejně reprezentativní (neodstupňovaná struktura)

STRUKTURA

Shluky entit, mohou tvořit hierarchickou strukturu

Hierarchická struktura fixních tříd

Závěrem dvě kontrolní otázky:

1) Kam patří tagging? Jedna se o kategorizaci anebo o třídění?

2) Jde v tomto článku o slepeckých holích skutečně o kategorizaci?

.
.

Související články:

Taxonomie: Tak blízko Bohu

Folksonomie: Tagovací dýchánek

Poručík Maury: Otec vyhledávačů a sociálních sítí

Treemap: Mapa stromu

Enterprise Search: Ne jenom vyhledávání

Jednotná verze čeho?

  1. No comments yet.
  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: