|
Szöveges dokumentumok attribútumai A szövegbányászati rendszerek nyersanyagait, kiindulási alapjait szöveges dokumentumok képezik. A szöveges dokumentumok nemcsak, hogy strukturálatlan módon tárolják a szövegeket, hanem sok egyéb más jellemzővel is rendelkeznek, amelyek dokumentumról dokumentumra változhatnak. Ahhoz, hogy a szövegbányászat során a szöveges dokumentumokat egységesen és gördülékenyen tudjuk kezelni, át kell hidalni azokat a különbözőségeket, amelyek az egyes dokumentumok esetében adódhatnak. Szöveges dokumentumok esetében tehát tisztában kell lennünk azokkal a jellemzőkkel, attribútumokkal, amelyekkel egy tetszőleges szöveges dokumentum rendelkezhet. A legfonotsabb olyan attribútumok, amelyekkel egy dokumentum részletesen jellemezhető, az alábbiak.
|
|
|
(C) 2006 VÁZSONYI
Informatikai és Tanácsadó Kft. http://www.vazsonyi.hu http://www.vazsonyi.com Adószám: 13641023-2-03 E-mail: contact@vazsonyi.com |
|