Szövegbányászat cikksorozat
Bevezetés - Mi a szövegbányászat?
A szövegbányászat kialakulását motiváló tényezők
A szövegbányászat üzleti haszna
Szöveges dokumentumok attribútumai
Sztring hasonlósági metrikák
Szótövezés
Stopszó eliminálás
Optikai karakterfelismerés
Automatikus kulcsszó kigyűjtés
Automatikus nyelvdetekció
Korpusz egyedi szavainak (lexikon) kinyerése
Egyedi szó súlyozási technikák
A vektortér modell
Mélyszemantikájú indexelés (latent semantic indexing)
Valószínűségi modellek
Index tárolási módszerek
Dokumentum klaszterizációs módszerek
Szöveges információ visszakeresés
Spektrális szövegbányászat
Nevesített entitás felismerés
Újdonság detekció szöveges korpuszokban
Szövegbányászat az Interneten (web bányászat)
Typogenetika
 
     
 
 
     
 

Ajánlott szövegbányászat oldalak

 
 

 

 

A szövegbányászat üzleti haszna

A szövegbányászat elsősorban az üzleti életben kerül előtérbe a figyelem középpontjába. Az üzleti szférán kívül természetesen a kutatásban és az akadémiai intézetekben, könyvtárakban, és egyéb nonprofit szervezeteknél is van gyakorlati haszna a szövegbányászati rendszereknek, azonban a kiélezett üzleti versenyhelyzetben, amit korunk telített és igen rugalmas piaci körülményei diktálnak, az üzlei életben egyenses nélkülözhetetlenné válik. A tanuló szervezet koncepciója alapján az az üzleti entitás, amely kis reakcióidő mellet, tehát gyorsan képes adaptálódni, alkalmazkodni a folyamatosan és turbulensen változó üzleti és piaci környezethez, annak túlélési és hosszú távú nyereségrealizálási potenciálja nagyobb lesz, mint azoké az üzleti szervezeteké, akik kellően pontos és mély tudás üzleti tudás hiányában lassabban képesek reagálni a környezetük változásaira. A folyamatos ismeretkinyerés az óriási sebességgel keletkező szöveges adatállományokból emberi erőforrás igényevételével kivitelezhetetlen. A gépi intelligencia és számítási kapacitás elérte azt a szintet, hogy képes a tömeges szöveges állományok gyors feldolgozására, és azokból korlátozott mértékű ismeret kinyerésére. A szövegbányászat olyan ismeretekkel és információkkal képes ellátni az őt alkalmazó üzleti szervezetet, amely információk birtokába nem jutnak azok a vállalatok, amelyek nem alkalmaznak szövegbányászati rendszereket, vagy netán az ekvivalens feladatokat emberi erővel tervezik megoldani.

Belátható módon egy-egy nagyvállalat intranetje esetében a teljes vállalati dokumentum állomány akkora mennyiségű információt rejt magában szöveges és alapvetően strukturálatlan dokumentumok formájában, amit ember nem képes szintetizáltan átlátni és nyilvántartani. Ekkora adatállományból az ismeretkinyerés már csak gépi intelligencia használatával oldható meg. A vállalati dokumentumok pedig igen fontos információkat tartalmazhatnak egy-egy termékre, szolgáltatásra, a piacra, fogyasztókra, versenytársakra, stb. vonatkozóan. Azoka az üzleti szervezetek, amelyek ezt az ismeretanyagot kellően hatékonyan és gyorsan fel tudják használni üzleti opertaív tevékenységeik során, azok üzleti előnyre tehetnek szert versenytársaikkal szemben.

Hasonlóképpen az Internet is az ismeretek kimeríthetetlen tárháza. Az Interneten olyan üzleti tudásanyag is megjelenhet, amelyet emberi böngészés útján reménytelen lenne összegyűjteni, csoportosítani, rendszerezni, és a fontos elemeket kinyerni. Gépi intelligenciával, online szövegbányászati rendszerek használatával azonban egy-egy vállalat az Interneten tárolt ismeretanyag birtokába is juthat. Ilyen ismeretanyag lehet például a konkurrenciáról szóló média információk, fogyasztók viselkedésének és elégedettségének monitorozása, célzott hírfigyelés, szabályozási környezet változásainak figyelése, stb.

A szövegbányászati alkalmazások használata alapvetően kettős üzleti előnnyel jár. Egyrészt nő az az ismeretanyag, amelyhez a vállalat hozzá tud férni, és nő az ismeret különböző aspektusainak lekérdezését biztosító keretrendszer rugalmassáa, lehetőségeinek száma. Másrészről a szövegbányászat alkalmazásával a kritikus információkhoz a vállalatok gyorsabban jutnak hozzá, mint egyébként, így csökkentve ezáltal reakcióidejüket, és az információ keresésre és ismeret kinyerésre feláldozott idejüket. Az idő szűk keresztmetszet, így kiemelten fontos, hogy egy versenyelőnyt megszerezni szándékozó vállalat az ismereteket gyorsabban elő tudja állítani.

Tudásmenedzsment nézőpontból a szövegbányászat a kodifikálható tudásanyaghoz történő hatékonyabb hozzáférést, és annak több célú feldolgozását teszi lehetővé. A tudástőke a vállalati érték egy jelentős hányadát kitevő immateriális jószág. Ezen tudástőke egy része látens módon a vállalat strukturálatlan szöveges dokumentumaiban lelhető fel, azonban ennek a tudástőkének a felszínre hozásához és kitermeléséhez hatékony szövegbányászati módszerek szükségesek.

Vázsonyi Miklós


(C) 2006 VÁZSONYI Informatikai és Tanácsadó Kft.
http://www.vazsonyi.hu http://www.vazsonyi.com
Adószám: 13641023-2-03
E-mail: contact@vazsonyi.com