Szövegbányászat cikksorozat
Bevezetés - Mi a szövegbányászat?
A szövegbányászat kialakulását motiváló tényezők
A szövegbányászat üzleti haszna
Szöveges dokumentumok attribútumai
Sztring hasonlósági metrikák
Szótövezés
Stopszó eliminálás
Optikai karakterfelismerés
Automatikus kulcsszó kigyűjtés
Automatikus nyelvdetekció
Korpusz egyedi szavainak (lexikon) kinyerése
Egyedi szó súlyozási technikák
A vektortér modell
Mélyszemantikájú indexelés (latent semantic indexing)
Valószínűségi modellek
Index tárolási módszerek
Dokumentum klaszterizációs módszerek
Szöveges információ visszakeresés
Spektrális szövegbányászat
Nevesített entitás felismerés
Újdonság detekció szöveges korpuszokban
Szövegbányászat az Interneten (web bányászat)
Typogenetika
 
     
 
 
     
 

Ajánlott szövegbányászat oldalak

 
 

 

 

Üdvözlöm!

A szövegbányászat témájú nemzetközi irodalom rövid idő leforgása alatt már óriásira nötte ki magát, mialatt a vonatkozó magyar nyelvű szakirodalmi anyagok csak csekély mértékben szaporodtak. Munkámmal ezt a hiányt igyekeztem megszüntetni, és jelen cikksorozatommal egy olyan átfogó és ugyanakkor kellően a részletekben elmélyedő áttekintést szolgáltatni, amely lefedi a szövegbányászat legfontosabb ismereteit, alkalmazási területeit, módszereit, kihívásait, ezáltal ellátva ismeretterjesztési célját. A mesterséges intelligencia módszerek szövegbányászat területén történő alkalmazása egy olyan húzóágazat lehet Magyarország számára, amely egyrészt igaz, hogy igen tudásintenzív terület, de ugyanakkor kevés tőkebefektetéssel magas özleti hozzáadott értéket képes létrehozni. Hazánknak az ilyen innovatív, kevésbé nyersanyag, hanem inkább tudásigényes területekre ajánlott specializálódnia a nemzetközi versenybenmaradás érdekében. A cikksorozat nem egy hasonló idegen nyelvű cikksorozat egy-az-egyben elvégzett fordítása, hanem saját válogatás a legfrisebb szövegbányászati eredményekből, sok helyen saját kutatási eredményeim közlésével. Az általam karbantartott magyar nyelvű, szövegbányászat témájú honlapok folyamatosan friss információkkal látják el az érdeklődőket az Interneten:

Lehetőségem volt Fulbright és az eMagyarország ösztöndíjakkal az Egyesült Államok egyik legkiválóbb szövegbányászati kutatóintézetében egy évig kutatóként az ottani szellemi műhely munkájába bekapcsolódni (Carnegi Mellon Egyetem, Center for Automated Learning and Discovery). Szövegbányászat témájú kutatási eredményeim nagy részét ott sikerült elérnem. Emellett a Budapesti Műszaki és Gazdaságtudományi Egyetemen működő Szövegbányászat Kutatócsoport vezetőjeként egy folyamatosan aktív kutatási környezetben a hazai szövegbányászat célú kutatások vezető szellemi műhelyét menedzselem. Üzleti tevékenységem során cégemen keresztül állok rendelkezésre a szövegbányászati kihívások professzionális megoldására: VÁZSONYI Informatikai és Tanácsadó Kft. (http://www.vazsonyi.com, illetve http://www.vazsonyi.hu). Nemzetközi gyakorlati és elméleti tapasztalataimra építve felsőoktatási tevékenységet is végzem. A honlap látogatóit bátorítom arra, hogy szövegbányászat tárgyú kérdéseikkel nyugodtan keressenek meg e-mailben: miklos@vazsonyi.com.  Bízom benne, hogy cikksorozat nagymértékben gazdagítja, illetve megalapozza a szövegbányászattal kapcsolatos ismereteiket.

Vázsonyi Miklós

VÁZSONYI Informatikai és Tanácsadó Kft
http://www.vazsonyi.com http://www.vazsonyi.hu
ügyvezető igazgató

BME Információ- és Tudásmenedzsment Tanszék
http://www.itm.bme.hu http://www.itm.bme.hu/textlab
egyetemi tanársegéd


(C) 2006 VÁZSONYI Informatikai és Tanácsadó Kft.
http://www.vazsonyi.hu http://www.vazsonyi.com
Adószám: 13641023-2-03
E-mail: contact@vazsonyi.com