çalışmaları metni veri kaynağı olarak kabul eden veri madenciliği (ing. data mining) çalışmasıdır diğer bir tanımla metin üzerinden yapısallaştırılmış veri elde etmeyi amaçlar. Örneğin metinlerin sınıflandırılması, bölütlenmesi (ing. clustering), metinlerden konu çıkarılması (ing. concept/entity extraction), sınıf taneciklerinin üretilmesi (ing. production of granular taxonomy), duygusal analiz (ing. sentimental analysis), metin özetleme (ing. document summarization), varlık ilişki modellemesi (ing. entity relationship modelling) gibi çalışmaları hedefler.
Yukarıdaki hedeflere ulaşılması için metin madenciliği çalışmaları kapsamında enformasyon getirimi (information retrieval), hece analizi (lexical analysis), kelime frekans dağılımı (ing. Word requency distribution), örüntü tanıma (ing. pattern recognition), etiketleme (ing. tagging), enformasyon çıkarımı (ing. information extraction), veri madenciliği (ing. data mining) ve hatta görselleştirme (ing. visualization) gibi yöntemleri kullanmaktadır.