از دو دهه پیش توانایی بشر جهت تولید و گردآوری داده ها به طور فزاینده ای گسترش یافته است و به گونه ای مستمر و به شکلی خیره کننده بر حجم اطلاعات و دانش ذخیره شده افزوده می شود. این روند مستلزم فرآیند پیچیده تفکیک، ورود، ذخیره و استخراج به عنوان یک عامل اصلی و بی نقص و در عین سهولت و سرعت است و می تواند زمینه بهینه ای از دانش را فراهم سازد. پس عواملی نظیر استفاده از بارکد برای فرآورده های تجاری، کاربری رایانه در کسب و کار و پیشه، فنآوری علوم، خدمات و اطلاع رسانی دولتی، می تواند رابطه ای معنی دار و منطقی با تکنولوژی-از وسائل جمع آوری داده ها گرفته تا اسکن کردن متون و تصاویر تا سنجش از راه دور ماهواره ای-در داده پردازی داشته باشد. از این روی به طور مجمل باید گفت که کاربرد همگانی وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی، ما را به سوی انبوهی از داده ها سوق می دهد و به تبع آن رشد انفجاری در داده های ذخیره شده نیاز به تکنولوژی جدید و ابزار خودکار را موجب گردیده است...