عنوان مقاله : داده کاوی در بانک اطلاعاتی
قالب بندی : word 2003
قیمت : رایگان
شرح مختصر : امروزه با گسترش سيستم هاي پايگاهي و حجم بالاي داده ها ي ذخيره شده در اين سيستم ها، نياز به ابزاري است تا بتوان داده هاي ذخيره شده پردازش کرد و اطلاعات حاصل از اين پردازش را در اختيار کاربران قرار داد. با استفاده ار پرسش هاي ساده درSQL و ابزارهاي گوناگون گزارش گيري معمولي، مي توان اطلاعاتي را در اختيار کاربران قرار داد تا بتوانند به نتيجه گيري در مورد داده ها و روابط منطقي ميان آنها بپردازند اما وقتي که حجم داده ها بالا باشد، کاربران هر چقدرحرفه ای و با تجربه باشند نمي توانند الگوهاي مفيد را در ميان حجم انبوه داده ها تشخيص دهند و يا اگر قادر به اين کار هم با شند، هزينه عمليات از نظر نيروي انساني و مالي بسيار بالا است. بنابراین میشود گفت که درحال حاضر یک تغییر الگو از مدل سازی و تحلیل های کلاسیک برپایه اصول اولیه به مدل های درحال پیشرفت و تحلیل های مربوط بطور مستقیم از داده ها وجود دارد. داده کاوي يکي از مهمترين اين روشها است که به وسيله آن الگوهاي مفيد در داده ها با حداقل دخالت کاربران شناخته مي شوند و اطلاعاتي را در اختيار کاربران و تحليل گران قرار مي دهند تا براساس آنها تصميمات مهم و حياتي در سازمانها اتخاذ شوند.
در متون آکادميک تعاريف گوناگوني براي داده کاوي ارائه شده اند. در برخي از اين تعاريف داده کاوي در حد ابزاري که کاربران را قادر به ارتباط مستقيم با حجم عظيم داده ها مي سازد معرفي گرديده است و در برخي ديگر، تعاريف دقيقتر که درآنها به کاوش در داده ها توجه مي شود موجود است.
کلمات کلیدی : معرفی دادهکاوی و دلايل پيدايش آن، تعاريف داده کاوي، جايگاه دادهکاوی در علوم کامپيوتر،طبقه بندی روش های داده کاوی ، داده کاوی توصیفی یا توصیف کننده، داده کاوی پیشگویانه ، مراحل و اجزای يک فرآيند دادهکاوی ، بیان مسئله و فرموله کردن فرضیه ، انتخاب و جمع آوری داده ها ، تبديل و پیش پردازش داده ها، برآورد مدل یا کاوش در داده ها ، تفسير نتيجه یا تفسیر مدل و رسیدن به نتایج، آماده سازی داده ها، مدل استاندارد داده ها ، دو وظیفه اصلی در آماده سازی داده ها ، تبدیل و تغییر وضعیت داده های خام، نرمال سازی، مقیاس دهی اعشاری ، نرمال سازی حداقل-حداکثر ،نرمال سازی انحراف معیار ، یکنواخت سازی داده ها ، تفاضل ها و نسبت ها ، مفهوم داده های از دست رفته و راه حل جبران داده های از دست رفته، مفهوم و روش های تشخیص داده های نامنطبق ، روش های آماری 2 تشخیص داده های نامنطیق برمبنای فاصله 3 ، روش ها و تکنیک های برمبنای انحراف ، کاهش داده ها، اعمال اصلی در فرایند کاهش داده ها ، یافته های حاصل از کاهش داده ها ، کاهش زمان محاسبه ، افزایش یادگیری در دقت پیشگویانه/توصیفی ، سادگی در ارائه مدل داده کاوی ، روش های نمونه گیری برای نمونه های بزرگ ، نمونه گیری سیستمی ، نمونه گیری تصادفی ، نمونه گیری لایه ای ، نمونه گیری معکوس