سیستم های مدیریت فایل
( سیستم های مدیریت فایل ) در بخش قبل درباره چگونگی استفاده بنگاهها از سیستم های کامپیوتری به خصوص DMS برای دستکاری بسیار کاراتر و بهرهورتر داده ها گفتگو کردیم. در این بخش، شرح میدهیم که این سیستم ها دقیقا چگونه کار میکنند.
یک سیستم کامپیوتری لزوما داده ها را در سلسله مرتبهای سازماندهی میکند که با بیتها شروع شده و در ادامه به بایتها، فیلدها، رکوردها، فایل ها و پایگاههای داده میرسد. یک بیت نمایانگر کوچکترین واحد داده است که کامپیوتر میتواند آن را پردازش کند که یا ۰ است و یا ۱. یک گروه هشت تایی از بیتها تحت عنوان بایت نمایانگر یک کاراکتر واحد است که میتواند یک حرف، یک عدد و یا یک ایندکس باشد. کاراکترهایی که برای ساختن یک کلمه، گروهی از کلمات و یا یک عدد کامل با هم ادغام میشوند فیلد را میسازند. مشخصه کلیدی فیلد آن است که تمامی ورودیهای آن به یک روش با یکدیگر مرتبط هستند. به عنوان مثال فیلد با نام “Cust-Name” ممکن است شامل نامهای مشتریان شرکت باشد. اما با این حال در بر گیرنده آدرسها و شماره تلفنهای آنها نیست.
همانگونه که کاراکترهای مرتبط میتوانند با هم ادغام شده و فیلد را به وجود آورند، فیلدهای مرتبط با هم نظیر نام فروشنده، آدرسها و داده های حسابداری، میتوانند یک رکورد را به وجود آورند. با حرکت به بالای این سلسله مراتب، به مجموعهای از رکوردهای مرتبط فایل و یا فایل داده ها گفته میشود. به عنوان مثال رکوردهای تمامی مشتریان غیر تجاری که دارای وام رهن در یک مؤسسه مالی هستند میتواند یک فایل داده را ایجاد کند. در نهایت همانطور که ما در مبحث داده ها دیدیم، یک گروه منطقی از فابلها مرتبط یک پایگاه داده را ایجاد میکند. تمامی فایل های وام مشتریان همانند وام رهن مسکن و اتومبیل و وامهای سهام شخصی و مسکن میتوانند در یک گروه دستهبندی شده تا پایگاه داده وام تجاری را ایجاد کنند. یکی دیگر از راههای تفکر درباره اجزای یک پایگاه داده آن است که یک رکورد، یک موجودیت را تعریف میکند. هر مشخصهای را که یک موجودیت را تعریف میکند، یک صفت گویند (یک مشخصه به یک فیلد در یک رکورد مرتبط است). نمونههایی از مشخصات شماره مشتری، شماره صورت حساب و تاریخ سفارشدهی هستند. هر رکورد در پایگاه داده به یک صفت (فیلد) احتیاج دارد تا منحصرا آن را شناسایی کند که در این صورت رکورد را بتوان بازیابی، بهنگام رسانی و ذخیره کرد. این فیلد شناسه منحصر به فرد تحت عنوان کلید اصلی شناخته میشود. کلیدهای اصلی معمولا به صورت عددی هستند، چرا که ایجاد آنها سادهتر است. به عنوان مثال کلید اصلی رکورد محصول، کد شناسایی (ID) محصول است. به منظور پیدا کردن گروهی از رکوردها بر پایه یک مقدار مشترک (پیدا کردن تمامی محصولات تولید شده در مکزیک) باید از یک کلید ثانویه بهره برد. کلیدهای ثانویه فیلدهای غیر منحصر به فردی هستند که دارای برخی اطلاعات شناسایی هستند (به عنوان مثال کشور سازنده). کلیدهای خارجی کلیدهایی هستند که هدف از آنها برقراری پیوند بین دو یا چند جدول به یکدیگر است. در پکیج جامع دیجیتال مارکتینگ تخصصی نوکارتو میتوانید پیرامون موضوعهای فناوری اطلاعات و ارتباطات، اطلاعات جامعی را بهدست بیاورید.
دستیابی به رکوردها از فایل های کامپیوتری
رکوردها را میتوان به روشهای گوناگونی روی یک ابزار ذخیرهسازی نظمدهی کرد. نحوه آرایش رکوردها تعیین کننده چگونگی و مدت زمان دستیابی به تک تک رکوردها است. در سازماندهی ترتیبی فایل ها که نحوه سازماندهی فایل ها روی نوار است، رکوردهای داده باید در همان توالی فیزیکی که ذخیره شدهاند، بازیابی شوند. این عملیات شبیه ضبط نوار است. در سازماندهی مستقیم فایل ها و یا سازماندهی تصادفی فایل ها، میتوان بدون توجه به مکان رکوردها در ابزار ذخیرهسازی به آنها دست یافت. این عملیات مشابه یک درایو DVD است. نوارهای مغناطیسی از سازماندهی ترتیبی فایل ها استفاده میکنند در حالی که دیسکهای مغناطیسی از سازماندهی مستقیم فایل ها بهره میبرند.
روش دستیابی ترتیبی ایندکس گذاری شده (ISAM) از ایندکس فیلدهای اصلی برای مکانیابی رکوردهای تکی بهره میبرد. یک ایندکس در یک فایل فیلد اصلی هر رکورد و مکان فیزیکی آن را روی ابزار ذخیرهسازی فهرست میکند. رکوردها روی دیسکها در ترتیب اصلی خود ذخیره شدهاند. سیستم برای مکانیابی یک رکورد خاص به ایندکس نگاه میکند (که به آن ایندکس ردیابی میگویند) تا مکان عمومی (شناسایی شده توسط سیلندرها و شمارههای ردیاب) دربرگیرنده رکورد را پیدا کند. سپس سیستم به ابتدای آن ردیاب رفته و رکوردها را به ترتیب میخواند تا رکورد صحیح را پیدا کند.
روش دستیابی مستقیم به فایل از یک فیلد کلید استفاده میکند تا آدرس فیزیکی رکورد را پیدا کند. این فرآیند از یک فرمول ریاضی تحت عنوان الگوریتم تغییر شکل استفاده میکند تا فیلد اصلی را مستقیما به جایگاه ذخیرهسازی رکورد روی دیسک ترجمه کند. الگوریتم مورد نظر یک محاسبه ریاضی را روی کلید رکورد انجام میدهد و نتیجه آن محاسبه آدرس رکورد میشود. روش دستیابی مستقیم به خصوص هنگامی مناسب است که تک تک رکوردها باید مستقیما و به سرعت برای پردازش آنی مکانیابی شوند، هنگامی که رکوردهای محدودی در فایل باید در یک زمان بازیابی شوند و یا هنگامی که رکوردهای مورد نیاز در یک ترتیب مشخص نیستند.
محدودیتهای محیط فایل داده ها
هنگامی که سازمانها برای خودکار کردن فرآیندهای خود از کامپیوترها استفاده کردند با یک برنامه کاربردی در هر مقطع زمانی مثل حسابداری، قبوض و یا پرداخت حقوق کارکنان شروع کردند. هر برنامه کاربردی به صورت یک سیستم مستقل طراحی شده بود که به طور مستقل از برنامه های کاربردی دیگر کار میکرد. به عنوان مثال برای هر دوره پرداخت، برنامه کاربردی پرداخت حقوق کارکنان از داده های پرسنل و دستمزد خود برای محاسبه و پردازش فیشهای حقوق بهره میبرد. هیچ برنامه کاربردی دیگری از این داده ها بدون دستکاری در آنها استفاده نمیکرد چرا که در ابتدا برنامه های کاربردی مستقل از یکدیگر عمل میکردند. این رویکرد فایل داده ها منجر به افزونگی، ناسازگاری، دورافتادگی داده ها و مشکلات دیگر میشد.
افزونگی داده ها. به دلیل آن که برنامه نویسان مختلف برنامه های کاربردی دستکاری داده متفاوتی را در دورههای طولانی زمان ایجاد میکنند، داده های مشابه ممکن است در فایل های متعددی تکثیر شوند. در مثال وام هر فایل داده در برگیرنده رکوردهایی درباره وامهای مشتریان است. مشخصأ بسیاری از این مشتریان در فایل های داده دیگر هم ظاهر شدهاند. این افزونگی منجر به هدر رفتن ذخیره فیزیکی ابزار ذخیرهسازی شده و به دست آوردن یک دید جامع از مشتری را دشوار میکند. همچنین این کار منجر به افزایش هزینههای وارد کردن و نگهداری از داده ها میشود.
ناسازگاری داده ها. ناسازگاری داده ها به معنای آن است که ارزش واقعی داده ها در خلال ایجاد نسخههای گوناگون از داده ها همگام نمیشود. به یاد آورید که داده های ناهمگام همانگونه که پیشتر نیز راجع به آن صحبت شد که مشکلاتی را برای Applebee’s و دفتر توسعه Dartmouth ایجاد کردند. به عنوان مثال اگر یک مؤسسه مالی دارای مشتریانی با چند نوع وام باشد و برای هر وام فایلی حاوی فیلدهای مشتری وجود داشته باشد (به عنوان مثال نام، آدرس، ایمیل و شماره تلفن)، بنابراین تغییر در آدرس مشتری تنها در یک فایل ناسازگاری را در فیلد آدرس در فایل های دیگر به وجود میآورد.
دورافتادگی داده ها. سازماندهی فایل، انباری از داده ها را ایجاد میکند که دستیابی به داده ها را از طریق برنامه های کاربردی مختلف بسیار با مشکل مواجه میسازد. به عنوان مثال مدیری که میخواهد بداند مشتریان کدام محصولات را میخرند و کدام مشتریان بیش از ۱۰۰۰ دلار بدهی دارند، به احتمال زیاد نخواهد توانست جواب خود را از سیستم فایل داده ها به دست آورد. او باید برای گرفتن نتیجه، داده ها را به صورت دستی از چندین فایل فیلتر و یکپارچه کند.
امنیت داده ها. امن کردن داده ها در محیط فایل مشکل است، چرا که برنامه های کاربردی جدید به طور ویژهای به سیستم افزوده میشوند. همانطور که تعداد برنامه های کاربردی افزایش مییابد، تعداد افرادی هم که به داده ها دسترسی دارند افزایش مییابد.
عدم جامعیت داده ها. اجرای قواعد جامعیت داده ها که شامل جلوگیری از خطاها در داده های ورودی است، در محیط فایل سختتر است. به عنوان مثال یک فیلد امنیت اجتماعی نباید کاراکترهای الفبایی را مجاز بشمارد. ایجاد محدودیتهای جامعیت داده ها در بین چندین فایل دشوار است.
هم زمانی داده ها. ممکن است دقیقا در زمانی که یک برنامه کاربردی یک رکورد را بهنگامرسانی میکند، برنامه کاربردی دیگری از آن رکورد استفاده کند. در این حالت برنامه کاربردی دوم به روزترین داده ها را به دست نخواهد آورد. برای جلوگیری از این مشکل، برنامه های کاربردی و داده ها باید مستقل از یکدیگر باشند. با این حال در محیط فایل برنامه های کاربردی و داده های آنها به یکدیگر وابسته هستند.
مشکل در مدیریت داده ها از رویکرد محیط فایل منجر به توسعه پایگاههای داده و سیستم های مدیریت پایگاه داده (DBMS) شد.
پایگاههای داده
داده ها به صورت پیوسته و از بسیاری منابع به شرکتها سرازیر میشوند داده های Clickstream از برنامه های کاربردی تجارت الکترونیکی و وب، داده های تفصیلی از ترمینالهای POS و داده های فیلتر شده از CRM، زنجیره تأمین و برنامه های کاربردی برنامه ریزی منابع سازمانی (ERP). در این بخش، پایگاه های داده و برنامه هایی که دستیابی به آنها را فراهم میآورند تحت عنوان سیستم های مدیریت پایگاه داده (DBMSها) را مورد بحث قرار میدهیم.
برنامه های مدیریت پایگاههای داده میتوانند دستیابی به تمامی داده ها را میسر سازند که این کار از مشکلات مرتبط با محیطهای فایل داده ها جلوگیری میکند. بنابراین افزونگی داده ها، دورافتادگی داده ها و ناسازگاری داده ها به حداقل میرسد و داده ها را میتوان در بین کاربران آنها به اشتراک گذارد. به علاوه، کنترل امنیت و جامعیت داده ها سادهتر بوده و برنامه های کاربردی مستقل از داده هایی هستند که مورد پردازش قرار میدهند. دو نوع اصلی از پایگاههای داده وجود دارند: متمرکز و توزیع شده.
پایگاه های داده متمرکز. یک پایگاه داده متمرکز تمامی فایل های مرتبط را در یک مکان فیزیکی ذخیره میکند. سالهای متمادی پلت فورم اصلی پایگاه داده شامل فایل های پایگاه داده متمرکز روی کامپیوترهای بزرگ بود. دلیل سازمانها در بر دارند. فایل ها در حالت کلی هنگامی که در یک مکان فیزیکی نگهداری میشوند میتوانند بسیار با یکدیگر سازگارتر باشند، چرا که تغییر در فایل ها میتواند به شکل منظم و تحت نظارت صورت پذیرد. همچنین فایل ها به غیر از کامپیوتر میزبان مرکزی به صورت دیگری قابل دسترسی نیست که در نتیجه آن فایل ها را میتوان بسیار سادهتر از دسترسیهای غیر مجاز و یا ایجاد اصلاحات روی آنها مصون نگه داشت.
با این وجود هم زمان پایگاههای داده متمرکز همانند تمام سیستم های متمرکز نسبت به یک نقطه شکست آسیبپذیر هستند. این به آن معناست که هنگامی که کامپیوتر پایگاه داده متمرکز نمیتواند عملکرد درستی داشته باشد، تمامی کاربران تحت تأثیر قرار میگیرند. به علاوه هنگامی که کاربران بسیار دور از یکدیگر باشند و باید داده ها را از فواصل دور دستکاری کنند، با تأخیر در انتقال آنها مواجه میشوند.
پایگاههای داده توزیع شده. یک پایگاه داده توزیع شده دارای نسخههای کاملی از پایگاه داده و یا قسمتهایی از پایگاه داده است. دو نوع پایگاه داده توزیع شده وجود دارند: تکثیر شده و افرازبندی شده. یک پایگاه داده تکثیر شده نسخههای کاملی (replica) از تمام پایگاه داده را در چندین محل ذخیره میکند. این ساختار یک ذخیره احتیاطی (پشتیبان) را در صورت از کار افتادگی و یا وجود مشکلات در پایگاه داده متمرکز فراهم میآورد. این کار همچنین زمان پاسخگویی را هم بهبود میدهد چرا که به کاربران نزدیکتر است. از طرف دیگر راهاندازی و نگهداری این سیستم هزینه برتر است، چرا که هر replica باید در صورت افزوده شدن، اصلاح و یا حذف هر کدام از رکوردهای پایگاههای داده بهنگامرسانی شود. این بهنگام رسانیها ممکن است در پایان روز و یا زمانبندیهای دیگر با توجه به نیاز کسب و کار صورت پذیرند. در غیر این صورت پایگاههای داده مختلف دارای داده های متناقض خواهند بود.
بر خلاف آنچه گفته شد، یک پایگاه داده افرازبندی شده به گونهای قسمتبندی شده است که هر مکان دارای قسمتی از تمام پایگاه داده باشد، این قسمت معمولا همان بخشی است که میتواند نیازهای کاربران آن ناحیه را برآورده سازد. مزیت عمده یک پایگاه داده افرازبندی شده آن است که داده ها را در تمامی فایل ها میتوان بسیار سریعتر وارد کرده و توسط کاربران این داده ها دقیقتر نگهداری کرد. یک ضعف عمده این نوع پایگاه داده آن است که دستیابی گسترده به داده های بالقوه حساس شرکت میتواند به طور فزایندهای مشکلات امنیتی را افزایش دهد.
سیستم های مدیریت پایگاه داده
برنامه ای که دستیابی به پایگاه های داده را فراهم میآورد، تحت عنوان سیستم مدیریت پایگاه داده (DBMS) شناخته میشود. DBMS به سازمان اجازه میدهد تا داده ها را متمرکز کرده، آنها را به صورت کارا مدیریت نموده و دستیابی به داده های ذخیره شده توسط برنامه های کاربردی را فراهم آورد. DBMSها دارای گسترهای از اندازهها و قابلیتهای مختلف از Microsoft Access ساده گرفته تا Oracle دارای تمامی ویژگیها و راه حلهای DB2 هستند.
مزایا و قابلیتهای DBMS
ماندگاری. ویژگیها به طور پیوسته روی هارددیسک خارجی و یا ابزار ذخیرهسازی سریع و قابل اعتماد دیگری ذخیره میشوند تا مشخصأ حذف شوند و یا تغییر داده شوند.
پرسوجو. فرآیند پرسوجو اطلاعات مشخصات را از جنبههای مختلف درخواست میکند؛ مثلا «چند عدد ماشین دو در در تگزاس سبز هستند؟»
هم زمانی. ممکن است افراد بسیاری سعی در خواندن و یا تغییر مشخصات مشابهی را در یک زمان خاص داشته باشند. مشخصات ممکن است بدون وجود قوانین به اشتراک گذاشتن تغییرات، دارای ناسازگاری و یا گمراه کننده شوند. به عنوان مثال اگر شما مشخصه رنگ ماشین ۷ را به «آبی» تغییر داده و در همان زمان فرد دیگری آن را به «قرمز» تغییر دهد، نتایج غیر قابل پیشبینی میشوند. DBMSها ابزارها و تکنیک های گوناگونی را برای مواجهه با چنین شرایطی فراهم میآورند. «تراکنشها» و «قفل کردن» دو تکنیک متداول برای مدیریت هم زمانی هستند.
پشتیبان و تکثیر. در صورت عدم کارکرد صحیح تجهیزات باید نسخههای پشتیبان را تهیه کرد. نسخه ادواری ممکن است برای یک سازمان دوردست صورت پذیرد که نمیتواند دسترسی آنی به اصل فایل ها داشته باشد. DBMSها معمولا تسهیلاتی را برای فراهم آوردن پشتیبانها و نسخههای چندگانه در اختیار قرار میدهند.
اعمال قانون. اعمال قوانین به صفات در راستای پاک و قابل اعتماد نگهداشتن آنها است. به عنوان مثال یک قانون میتواند بیان کند که هر اتومبیل تنها اجازه دارد دارای یک موتور باشد (که با شماره موتور شناسایی شود). اگر فردی سعی در قرار دادن یک موتور دیگر را هم داشته باشد، DBMS آن را متوقف کرده و پیام خطایی را نمایش میدهد. با این حال با وجود اتومبیلهای هیبریدی گازی برقی چنین قوانینی باید منعطف و اصلاح شوند. قوانین میتوانند بدون طراحی مجدد قابل ملاحظهای بنابر نیاز حذف و یا اضافه شوند.
امنیت. محدودیت روی افرادی که میتوانند مشخصات را مشاهده کرده و یا آنها را تغییر دهند باید اعمال گردد.
پردازش. به جای آن که برنامه های کاربردی هر کامپیوتر پردازش را انجام دهند، DBMSها این وظیفه را بر عهده میگیرند.
تغییر و دستیابی در ورود به سیستم. DBMS رکوردها را ایجاد کرده و اطلاعاتی نظیر چه کسی به چه مشخصاتی دسترسی داشته و چه چیزی را و در چه زمانی تغییر دهد، ممیزی میکند.
بهینه سازی خودکار. اگر الگوها و یا درخواستهای استفاده مکرری وجود داشته باشند، بسیاری از DBMSها میتوانند به گونهای تنظیم شوند که زمان پاسخگویی را بهبود دهند.
DBMS همانند رابط بین برنامه های کاربردی و فایل های داده فیزیکی عمل میکند. DBMS ابزارهایی را برای کاربران فراهم میآورد تا بتوانند اعمال اضافه، حذف، نگهداری، نمایش، چاپ، جستجو، دستهبندی و بهنگامسازی را روی داده انجام دهند. این ابزارها گسترهای از ابزارهای ساده جهت استفاده دارای رابطهای زبان طبیعی سهلاستفاده تا زبانهای پیچیده مورد استفاده برای توسعه برنامه های کاربردی پیچیده پایگاههای داده را در بر میگیرند. عملکردهای دادهای اصلی انجام گرفته توسط DBMS در زیر برشمرده شدهاند:
فیلترینگ و پروفایلینگ داده ها. بازرسی داده ها برای یافتن خطاها، ناسازگاریها، افزونگی و اطلاعات ناقص.
کیفیت داده ها. تصحیح، استانداردسازی و وارسی جامعیت داده ها.
همگامسازی داده ها. یکپارچه سازی، تطبیق و یا پیوند داده ها از منابع جداگانه.
غنیسازی داده ها. ارتقا داده ها با استفاده از اطلاعات منابع داخلی و و خارجی داده ها.
نگهداری داده ها. کنترل و بازبینی جامعیت داده ها در طی زمان.
شرکتها از DBMSها در بازه گستردهای از سیستم های اطلاعاتی بهره میبرند. برخی از DBMSها چون Microsoft Access میتوانند روی یک کامپیوتر به تنهایی بارگذاری شوند به گونهای که بتوان در هر زمان برای پشتیبانی از تصمیمگیریهای فردی از آن بهره برد. برخی دیگر نظیر DB2 شرکت IBM روی چندین کامپیوتر بزرگ به هم متصل قرار دارند تا از سیستم های پردازش تراکنش در مقیاس بزرگ نظیر وارد کردن سفارشات و سیستم های کنترل موجودی را پشتیبانی کنند. DBMSهایی نظیر Oracle 11g درون شبکه های ناحیه محلی (LAN) سازمان با یکدیگر در ارتباط بوده و به تک تک دپارتمانها اجازه دسترسی به داده های شرکت را میدهند. LANها شبکه های خصوصی هستند که در مالکیت و تحت مدیریت سازمان میباشد.
یک DBMS به بسیاری از کاربران امکان میدهد داده ها و منابع فرآیندها را به اشتراک گذارند. یک پایگاه داده منحصر به فرد و جداگانه چگونه میتواند پاسخگوی نیازمندیهای متفاوت کاربران بیشماری باشد؟ به عنوان مثال آیا یک پایگاه داده منحصر به فرد میتواند به گونهای ساخته شود که پرسنل فروش قادر به مشاهده داده های مشتری، موجودی و نگهداری تولید باشند، در حالی که دپارتمان منابع انسانی دارای دسترسی محدود به داده های خصوصی پرسنل باشد؟
پاسخ این است که DBMS دو نما از داده ها فراهم میآورد: یک نمای فیزیکی و یک نمای منطقی، نمای فیزیکی با مدیریت واقعی و فیزیکی و مکان داده ها در دستگاههای ذخیره سازی دستیابی مستقیم (DASD) سروکار دارد. متخصصان پایگاههای داده از نمای فیزیکی برای ساخت منابع ذخیرهسازی و پردازش استفاده میکنند.
با این وجود، کاربران باید داده ها را متفاوت با چگونگی ذخیرهسازی آنها مشاهده کرده و نه این که در جریان تمامی جزئیات فنی این ذخیرهسازی فیزیکی قرار گیرند. در واقع یک کاربر تجاری در درجه اول علاقهمند به استفاده از اطلاعات است و نه نحوه ذخیرهسازی آنها. نمای منطقی و یا نمای کاربر از داده ها برای او معنادار است. این نما به کاربران اجازه میدهد تا داده ها را از دورنمای تجاری مشاهده کنند تا از نقطه نظر فنی. کاربران مشخصأ باید تا حدی خود را با نیازمندیهای فنی سیستم های اطلاعاتی پایگاه داده سازگار کنند اما نماهای منطقی به سیستم اجازه میدهد تا با نیازهای کسب و کار کاربران سازگار شود. روشی که شما در آن داده ها را مشاهده میکنید (نمای منطقی یا نمای کاربر میتواند متغیر باشد؛ اما ذخیرهسازی داده ها (نمای فیزیکی) ثابت است.
برای مطالعه مقاله های دیگر در زمینههای مختلف فناوری اطلاعات و ارتباطات اینجا کلیک کنید
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.