ارزیابی و بهبود وضعیت وب سایت
پس از نشر وبسایت بر روی اینترنت، اگر توسعه دورهای محتوای وبسایت به طور صحیح و نظاممند ادامه یابد، سایت خواهد توانست نیازهای جامعه خود را تأمین نماید. ارزیابی دورهای باعث میشود مسائل و مشکلات، شناسایی شده و حتی با طراحی مجدد وبسایت اقدام به رفع مشکلات نماییم تا وبسایت بتواند به حیات خود ادامه دهد.
معماری اطلاعات در وبسایتها
در موقع طراحی وبسایتها سؤال این است که با چند کلیک کاربر میتواند به اطلاعات مورد نیازش دسترسی پیدا کند. معماری اطلاعات به چگونگی حرکت کاربران در فضای اطلاعاتی میپردازد.
معماری اطلاعات در مورد وبسایت، مسائل زیر را پوشش میدهد:
در یک سایت چند سطح باید تعبیه شود.
چند انتخاب در هر سطح باید وجود داشته باشد.
چه مسیرهایی برای دسترسی به ساختارها وجود داشته باشد.
برای دانلود متن کامل پایان نامه به سایت fotka.ir مراجعه نمایید.
چه تعداد کلیک نیاز است تا از صفحه اصلی به صفحه حاوی مطالب مورد نظر برسیم.
مشخص کردن تعداد انتخابها در هر سطح (فعالیتی نظیر تنظیم رفبرگه البته نه به صورت الفبایی)
بهترین ساختار برای طراحی وبسایت، سلسله مراتبی است. شیوههای مختلفی برای معماری اطلاعات وجود دارد. در معماری وبسایت، فهرستها را به نحوی طراحی میکنیم که خاصیت به یادسپاری داشتهباشند.
ساختار ردهبندی نمونهای از شیوههای معماری هستند که مهمترین آن ها به قرار زیر هستند:
سلسله مراتب گسترده و کم عمق
سلسله مراتب عمیق و باریک (علایی آرانی، ۱۳۸۶)
ساختار «گسترده و کمعمق» به این صورت است که گزینههای بسیاری وجود دارد تا کاربر از میان آن ها دست به انتخاب بزند، اما مطالب در سطوح کمی ارائه میگردد. در مقابل، ساختار «عمیق و باریک» ساختاری است که گزینههای محدودی را در هر صفحه در اختیار کاربر قرار میدهد ، اما لایههای عمیقی از اطلاعات ارائه میگردد. (روزنفلد و مورویل[۴۵]، نقل در نیدرست، ۲۰۰۷)
روزنفلد و مورویل معتقدند: «در ساختار گسترده، بایستی نسبت به توانایی افراد در مرور چشمی اطلاعات و محدودیتهای ادراکی ذهن بشر توجه داشت». همچنین نسبت به بازیابی بیش از حد اطلاعات از طریق ارائه گزینههای زیاد در یک صفحه، گروهبندی و ساختاربندی اطلاعات در سطح صفحه و تقسیمبندیهای موضوعی، هشدار میدهند.
در ساختار عمیق، حتی باید بیشتر احتیاط کرد. اگر کاربران ناچار به پویش بیش از دو یا سه لایه اطلاعاتی باشند، ممکن است به سادگی مأیوس شده، سایت شما را ترک کنند .نتایج یک پژوهش انجام شده در میکروسافت نشان میدهد که وجود تعادل بین عمق و وسعت، بهترین نتیجه را به دنبال خواهدداشت .ساختار خوب موجب میشود که وبسایت قابل درکتر شود. (همان)
تعریف موتور جستجو
موتورهای کاوش پایگاههای اطلاعاتی قابل جستجویی هستند که از طریق برنامههایی رایانهای به شناسایی و نمایه سازی خودکار صفحات وب میپردازند (کوشا،۱۳۸۲). کلمه خودکار در این تعریف توجه ما را به این نکته جلب می کند که موتورهای کاوش برای تجزیه و تحلیل کردن [۴۶]صفحات وب به نیروی انسانی وابسته نیستند.
از طرف دیگر موتورهای کاوش الگوریتمهای متفاوتی را برای شناسایی، نمایه سازی و بازیابی اطلاعات وب به کار میگیرند و اغلب به دلایل تجاری، الگوریتمهای بازیابی و رتبه بندی نتایج کاوش خود را فاش نمیکنند (کوشا،۱۳۸۲). اگر چه توافقی بر سر موثر بودن یک عامل نسبت به سایر عوامل وجود ندارد .به طور مثال گوگل بیش از ۱۰۰۰ عامل را در نظام رتبه بندی نتایج خود مد نظر قرار داده اما به دلیل ماهیت تجاری و حفظ یکپارچگی نتایج کاوش، از ذکر جزئیات خودداری میکند (شریف،۱۳۸۶).
طی تحقیق که برین و پیچ[۴۷] در سال ۱۹۹۸ به تحلیل دقیق آناتومی گوگل پرداختند به این نتیجه رسیدند که گوگل علاوه بر نمایه سازی کلیدواژهای کلمات متن، بر تحلیل پیوندها نیز تاکید دارد.
با وجود مخفی نگه داشتن الگوریتم موتورهای کاوش، عوامل زیر را به عنوان عوامل موثر بر رتبه بندی نتایج توسط موتورهای کاوش ذکر کردهاند.
۱٫ساختار ابرداده ای[۴۸] : چنانچه محتوای صفحه به درستی در فیلدهای ابرداده ای بازنمود شوند و موتورهای کاوش از این فیلدهای ابر دادهای در رتبه بندی و بازیابی نتایج خود بهره ببرند، مانعیت افزایش پیدا میکند به طوریکه نتایج بازیابی به سطحی قابل مدیریت کاهش مییابد. بعلاوه رتبه بندی صفحات صحت بیشتری خواهد داشت.
۲٫ محتوای صفحه[۴۹]
۳٫وضعیت ارجاعات فرامتنی[۵۰] (شریف،۱۳۸۶)
فن آوری موتورهای جستجو
وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارائه میشود، کاربران در واقع نتیجه کار بخشهای متفاوت موتور جستجوگر را میبینند. موتور جستجو اطلاعات را از پایگاه اطلاعاتی خود مورد جستجو و بازیابی قرار میدهد و اینطور نیست که همان لحظه اطلاعات را از اینترنت به دست آورد، بلکه از قبل اطلاعات را از اینترنت گرفته و در پایگاه خود ذخیره میکند.
در ابتدا مرحله گردآوری اطلاعات صفحات وب را داریم از طریق روباتهای اطلاعاتی میتوانیم به جستجوی مستمر و مداوم اطلاعات در صفحات وب بپردازیم. از جمله روباتهای اینترنت میتوانیم به اسپایدرها[۵۱] و روبات خزنده[۵۲] اشاره کنیم.
اسپایدر، اینترنت را برای اسناد جدید وب مورد جستجو قرار میدهد و آدرسهای آن ها و اطلاعات مربوط به محتوا را در بانک اطلاعاتی قرار میدهد که با موتور جستجو میتوان آن را در دسترسی قرار داد(هیئت مولفان و ویراستاران انتشارات میکروسافت،۱۳۸۲،ص ۵۴۴). کار اسپایدر بازبینی کدهای اج تی ام ال[۵۳] صفحات وب میباشد، در حالی که کاربران وب نتیجه حاصل از کنار هم قرار گرفتن این کدها را میبینند.
در حالی که کراولر، نرم افزاری است که به عنوان یک فرمانده برای اسپایدر عمل میکند و مشخص میکند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم میگیرد که کدام یک از لینکهای صفحهای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممکن است قبلا” برنامه ریزی شده باشد که آدرسهای خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آن ها دیدن کند. دنبال کردن لینکهای یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را میتواند در پایگاه دادههایش ذخیره کند و همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد. تنظیم میزان دسترسی موتورهای جستجوگر به محتوای یک سایت توسط پروتکل روبوت[۵۴] انجام میشود.
سپس اطلاعات جمع آوری شده توسط اسپایدر در اختیار ایندکسر قرار میگیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار میگیرند و به بخشهای متفاوتی تقسیم میشوند. تجزیه و تحلیل بدین معنی است که مشخص میشود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدام است، چندبار تکرار شده است، در کجای صفحه قرار دارند و … . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد میکند و تمام این پارامترها را به یک مقیاس عددی تبدیل میکند تا سیستم رتبه بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم دادهها از بعضی کلمات که بسیار رایج هستند صرفنظر میکند. کلماتی نظیر a ، an ، the ، www ، is و … . از این گونه کلمات هستند.
آنگاه دادههای تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال میگردد. در این بخش دادهها گروه بندی، کدگذاری، در صورت لزوم فشرده و ذخیره میشوند.یک موتور جستجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور جستجوگر برای آن امتیاز محسوب میگردد. یکی از تفاوتهای اصلی موتورهای جستجوگر در حجم پایگاه داده آن ها و همچنین روش ذخیره سازی دادهها در پایگاه داده است.
سرانجام در هنگام جستجو نرم افزار کاوش به کاربر این امکان را میدهد که از میان همه صفحات موجود در نمایه، آنچه را مورد جستجو است، یافته و بر اساس میزان تناسب و ارتباط آن با درخواست، واژه یا عبارت مورد نظر را رتبه بندی میکند. در واقع نرم افزار جستجو رابط بین کاربر و اطلاعات نمایه شده است. بخشی از این نرم افزار کار رتبه بندی اطلاعات بازیافتی را انجام میدهد. (مکوندی و سعیدی ۱۳۸۵)
معمولا به رایی رتبه بندی دو ویژگی مهم در نظر گرفته میشود:
محل درج کلید واژه: اینکه کلید واژه در کجای صفحات وب قرار دارد. کلید واژهای که در عنوان قرار دارد به کلید واژههای دیگر ارجحیت دارد.
تعداد تکرار (بسامد) اغلب موتورهای جستجو میزان تکرر کلیدواژهها را نسبت به سایر واژههای موجود در صفحات وب میسنجند و واژگانی را که از بسامد بیشتری برخوردار باشند به عنوان واژگان دارای ارتباط و تناسب بیشتر معرفی میکنند. همچنین در برخی موتورهای جستجو مانند اکسایت[۵۵] وجود پیوندهای بیشتر در یک صفحه وب به سایر صفحات یا ایستگاههای اطلاعاتی ارجحیت دارد. (منتظر،۱۳۸۰)
نمایه سازی موتورهای وب
با پیدایش دنیای مجازی شاهد ظهور انقلاب دیگری تحت نام انقلاب اطلاعات هستیم. از سوی دیگر حجم انبوه اطلاعات کاربران را بر آن داشته تا به کیفیت اطلاعات بیش از کمیت آن بیندیشند. اطلاعات روز آمد، دقیق و معتبر سه ویژگی مهمی است که لازمه کار هر محقق میباشد. لذا رشد فناوریهای نو ظهور، روشهای جدیدی را به منظور سازماندهی اطلاعات جهت بازیابی دقیق آن به یاری میطلبد. با بهره گرفتن از روشهای نوین سازماندهی، اطلاعات مفید از اطلاعات سیال و ناپایدار استخراج شده و کاربر به سهولت میتواند به اطلاعات مورد نیاز خود دسترسی پیدا کند. یکی از مهمترین این راهکارها، نمایه سازی وب[۵۶] است.
نمایه وب منابعی را که از طریق شبکه جهانی وب[۵۷] در دسترس هستند، جمع آوری و سازماندهی می کند و نقطه شروعی برای یافتن اطلاعات میباشد. در وب نمایهها ممکن است به روشهای گوناگونی سازماندهی شوند. شیوه سازماندهی یک نمایه با نمایه دیگر فرق میکند، نمایهها میتوانند به طور الفبایی، موضوعی (ردهای) و … سازماندهی شوند. نمایههای موضوعی اغلب منابعشان را طبق یک نظم سلسله مراتبی از اعم به اخص مرتب میکنند.. نمایههای وب برای نشان دادن لیستهای منابع خود ازپیوندهای فرا متن استفاده میکنند، آن ها این امکان را دارند تا از طریق لینکها صدها و بلکه هزاران منبع را در بر بگیرند. عموما تمام نمایهها یک نقطه اتصال دهنده مستقیم به منابع فهرست شده را به کاربران عرضه میکنند.
نمایه های وب برای نشان دادن لیستهای منابع خود از پیوندهای فرا متن استفاده میکنند، آن ها این امکان را دارند تا از طریق لینکها صدها و بلکه هزاران منبع را در بر بگیرند.
دو عامل مهم در نمایه سازی وب
نمایه، یک مخزن جامع از اطلاعات در دسترس نیست اگر چه آنها میتوانند هزاران منبع را فهرست کنند. در واقع نمایههای وب ما را به فهرستها و راهنماها ارجاع میدهند. این نوع نمایهها نیاز به یک نرم افزار و یک زبان نمایه سازی خاص دارند.
الف- زبان نمایه سازی
زبان نمایه سازی آن دسته از واژگان نمایه سازی است که در نظام خاصی از ذخیره و بازیابی مورد استفاده قرار میگیرد. “زبان ” میتواند طبیعی، یعنی زبان مدرک نمایه سازی شده باشد، یا ساختگی یا کنترل شده باشد(یعنی از نوعی تنظیم برخوردار باشد. (سلطانی، ۱۳۸۲، ص ۱۸۰)
عملکرد نظام بازیابی متاثر از کیفیت زبان نمایه است. وجود نمایه سازی و جستجوی خوب نمیتواند زبان نمایه نامناسب را جبران کند به عبارت دیگر کاربران اطلاعات فقط به آن اندازه میتوانند عمل نمایند که زبان نمایه مجاز می شمارد. ناتوانایی های زبان نمایه بر دو نوع است: ۱-عدم توانایی به خاطر ویژگی در اصطلاحات ۲-عدم توانایی به خاطر ابهام یا روابط کاذب بین اصطلاحات. (لانکاستر، ۱۳۷۹، ص۱۷۹)
عمدتا زبانها دو نوع هستند:
زبانهای مهار شده[۵۸]
این زبانها، حاوی اصطلاحاتی هستند که برای نمایه سازی مدارک انتخاب و پذیرفته شدهاند، فهرستها سر عنوانهای موضوعی و اصطلاحنامه ها دو شیوه متفاوت زبان نمایه سازی مهار شده است. اصطلاحنامه پس از شرح زبانهای آزاد توصیف میشود.
زبانهای آزاد[۵۹]
در این نوع زبانها محدودیتی ازنظر نوع واژه وجود ندارد، هر واژه یا اصطلاح میتواند بدون قید و شرط از زبان طبیعی گرفته شود، یعنی عینا از زبان مدرک نقل گردد و یا متناسب با موضوع مدرک تعیین شود. ازنمایه سازی به زبان طبیعی هم میتوان در ساخت واژگان موضوع الکترونیکی و هم در تولید نمایه نامههای چاپی استفاده کرد. یکی از کاربردهای نمایه سازی به زبان طبیعی تولید نمایههایی است که مبتنی بر واژههای عنوان میباشد. مانند: نمایه کوئیک، نمایه کووک و نمایه جایگشتی.(داورپناه،۱۳۸۱،ص۳۳)
ب- نرم افزارهای نمایه سازی وب
بسته به اینکه در وب مورد نظر چه اطلاعاتی را میخواهیم نمایه سازی کنیم (اطلاعات میتوانند یک سند، یک تمام متن[۶۰]، تصاویر و … باشند) نرم افزارهای گوناگونی برای نمایه سازی وب موجود میباشد:
نرم افزارهای نمایه سازی وب
Advanced Java Tree Menu
PHP Lightning Portal (PLP)