اساس FOAF را ارائه کردهاند. در این سیستم کاربران صاحب پروفایلهایی از نوع FOAF هستند که در آن اطلاعات کابران، ارتباطات آنها با دوستانشان و همچنین علائق موسیقیایی آنها تعریف شده است.(شکل 2-2)

شکل 2-2 :تعریف پروفایل کاربر در قالب FOAF [20]
سیستم برای کشف و جمعآوری اطلاعات موسیقیهای جدید و رویدادهای موسیقیایی پیشرو از فناوری RSS استفاده میکند. پس از آن با استفاده از یک هستیشناسی گروهها و هنرمندان شبیه به هم شناسایی میشوند. سپس این موردها بر طبق پروفایل هر کاربر امتیازدهی شده و بهترینها به وی پیشنهاد میشوند. آزمایشهای تجربی انجام گرفته حکایت از قدرت این سیستم در ارائه پیشنهادهای درست را دارد. در شکل 2-3 معماری این سیستم نشان داده شده است.

شکل 2-3 : معماری سیستم پیشنهادگر بر پایه FOAF [20]
در [21, 23] پاسانت40 و دکر41، دیبیرک را که یک سیستم پیشنهاد دهنده موسیقی مبتنی بر داده‌های پیوندی است را معرفی کردهاند. دیبیرک با استفاده از الگوریتم فاصله معنایی داده‌های پیوندی42 و اطلاعات 39000 هنرمند و گروه موسیقی موجود در دیبیپدیا به ارائه پیشنهاد در زمینه موسیقی میپردازد. اساس این پیشنهادها برپایهی روابط بین این هنرمندان و گروهها است. برای مثال رابطهای مانند هنرمند الف به همراه هنرمند ب به اجرای موسیقی پرداخته باشند، که یک رابطه مستقیم است. علاوه بر آن روابط پیچیدهتر هم مورد استفاده قرار میگیرند. مانند اجرای یک نوع موسیقی، داشتن قرارداد با یک شرکت تهیه و توزیع موسیقی و یا شرکت داشتن در یک حرکت فرهنگی.
دیبیرک علاوه بر ارائه پیشنهادها دلایل آنها را نیز به کاربران اعلام میکند. در شکل 2-4 پیشنهادهای ارائه شده که مرتبط با مایکل جکسون میباشند نشان داده شدهاند و در شکل 2-5 توضیح داده شده که به چه دلیل کویینسی جونز43 به عنوان یک پیشنهاد ارائه شده است.

شکل 2-4 یک نمونه از پیشنهاد دهی دیبیرک[24]

شکل 2-5 یک نمونه از ارائه دلایل مربوط به یک پیشنهاد در دیبیرک [24]
لنا-تیآر [22] توسط فرانز44 و همکارانش توسعه داده شده است. لنا هنگامی که کاربر به گردش در وب میپردازد، پیشنهادهایی را که اهمیت بیشتری در رابطه با RDF جاری که توسط کاربر دیده میشود، به وی ارائه میکند. لنا پیشنهادها را دستهبندی کرده و آنها را در گروههایی در دسترس کاربر قرار میدهد. لنا RDFها را به صورت قطبها45 و منابعی46 در نظر میگیرد و سپس میزان ارتباط بین موردهای این 2 دسته را محاسبه کرده و امتیاز دهی را بر آن اساس انجام میدهد. لنا-تیآر از روش رتبه‌بندی سه‌گانه47 برای تولید این امتیازها استفاده میکند [25]. در این روش گراف داده‌های پیوندی به تنسورهای مجاورتی تبدیل میشوند سپس از طریق یک شیوه متعامدسازی مانند پارافک48 به ماتریسهایی سازنده تبدیل میشوند که امتیازات قطبی و منبعی از روی آنها محاسبه میشوند.
در [26] مفهوم جدیدی از سیستمهای پیشنهادگر را بنام سیستمهای پیشنهادگر باز معرفی میکند. وجود این سیستمها به ذات باز داده‌های پیوندی باز میگردد که مجموعه دادههای متفاوتی بر روی آن وجود دارد و از طرفی امکانات بیشماری جهت ترجمه از یک قالب به قالب دیگری از مجموعههای داده وجود دارد. در پایان امکان وجود پیوندهای فرای مجموعه داده متفاوت که آنها را به هم وصل میکند بسیار مفید است.
استفاده از منابع مختلف در ساخت پروفایل کاربران و موردها میتواند مشکل شروع سرد کاربران، و موردها و همچنین خلوتی را حل کند زیرا استفاده از منابع مختلف امکان پیدا کردن ردهای مختلف از کاربران و موردها را افزایش میدهد.
2-6 جمعبندی
سرویسهای پیشنهاد دهنده از میان حجم عظیمی‌از اطلاعات و گزینههای موجود، سعی میکنند تا بهترین انتخابهای ممکن را در اختیار کاربران قرار دهند. جرقههای اولیه این شاخه تحقیقاتی از اواسط دهه 70 میلادی زده شد اما از اواخر دهه 90 به شاخهی تحقیقاتی مستقل تبدیل شد. این نوع از خدمات نقش مهمی‌را در تجارت الکترونیک خصوصا در شاخهی B2C ایفا میکنند. با توجه به گستره زیاد کاربردهای این زمینه در تجارت الکترونیکی و خدمات مبتنی بر وب روشها و الگوریتمهای بسیاری جهت حل مسائل مختلف درگیر با این موضوع پیشنهاد شده است. در این فصل، در ابتدا تاریخچهای از سامانههای پیشنهاد دهنده به همراه توضیح مختصری از روشها و پیادهسازیهای مهم و اثر گذار بر این حیطه ارائه شد. سپس روشهای مختلف براساس طبقه بندیهای موجود مورد بحث قرار گرفتند و مزایا و معایب هر تکنیک بیان گردید.

فصل سوم
مروری بر داده‌های پیوندی و نظریه غذایابی

3-1 مقدمه
در این بخش مفاهیم پایهای شامل 49RDF، داده‌های پیوندی و نظریه غذایابی بهینه توضیح داده خواهند شد. این فصل به سه بخش تقسیم شده است. در اولین بخش ساختار RDFها بررسی میگردد و در بخش دوم مفهوم داده‌های پیوندی، چگونگی پیدایش و وضعیت فعلی آن و در سومین بخش نظریه غذایابی بهینه مورد بررسی قرار خواهد گرفت.
RDF یک قالب ارائه و ذخیره اطلاعات معنایی با قابلیت پردازش ماشینی است. اجزای پایهای تشکیل دهندهی این استاندارد عبارت از منابع50 ، ویژگی‌ها51 و گزاره‌ها52 هستند. دادههای پیوندی مجموعهای از
مجموعه دادههای معنایی متصل به هم در قالب RDF است که امکان گشت و گذار ماشینی و انسانی در بین آنها فراهم شده است. پیوندهای بین اطلاعات این مجموعه دادهها دارای نوع میباشند.
نظریه چرای اطلاعاتی در دهه نود همراه با پدیده انفجار اطلاعات مطرح شد. اساس ای
ن نظریه بر شباهتهای بسیار زیاد رفتار انسان جهت دستیابی به اطلاعات مورد نیازش با رفتار دیگر جاندارن هنگام پیدا کردن غذا بنا شده است. الگویی که انسان برای یافتن اطلاعات استفاده میکند. همانطور که جانوران از اطلاعات غیر کامل محیطی استفاده میکنند. انسانها نیز مانند حیوانات از نشانههایی استفاده میکنند تا تصمیم بگیرند آیا رد اطلاعاتی را دنبال کنند یا خیر.
3-2 ایده اصلی RDF
RDF یک قالب ارائه و ذخیره اطلاعات معنایی قابل پردازش و فهم توسط ماشین است. RDF میتواند به دو شکل باینری و XML تعریف و استفاده شود. اما قالب XML بسیار پذیرفتهتر است و بیشتر کاربردهای استفاده کننده از آن، از جمله داده‌های پیوندی و نرمافزارها و سیستم‌های تجاری و دانشگاهی از این قالب پشتیبان میکنند .اجزای پایهای تشکیل دهندهی این استاندارد عبارت از منابع53 ، ویژگی‌ها54 و گزاره‌ها55 هستند که در ادامه تشریح خواهند شد. با اینکه این سه عنصر در استاندارد RDF عناصر پایهای تشکیل دهندهی آن هستند، اما ویژگیها خود نوعی منبع هستند و گزارهها میتوانند از منابع تشکیل شده باشند [27]. مدل RDF داده را در قالب سهگانه موضوع، گزاره، شیء کدگزاری می‌کند. هر دوی موضوع و شیء، در یک سهگانه شناسه همسان منابع هستند، که هر کدام یک منبع را شناسایی می‌کند یا به ترتیب یک شناسه همسان منابع و یک رشته حرفی.گزاره، نحوه ارتباط موضوع و شیء را مشخص می‌کند که البته گزاره هم با یک شناسه همسان منابع نمایانده می‌شود.
به عنوان مثال می‌تواند ارتباط دو نفر A وB ( که هر کدام با یک شناسه همسان منابع شناسانده می‌شوند) را بر پایه این حقیقت که A و B را می‌شناسد بیان کند. به طرز مشابه یک سهگانه RDF می‌تواند شخص C را به مقاله علمی‌D که در یک پایگاه داده فهرست کتب قرار دارد مرتبط کند با این بیان که C نویسنده D است. دو منبعی که به این ترتیب متصل شده اند می‌توانند از دو مجموعه متفاوت روی وب کشیده شوند به طوری که داده روی منبع داده اولی بتواند به داده روی منبع دوم متصل شود و به این وسیله یک وب داده ایجاد شود.
نتیجتاً می‌توان به سهگانه‌های RDF ای فکر کرد که مورد‌هایی را از مجموعه داده‌های مختلف به هم متصل می‌کنند به همان ترتیب که پیوندهای فرامتنی وب اسناد را به هم وصل می‌کنند. پیوندهای RDF، شکل سه‌گانه RDF را می‌گیرند ‌که موضوع سه‌گانه، یک منبع شناسه همسان منابع در فضای نام یک مجموعه داده باشد در حالی که شیء و سه‌گانه یک منبع شناسه همسان منابع در دیگر مجموعه داده باشد.

شکل 3-1: نمونه ای از پیوندهای RDF
شکل 3-1 نمونه ای از پیوندهای RDF را نشان می‌دهد. پیوند اول بیانگر این موضوع است که منبع شناسایی شده با شناسه همسان منابع http://www.org/people/Berners-lee/card#i عضوی از منبع http://dig.csail.mit.edu/data#DIG است.
3-2-1 منابع
می‌توان منابع را یک “شیء” یا بطور کلیتر یک “چیز” پنداشت. این “چیز” میتواند در جهان واقعی یک نمونه فیزیکی داشته باشد و یا یک مفهوم صرفا انتزاعی باشد. نویسندگان، ناشرها، مکان‌ها، آدم‌ها، پیوند‌ها، اتاق‌ها، پرس و جوها و هر چیز دیگری میتواند در قالب RDF توصیف شود [27]. هر منبع دارای یک شناسه همسان منابع56 است. شناسه همسان منابع میتواند یک آدرس وب و یا هر نوع شناسه منحصر به فرد دیگری باشد، که بتواند بطور یکتا یک منبع RDF را مشخص سازد . قابل ذکر است که یک شناسه الزاماً موجب دسترسی به منبع نمی‌شود. یعنی دنبال کردن یک شناسه همیشه به بازیابی57 یک منبع بر روی وب منتهی نخواهد شد. یک نمونه از این شناسهها شناسههای همسان 303 هستند که در همین فصل معرفی خواهند شد. شناسه همسان منابع بهگونهای تعریف می‌شود که نه تنها برای مکان‌های وب ، بلکه برای شی ء‌های گوناگونی نظیر شماره‌های تلفن، شماره‌های ISBN نشریات و کتابها و مکان‌های جغرافیایی نیز قابل استفاده باشد.
3-2-2 ویژگی‌ها
ویژگی‌ها نوع خاصی از منابع هستند که خصوصیتی از یک منبع را نشان می‌دهد و یا روابط بین منابع را توصیف می‌کنند [27]، مانند “نوشته شده توسط” ، “متولد سال” ، “خریده شده توسط” و نظایر آنها. از این نظر ویژگیها در استاندارد RDF شبیه ویزگیها در شیءگرایی می‌باشند. آنجایی که منابع به هم متصل میشوند، هر دو منبع فقط از طریق یک ویژگی میتوانند به یکدیگر متصل شوند. در RDFویژگی‌ها هم با شناسه همسان منابع شناسایی می‌شوند.
بطور کلی ایده استفاده از شناسه همسان منابع برای شناسایی “چیز”ها و روابط بین آنها بسیار مهم است چرا که به این ترتیب امکان استفاده از یک شمای نامگذاری منحصر به فرد در سرتاسر دنیا وجود خواهد داشت، و از بسیاری مشکلات ناهمگونی، که مانع ارائه داده توزیع شده بودند کاسته خواهد شد.
3-2-3 گزاره‌ها
اگر مدل RDF به صورت یک گراف در نظر گرفته شودگزاره‌ها یالهای آن گراف هستند. هر گزاره حقیقتی را از طریق یک ویژگی درباره یک یا دو منبع بیان می‌کند. برای مثال عبارت “ساختمان داده توسط دکتر رفیعی تدریس می‌شود” یک گزاره است. این گزاره با استفاده از ویژگی “تدریس شدن” دو منبع “دکتر رفیعی” و “ساختمان داده” را به یکدیگر متصل می‌کند. همانطور که پیداست حقیقت مطرح شده در مورد هر دو منبع معتبر است. بطور رسمی گزاره یک سهگانه است متشکل از یک منبع، یک ویژگی و مقدار آن ویژگی است که بیان کننده حقیقتی باشند [27]. در این تعریف مقدارها می‌توانند منابع یا الفاظ باشند. الفاظ مقادیر تجزیه ناپذیر (رشته ای) هستند. شکل 3-2 گزاره مطرح شده را نشان می‌دهد.

شکل 3-2: یک گزاره متشکل از دو منب
ع و یک صفت سازنده یک رابطه
3-2-4 نمونه یک گزاره
امید رفیعی مالک صفحه وب http://www.ui.ac.ir/comp/~ds است. ساده ترین راه تفسیر گزاره فوق استفاده از تعریف ارائه شده و لحاظ کردن سه‌گانه
(http://ui.ac.ir/comp/~ds, http://www.mydomain.org/siteowner, #OmidRafi’ee)
است. می‌توان این سه‌گانه (x,p,y) را یک رابطه منطقی به صورت p(x,y) دانست. به این ترتیب که گزاره خبری دوگانی p، شیء x را به شیءy مرتبط می‌کند. در حقیقت آنچه RDF عرضه می‌کند، گزاره‌های خبری دو گانه است. توجه داشته باشید که ویژگی” مالک سایت” و دو شیءمذکور همه با شناسه همسان منابع شناسایی می‌شود. تصویر 3-3 همان گزاره قبلی را به شکل گراف جهت دار با گره‌ها و یال‌های بر چسب دار نشان می‌دهد.

شکل 3-3: گزاره “امید رفیعی مالک صفحه وب http://www.ui.ac.ir/comp/~ds است”
جهت یال‌ها از سمت تابع (موضوع در گزاره) به سمت مقدار (شیء در گزاره) است.
گراف‌ها ابزا


دیدگاهتان را بنویسید