مهندسی فناوریِ اطلاعات،گرایشِ تجارتِ الکترونیک
عنوان :چارچوبی جدید برای تشخیصِ مرجعِ مشترک و اسمِ اشاره در متون پارسی
تعداد صفحات : 146
چکیده : پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصهسازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد شناسایی شوند. بنابراین وجود سیستمی که بتواند مسئله هم مرجع را بررسی نماید، کمک شایانی به انجامِ موفقیت آمیز این وظایف خواهد نمود. روشهای تشخیص مرجع مشترک را میتوان به دو دستهی روشهای زبانشناسی و روشهای یادگیری ماشین تقسیم نمود. روشهای زبانشناسی بیشتر به اطلاعات زبانشناسی نیاز دارند، البته مشکل این روشها این است که پر خطا و طولانی میباشند. از طرف دیگر روش های یادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند و نتایج حاصل از آنها قابل اعتمادتر است. در این پایان نامه تلاش میکنیم تا فرآیند تشخیص مرجع مشترک را مورد مطالعه قرار دهیم و چارچوبی ارائه دهیم تا بتواند علاوه بر شناسایی اشارهها، عبارتهای هم مرجع را نیز تشخیص دهد. به همین منظور باید سه رکن اساسی کار را که پیکره نشانه گذاری شده، سیستم شناساییِ اشاره و محدوده آن، و الگوریتم پیشنهادی پیشبینی عبارتهای اسمی هممرجع را مبنای کار قرار دهیم. درهمین راستا، در قدم اول، پیکرهای با نشانههایی شامل محدوده ی اشاره، نوع اشاره، هسته ی اشاره، نوع موجودیت، نوع زیر گروه موجودیت، کلاس موجودیت تهیه میکنیم، این پیکره میتواند به عنوان اولین پیکره دارای نشانههای اشاره و هممرجعی، مبنای کار بسیاری از پژوهشهای مربوط به شناسایی و کشف اشاره و تحلیل هم مرجعی قرار گیرد. همچنین با استفاده از این پیکره و بررسی قوانین و اولویتهای میان اشاره ها، سیستمی ارائه میکنیم که اشارههای موجود در متن را شناسایی کرده و سپس نمونههای مثبت و منفی را از پیکره لوتوس استخراج میکند. در نهایت نیز با استفاده از الگوریتم های یادگیری پایه درخت تصمیم، شبکه عصبی و ماشین بردار پشتیبان، نمونه های حاصله را مورد ارزیابی و مقایسه قرار دادیم. نتایج حاصل نشان میدهد که یادگیر شبکه عصبی، نسبت به سایرین عملکرد بهتری دارد.
فصل ۱: آشنایی با تشخیص مرجع مشترک
مقدمه و بیان مسئله
بررسی ارتباطات هممرجعی
هممرجع در مقابل پیشایند
ارتباط هم مرجع
ارتباط پیشایندی
تحلیل پیشایند
تحلیل مرجع مشترک
تقابل تحلیل مرجع مشترک و تحلیل پیشایندی
جمعبندی
فصل 2 : بخش اول
پیشینه تشخیص مرجع مشترک
روشهای زبانشناسی
فاکتورهای حذف کننده
تطبیق جنس و عدد
تطبیق معنایی
فاکتورهای امتیاز دهنده
مشابهت نحوی
مشابهت معنایی
بارز بودن
روشهای یادگیری ماشین
ویژگیها
مدلهای جفت اشاره
رده بندی جفت عبارتهای اسمی
درخت تصمیم
افراز
درختِ بل
افراز گراف
روشهای مبتنی بر پیکره
روشهای جایگزین
روش هم آموزی
مدل احتمالاتی مرتبه اول
رتبه بندی
فیلدهای تصادفی شرطی
خوشه بندی
جمع بندی
فصل 2: بخش دوم
پیکره نشانه گذاری شده توسط اطلاعات هممرجع
پیکره بیژنخان
پیکره لوتوس
شیوههای نشانهگذاری پیکره لوتوس
نشانه گذاری انواع موجودیتها
موجودیت شخص
موجودیت سازمان
موجودیت مکان
موجودیت سیاسی
کلاس هر موجودیت
غیر ارجاعی
ارجاعی
ارزیابی به شکل منفی
ارجاعی خاص
ارجاعی عمومی
ارجاعی زیر مشخص شده
انواع اشاره/سطوح اشاره
اشاره ساده
محدوده اشاره
هسته اشاره
انواع اشاره ساده
ساختارهای پیچیده
ساختارهای عطف بیان یا بدل
جمع بندی
فصل 3: الگوریتمهای پیشنهادی
رده بندی دودویی
جدا کنندههای خطی
پرسپترون
ماشین بردار پشتیبان
درخت تصمیم
خوشه بندی
الگوریتمهای افراز بستهای
خوشه بندی سلسله مراتبی پایین به بالا
آموزش الگوریتم خوشهبندی سلسله مراتبی
جمع بندی
فصل 4: سیستم ارزیابی
مقدمه
سیستم شناسایی اشاره لوتوس
بانک اطلاعاتی
سیستم شناسایی اشاره
تشخیص اشارههای هم مرجع
ویژگیها
الگوریتم یادگیری
معیار ارزیابی
نتیجه ارزیابی
نتایج بدست آمده
چالشها و تحلیل خطا
جمع بندی
فصل 5 :نتیجه گیری و پیشنهادها
5-۱.نتیجه گیری
پیشنهادها
فصل 6 منابع
قیمت فایل ورد پروژه : 14000 تومان
دانلود فایل ورد بلافاصله بعد از پرداخت هزینه
بلافاصله پس از پرداخت ، لینک دانلود پایان نامه به شما نشان داده می شود
پشتیبانی سایت : 09010633413
فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید