در مقاله پیشین، مفهوم برابر با نام منبع آسیب دیدی است که توسط کتابخانهی مذکور خروجی شده بود. در سایر موارد، شکل سطحی مفهوم یک برچسب توصیفی است که توسط انسان به ربات داده میشود، که این بر چسب را با تولید یک صوت بیان میکند. کتابخانهی AL Speech Recognition برای Pepper Robot اجازه میدهد این نوع جریان به کلمهی رشتهای که در دیکشنری برای تست متد تعریف شده است تبدیل میشود.
پالایشهای بعدی تعریف مجموعهای از سرویسها را برای استفاده از بازشناخت صوت خارجی و اتکاپذیرتر و کتابخانههای شناسایی بصری در نظر میگیرند، اما خارج از بازهی این اثر هستند.
وقتی که یک رشته متناظر با جریان صوتی شناسایی شد، فرآیند مسیردهی اجازه میدهد استنباطی صورت پذیرد که آیا این هویت قبلاً در دانش مدلسازی شده یا نه، و در این حالت، مفهوم واقعه سازی میشود. در غیر این صورت، مفهوم باید فراگیری شده و به درستی با فرآیند ادغام در هستی شناسی ترکیب شود.
برای این کار، شکل سطحی برچسب هستی شناسی و شکل سطحی مفهوم باید مسیردهی شوند. ما به معیار شباهتی که توسط Pipitone ،Tiron و Pirrone تعریف شده است اشاره میکنیم که نحوهی نزدیکیِ بر چسبهای هستی شناسی و کلمهی خارجی را محاسبه میکنند. این معیار یک جزء ساختاری را مد نظر قرار میدهد (ساختار یک جنبهی مهم برای تمایز معادل دو عنصر متنی است). به علاوه، برای کاهش ابهام و استخراج معنای درست کلمه، یک اعانهی معنایی نیز در نظر گرفته شده است.
این معیار نشانگر یک فاصلهی تباشه بین کلمههای w1 و w2 است. وزن آن برابر با مجموع فاصلهی Jaro-Winkler ( Winkler ,1999) و فاصلهی Wu-Palmer (Wu and Palmer,1994) است، پس:
انگیزه ی اصلی در فاصله ی Jaro-Winkler ویژگیِ رشته هایی است که باید با هم مقایسه شوند ، یعنی کلمه های کوتاهی که برچسب های هستی شناسی هستند . Wu-Palmer یکی از بهترین معیار های معنایی در منابع مختلف در نظر گرفته میشود.
آزمایشها نشان میدهند که وزن بیشتر برای اعانهی ساختار باعث میشود مفهوم معادل در هستی بهتر شناسایی شود، و پارامترها با مقادیر و تنظیم میشوند.
در برچسبهای هستیِ O و درک p، فرآیند مسیر دهی توسط تابع مسیر دهی مدل سازی میشود، یعنی:
که در آن تابع mer فرآیند ادغام را شروع میکند، و max0 نیز حداکثر مقدار مجموعهی Sp است که در آن:
تابع مسیر دهی مفهوم o را در صورتی در در هستی باز میگرداند که o با درک p با توجه به مقدار تشابه بیشتر از آستانهی (که به صورت تجربی بر روی 0.9 تنظیم شده است) باشد. یعنی درک p مشابه o است، پس قبلاً در دانش وجود دارد، و p یک واقعه برای o میشود.
فرآیند ادغام زمانی شروع میشود که مقدار max0 کمتر از آستانه باشد. ادغام مفهوم جدید در هستی نیازمند محاسبهی تخصیص صحیح آن است. برای این کار، یک رویکرد احتمالی که قبلاً توسط قیاس گرامر جایگزینیِ درخت احتمالی (PTSG (Cohn, Blunsom, & Goldwater,2010 ) ارائه شده است استفاده
میکنیم. این رویکرد یک توزیع توانی برای فضایی از قوانین ایجاد میکند که ساختارهای زبانیِ گرامری را ترکیب میکند. برای تخمین احتمال این قانون، آمار ساختارهای زبانی آنها باید از پیکره ی زبانی فرا گرفته شود.
تجزیهی رشته با استفاده از PTSG یعنی محتملترین ترکیب قوانین برای رشته ی مورد نظر به دست آید. برای این کار از فرآیند Pitman-Yor (PYP) استفاده شده است (Pitman & Yor,1997).
اندیشه کلیدی ما این است که هستیِ ربات مجموعهای از ساختارهای هستی شناسی است، که گرهها و سهگانههایی هستند که نشانگر ویژگیها و روابط هستند. PYP را با تخمین لینک صحیح بین این ساختارها و یک درک خاص، درست همانند تجزیهی رشتهی قبل تعریف میکنیم. با تفاوت کمی نسبت به حالت گرامری، نیازمند آمار کافی برای محاسبهی این احتمالات نیستیم، زیرا ویژگیهای زبانیِ متنی که درک را با توجه به برچسبهای هستی نشان میدهد در نظر میگیریم. کاربرد ربات در اتوماسیون صنعتی تحول چشمگیری در این عرصه به وجود آورد.
فرآیند PYP احتمال هر ساختار هستی شناسی را منتسب میکند، و سپس محتمل ترین ترکیب را برای این ساختارهای یک مفهوم خاص پیدا میکند. فرآیند ادغام با توزیع PYP،mer (p) در ساختارهای هستی شناسی مدل سازی میشود، که به این صورت است:
که در آن α و β هایپر پارامترهای فرآیندی هستند که شکل توزیع را تحت تأثیر قرار میدهند، و G0 تابعی است که مشابه با map (p) شامل ویژگیهای زبانیِ سمبولیک p در فضای o ∈ O میشود، و اجازه میدهد درخت جزئیِ محتمل تری برای p انتخاب شود. در این صورت متد هیبرید است، که شامل یک فرآیند غیر سمبولیک ادغام شده با ویژگی های سمبولیک میشود.
در مثال خود تعمیری که نشان دادیم، فرآیند مسیر دهی تابع merg را فرا خوانی میکند، زیرا معیار تشابه محاسبه شده توسط (1) زیر آستانهی هر مفهوم در این هستی شناسی است.
جدول 1 فرآیند ادغام را نشان میدهد. مفهوم پزدازنده در این هستی شناسی محتمل تر از سایرین است. مفهوم جدید CPU به عنوان فرزندی از پردازنده با واقعهی متناظر ایجاد میشود. از این لحظه، ربات منبع را مفهوم سازی کرده و میتواند به دانش مربوط به خود تعمیری و یا شناسایی پردازندهی جدید احتمالی بین مجموعهای از قطعات یدکیِ موجود ارجاع کند.
جدول 1. نتایج PYP برای منبع CPU
ساختار هستیشناسی | نتیجه |
پردازنده | 0.04662 |
دوربین | 0.03195 |
حافظه | 0.01704 |
دستگاه، پردازنده | 0.01251 |
مقادیر پُر رنگ نشانگر ساختار هستی شناسی است که بهترین تطابق را برای طبقه بندی با منبع دارد.
دانش جدید کشف شده و هستی شناسی به روز میشود، که در شکل 5 میبینیم. همین شکل مفاهیم ایجاد شده برای منبع را نشان میدهد، که در ساختاری هستند که به پشتیبانی PYP تعلق دارند. توجه به این نکته حائز اهمیت است که این مفاهیم به صورت معنایی به درک مشابه هستند، بنابراین، توزیع پایه پشتیبان خوبی را با خارج کردن مفاهیمی که معانیِ کاملاً متمایزی دارند تعریف میکند.
دیدگاه خود را ثبت کنید
میخواهید به بحث بپیوندید؟مشارکت رایگان.