مدل‌ سازی مسیردهی به ربات

در مقاله پیشین، مفهوم برابر با نام منبع آسیب دیدی است که توسط کتابخانه‌‌ی مذکور خروجی شده بود. در سایر موارد، شکل سطحی مفهوم یک برچسب توصیفی است که توسط انسان به ربات داده می‌‌شود‌، که این بر چسب را با تولید یک صوت بیان می‌‌کند. کتابخانه‌‌ی AL Speech Recognition برای Pepper Robot اجازه می‌‌دهد این نوع جریان به کلمه‌‌ی رشته‌‌ای که در دیکشنری برای تست متد تعریف شده است تبدیل می‌‌شود.
پالایش‌های بعدی تعریف مجموعه‌ای از سرویس‌ها را برای استفاده از بازشناخت صوت خارجی و اتکاپذیرتر و کتابخانه‌های شناسایی بصری در نظر می‌گیرند، اما خارج از بازه‌ی این اثر هستند.
وقتی که یک رشته متناظر با جریان صوتی شناسایی شد، فرآیند مسیردهی اجازه می‌دهد استنباطی صورت پذیرد که آیا این هویت قبلاً در دانش مدل‌سازی شده یا نه، و در این حالت، مفهوم واقعه‌ سازی می‌‌شود. در غیر این صورت، مفهوم باید فراگیری شده و به درستی با فرآیند ادغام در هستی‌ شناسی ترکیب شود.
برای این کار، شکل سطحی برچسب هستی شناسی و شکل سطحی مفهوم باید مسیردهی شوند. ما به معیار شباهتی که توسط Pipitone ،Tiron و Pirrone تعریف شده است اشاره می‌‌کنیم که نحوه‌‌ی نزدیکیِ بر چسب‌‌های هستی‌ شناسی و کلمه‌‌ی خارجی را محاسبه می‌‌کنند. این معیار یک جزء ساختاری را مد نظر قرار می‌‌دهد (ساختار یک جنبه‌‌ی مهم برای تمایز معادل دو عنصر متنی است). به علاوه، برای کاهش ابهام و استخراج معنای درست کلمه، یک اعانه‌‌ی معنایی نیز در نظر گرفته شده است‌.

این معیار نشانگر یک فاصله‌ی تباشه بین کلمه‌های w₁ و w₂ است. وزن آن برابر با مجموع فاصله‌ی Jaro-Winkler ( Winkler ,1999) و فاصله‌‌ی Wu-Palmer (Wu and Palmer,1994) است‌، پس:
انگیزه‌ ی اصلی در فاصله‌ ی Jaro-Winkler ویژگیِ رشته‌ هایی است که باید با هم مقایسه شوند ، یعنی کلمه‌ های کوتاهی که برچسب‌ های هستی‌ شناسی هستند . Wu-Palmer یکی از بهترین معیار های معنایی در منابع مختلف در نظر گرفته می‌شود.
آزمایش‌ها نشان می‌دهند که وزن بیشتر برای اعانه‌‌ی ساختار باعث می‌شود مفهوم معادل در هستی بهتر شناسایی شود، و پارامتر‌ها با مقادیر و تنظیم می‌‌شوند.
در برچسب‌های هستیِ O و درک p، فرآیند مسیر دهی توسط تابع مسیر دهی مدل‌ سازی می‌‌شود، یعنی‌:
که در آن تابع mer فرآیند ادغام را شروع می‌‌کند، و max₀ نیز حداکثر مقدار مجموعه‌ی S_p است که در آن‌:
تابع مسیر دهی مفهوم o را در صورتی در در هستی باز می‌‌گرداند که o با درک p با توجه به مقدار تشابه بیشتر از آستانه‌‌ی (که به صورت تجربی بر روی 0.9 تنظیم شده است) باشد. یعنی درک p مشابه o است، پس قبلاً در دانش وجود دارد، و p یک واقعه برای o می‌‌شود.
فرآیند ادغام زمانی شروع می‌‌شود که مقدار max₀ کم‌‌تر از آستانه باشد. ادغام مفهوم جدید در هستی نیازمند محاسبه‌‌ی تخصیص صحیح آن است. برای این کار، یک رویکرد احتمالی که قبلاً توسط قیاس گرامر جایگزینیِ درخت احتمالی (PTSG (Cohn, Blunsom, & Goldwater,2010 ) ارائه شده است استفاده
می‌‌کنیم. این رویکرد یک توزیع توانی برای فضایی از قوانین ایجاد می‌‌کند که ساختار‌های زبانیِ گرامری را ترکیب می‌‌کند. برای تخمین احتمال این قانون، آمار ساختار‌های زبانی آن‌‌ها باید از پیکره‌ ی زبانی فرا گرفته شود‌.
تجزیه‌‌ی رشته با استفاده از PTSG یعنی محتمل‌‌ترین ترکیب قوانین برای رشته‌ ی مورد نظر به دست آید. برای این کار از فرآیند Pitman-Yor (PYP) استفاده شده است (Pitman & Yor,1997).

اندیشه کلیدی ما این است که هستیِ ربات مجموعه‌‌ای از ساختار‌های هستی‌ شناسی است، که گره‌‌ها و سه‌گانه‌‌هایی هستند که نشانگر ویژگی‌‌ها و روابط هستند. PYP را با تخمین لینک صحیح بین این ساختارها و یک درک خاص، درست همانند تجزیه‌‌ی رشته‌‌ی قبل تعریف می‌‌کنیم. با تفاوت کمی نسبت به حالت گرامری، نیازمند آمار کافی برای محاسبه‌‌ی این احتمالات نیستیم‌، زیرا ویژگی‌‌های زبانیِ متنی که درک را با توجه به برچسب‌‌های هستی نشان می‌‌دهد در نظر می‌‌گیریم. کاربرد ربات در اتوماسیون صنعتی تحول چشمگیری در این عرصه به وجود آورد.
فرآیند PYP احتمال هر ساختار هستی‌ شناسی را منتسب می‌‌کند، و سپس محتمل‌ ترین ترکیب را برای این ساختار‌های یک مفهوم خاص پیدا می‌‌کند. فرآیند ادغام با توزیع PYP،mer (p) در ساختار‌های هستی‌ شناسی مدل‌ سازی می‌‌شود، که به این صورت است:
که در آن α و β هایپر پارامترهای فرآیندی هستند که شکل توزیع را تحت تأثیر قرار می‌‌دهند، و G₀ تابعی است که مشابه با map (p) شامل ویژگی‌‌های زبانیِ سمبولیک p در فضای o ∈ O می‌‌شود‌، و اجازه می‌‌دهد درخت جزئیِ محتمل‌ تری برای p انتخاب شود‌. در این صورت متد هیبرید است‌، که شامل یک فرآیند غیر سمبولیک ادغام شده با ویژگی‌ های سمبولیک می‌‌شود‌.
در مثال خود تعمیری که نشان دادیم‌، فرآیند مسیر دهی تابع merg را فرا خوانی می‌‌کند، زیرا معیار تشابه محاسبه شده توسط (1) زیر آستانه‌‌ی هر مفهوم در این هستی شناسی است.
جدول 1 فرآیند ادغام را نشان می‌‌دهد. مفهوم پزدازنده در این هستی‌ شناسی محتمل‌ تر از سایرین است. مفهوم جدید CPU به عنوان فرزندی از پردازنده با واقعه‌‌ی متناظر ایجاد می‌‌شود. از این لحظه، ربات منبع را مفهوم‌ سازی کرده و می‌‌تواند به دانش مربوط به خود تعمیری و یا شناسایی پردازنده‌‌ی جدید احتمالی بین مجموعه‌‌ای از قطعات یدکیِ موجود ارجاع کند‌.
جدول 1. نتایج PYP برای منبع CPU

ساختار هستی‌شناسی	نتیجه
پردازنده	0.04662
دوربین	0.03195
حافظه	0.01704
دستگاه، پردازنده	0.01251

مقادیر پُر رنگ نشانگر ساختار هستی‌ شناسی است که بهترین تطابق را برای طبقه‌ بندی با منبع دارد.
دانش جدید کشف شده و هستی شناسی به روز می‌‌شود، که در شکل 5 می‌‌بینیم. همین شکل مفاهیم ایجاد شده برای منبع را نشان می‌‌دهد، که در ساختاری هستند که به پشتیبانی PYP تعلق دارند. توجه به این نکته حائز اهمیت است که این مفاهیم به صورت معنایی به درک مشابه هستند، بنابراین، توزیع پایه پشتیبان خوبی را با خارج کردن مفاهیمی که معانیِ کاملاً متمایزی دارند تعریف می‌کند.