جستجوی مینیمم بازه‌ای

A Constructing the corresponding cartesian tree to solve a range minimum query. — مسئله جستجوی مینیمم بازه‌ای کاهش یافته به مسئله پایین‌ترین جد مشترک

در علوم کامپیوتر، یک جستجوی میبنیمم بازه‌ای (Range minimum query) الگوریتمی برای یافتن کوچکترین عنصر در یک زیر آرایه (بازه‌ای از یک آرایه) با عناصر قابل مقایسه است.

الگوریتم جستجوی مینیمم بازه‌ای در علوم و مهندسی کامپیوتر کاربردهای فراوانی دارند. از جمله آنان می‌توان به یافتن پایین‌ترین والد مشترک (مثلا در درخت یا هرم یا …) یا طولانی‌ترین پیشوند مشترک (LCP) اشاره کرد. (لینک خارجی LCP array)

تعریف

با توجه به یک آرایه [A[1 … n از n اشیاء از یک مجموعه منظم(خوش ترتیب) (مانند اعداد)، جستجوی مینیمم بازه‌ای [RMQ A(l,r) =arg min A[k (با ۱ ≤ l ≤ k ≤ r ≤ n ) موقعیت(اندیس ) کوچکترین عنصر را در زیربازه‌ی مشخص شده [A[l … r بازمی‌گرداند.

به عنوان مثال ، وقتی الگو:ریاضی، آنگاه پاسخ به سؤال از دامنه الگو:ریاضی برای زیر مجموعه A برابر است با ۷. زیرا A[7] = ۱. و پاسخ، موقعیت کوچکترین عنصر در زیربازهٔ مشخص شده را به ما می‌دهد. (البته اینجا اندیس‌ها را برای سادگی از یک شروع کردیم. اما در واقعیت از ۰ آغاز می‌شوند)

الگوریتم‌ها

راه حل بدیهی

در یک مجموعه رایج، آرایه A استاتیک است، یعنی عناصر در طی یک سری پرس و جوها درج یا حذف نمی‌شوند؛ و جستجوهای داده شده باید به صورت درجا پاسخ داده شوند (یعنی کل مجموعه نمایش داده‌ها از قبل با الگوریتم مشخص نیست) در این حالت، پیش پردازش مناسب آرایه در یک داده ساختار، پاسخ سریع تر پرس و جو را تضمین می‌کند. یک راه حل ساده این است که پاسخ تمام جستجوهای ممکن را از قبل حساب کنیم، یعنی مینیمم تمام زیر مجموعه‌های A، و این موارد را در یک آرایه B ذخیره کنید به طوری که [B[i, j] = min(A[i…j) ؛ سپس با استفاده از جستجوی آرایه در B یک جستجوی مینیمم در زمان ثابت حل می‌شود. تعداد (Θ(n² جستجوی مختلف روی آرایه‌ای به طول n وجود دارد، و پاسخ به این سوالات را می‌توان در زمان (Θ(n² توسط برنامه‌نویسی پویا بدست آورد.

راه حل با استفاده از زمان ثابت و حافظه خطی

جدول نتیجه برای الگو:ریاضی
		الگو:Mvar
		۰	۱	۲	۳
الگو:Mvar	۱	۱	۱	۱	۱
	۲	۲	۳	۳	۷
	۳	۳	۳	۳	۷
	۴	۴	۵	۶	۷
	۵	۵	۶	۷	۷
	۶	۶	۷	۷	۷
	۷	۷	۷	۷	۷
	۸	۸	۷	۷	۷
	۹	۹	۷	۷	۷

مانند راه حل بالا، پاسخ دادن به این سؤالات در زمان ثابت با نتایج از پیش محاسباتی حاصل می‌شود. با این حال، این آرایه جستجوهای مینیمم از پیش محاسبه شده را برای محدوده‌هایی که اندازه آن‌ها توانی از ۲ است برای همه عناصر ذخیره می‌کند. برای هر موقعیت شروع i به تعداد (Θ(log n از این جستجوها وجود دارد، بنابراین اندازه جدول برنامه‌نویسی پویا B برابر با (Θ (n log n است. هر عنصر [B [i, j دارای اندیس مینیمم محدوده [A [i … i + 2^j-1 است. جدول به کمک خاصیت بازگشت از اندیس‌های مینیمم‌ها پر شده‌است.

اگر الگو:ریاضی،

آن گاه الگو:ریاضی.

در غیر این صورت، الگو:ریاضی.

اکنون با تقسیم آن به دو پرس و جو جداگانه می‌توان به پرس و جو (RMQ A(l,r پاسخ داد: یکی پرس و جو از پیش محاسبه شده با دامنه از l تا بالاترین مرز کوچکتر از r (که طول این بازه توانی از ۲ است). مورد دیگر عبارت است از یک بازه با همان طول که r آن را به عنوان مرز سمت راست خود دارد. این فواصل ممکن است با هم هم پوشانی داشته باشند، اما با توجه به اینکه مینیمم به جای جمع، محاسبه می‌شود، این مهم نیست. نتیجه کلی را می‌توان در زمان ثابت بدست آورد زیرا می‌توان به این دو پرس و جو در زمان ثابت پاسخ داد و تنها کاری که باقی مانده‌است ، انتخاب عنصر کوچکتر بین دو عنصر جواب این دو نتیجه است. (که حتی ممکن است یکی باشند)

راه حل با استفاده از زمان لگاریتمی و حافظه خطی

این راه حل RMQ را در (O(log n پاسخ می‌دهد. داده ساختار آن حافظه‌ای از مرتبهٔ (O(n می‌گیرد و از این داده ساختار نیز می‌توان برای پاسخ به جستجوها در زمان ثابت استفاده کرد. این آرایه ابتدا از نظر مفهومی به بلوک‌هایی با اندازه $s = \frac{l o g (n)}{4}$ تقسیم می‌شود. سپس عنصر مینیمم برای هر بلوک در (O(n محاسبه می‌شود و مینیمم‌ها در یک آرایه جدید ذخیره می‌شوند.

اکنون RMQها را می‌توان با مراجعه به بلوک‌های حاوی مرز سمت چپ و راست بازه داده شده در طرفین، و تمام بلوک‌های موجود در زمان لگاریتمی پاسخ دهید:

دو بلوک حاوی مرزها را می‌توان به سادگی جستجو کرد. عناصر خارج از مرز حتی لازم نیست مورد بررسی قرار گیرند. این کار در زمان لگاریتمی قابل انجام است.

مینیمم تمام بلوک‌هایی که به‌طور کامل در محدوده موجود است و دو مینیمم ذکر شده در بالا، برای پاسخ به پرس و جو باید مقایسه شوند. از آنجا که آرایه به بلوک‌هایی با اندازه $\frac{l o g (n)}{n}$ تقسیم شده‌است، حداکثر $4 \frac{n}{l o g (n)}$ بلوک وجود خواهند داشت که کاملاً در داخل محدوده قرار دارند.

با استفاده از راه حل خطی می‌توان مینیمم کلی را در بین این بلوک‌ها پیدا کرد. این داده ساختار دارای اندازه (O( $\frac{n}{l o g (n)}$ * log( $\frac{n}{l o g (n)}$ )) است.

به عنوان مثال، با استفاده از آرایه [A = [۰٬۵٬۲٬۵٬۴٬۳٬۱٬۶٬۳ و اندازه بلوک ۳ (فقط برای اهداف مصور) آرایه مینیمم [A' = [۰٬۳٬۱ را برمی‌گرداند.

راه حل با استفاده از زمان ثابت و حافظه خطی

با استفاده از راه حل فوق ، زیر محدوده‌های داخل بلوک‌هایی که به‌طور کامل در آن محدوده قرار ندارند ، هنوز هم باید در زمان ثابت پاسخ داده شوند. حداکثر دو بلوک وجود دارد: بلوک حاوی l و بلوک حاوی r . با نگه داشتن درختان دکارتی برای تمام بلوک‌های موجود در آرایه ، زمان ثابت حاصل می‌شود. تعدادی از مشاهدات:

بلوک‌های دارای درختان ایزومورفیک یا یکریخت دکارتی نتیجه یکسان را برای همه جستجوهای موجود در آن بلوک می‌دهند.
تعداد درختان مختلف دکارتی از s گره برابر است با Cs که s'امین عدد کاتالان است.
بنابراین، تعداد درختان مختلف دکارتی برای بلوک‌ها در محدوده الگو:ریاضی قرار دارد.

برای هر درخت این چنینی، نتیجه احتمالی برای همه سؤالات باید ذخیره شود. این به ورودی‌های از مرتبه الگو:Math یا الگو:Math بستگی دارد. این بدان معنی است که اندازه کلی جدول (O(n است.

برای جستجوی بهینهٔ نتایج، درخت دکارتی (ردیف) مربوط به یک بلوک خاص باید در زمان ثابت مورد قرار گیرد. راه حل این است که نتایج را برای کلیه درختان در یک آرایه ذخیره کرده و یک تصویرسازی و طرح‌ریزی منحصر به فرد از درختان باینری به اعداد صحیح برای آدرس دهی پیدا کنید. این کار را می‌توان با انجام یک پیمایش درخت روی درخت و اضافه کردن گره‌های برگ بدست آورد به طوری که هر گره موجود در درخت دکارتی دقیقاً دو فرزند داشته باشد. سپس عدد صحیح با به نمایش گذاشتن هر گره درونی به عنوان یک بیت ۰ و هر برگ به عنوان بیت ۱ در یک بیت کلمه (با عبور دوباره درخت به صورت سطح به سطج) ایجاد می‌شود. این برای هر درخت به اندازه $\frac{l o g (n)}{4}$ منجر می‌شود. برای فعال کردن دسترسی تصادفی در زمان ثابت به هر درخت، درختانی که در آرایه اصلی موجود نیستند نیز باید در آرایه درج شوند. آرایه‌ای با شاخص‌های به طول $\frac{l o g (n)}{4}$ بیت، اندازه‌ای از مرتبهٔ ^{$\frac{l o g (n)}{4}$} 2 دارند.

نتایج پیش پردازش برای درخت دکارتی روی لیست A الگو:Math
Index	1			2			۳
Index	۱	۲	۳	۱	۲	۳	۱	۲	۳
0	colspan="9" الگو:Sdash
23 (Bitword 0010111)	1	2	3	الگو:Sdash	2	3	الگو:Sdash	الگو:Sdash	۳
39 (Bitword 0100111)	1	1	1	الگو:Sdash	2	3	الگو:Sdash	الگو:Sdash	۳
127	colspan="9" الگو:Sdash

کاربردها

RMQها به عنوان ابزاری برای بسیاری از کارها در تطابق دقیق و تقریبی رشته استفاده می‌شوند. چندین کاربرد را می‌توان در مقاله‌های فیشر و هون (۲۰۰۷) یافت.^[۱] الگو:Rp

محاسبه پایین‌ترین جد مشترک در یک درخت

RMQها می‌توانند برای حل مسئله پایین‌ترین جد مشترک^[۲] استفاده شوند و به عنوان ابزاری برای بسیاری از کارها در تطابق دقیق و تقریبی رشته استفاده می‌شوند. query الگو:ریاضی از یک درخت ریشه دار الگو:ریاضی و دو گره الگو:ریاضی عمیق‌ترین گره الگو:Mvar (که ممکن است الگو:Mvar یا الگو:Mvar باشد) را در مسیرهای ریشه به هر دو الگو:Mvar بازمی‌گرداند؛ و الگو:Mvar گابوو ، بنتلی و تارجان (۱۹۸۴) نشان دادند که مسئله LCA می‌تواند در زمان خطی به مسئله RMQ تقلیل یابد. از این رو نتیجه می‌گیرد که مانند مسئله RMQ، مسئله LCA می‌تواند در زمان ثابت و حافظهٔ خطی حل شود.^[۱]

الگوریتم جستجوی مینیمم بازه‌ای در علوم و مهندسی کامپیوتر کاربردهای فراوانی دارند. از جمله آنان می‌توان به یافتن پایین‌ترین والد مشترک (مثلا در درخت یا هرم یا …) یا طولانی‌ترین پیشوند مشترک (LCP) اشاره کرد.

محاسبه طولانی‌ترین پیشوند مشترک در یک رشته

این مفهوم در برنامه‌های بسیاری بکار می‌رود.

در زمینه نمایه سازی متن، از RMQها می‌توان برای یافتن LCP (طولانی‌ترین پیشوند مشترک) استفاده کرد، جایی که الگو:ریاضی LCP پسوندهایی را که در شاخص‌های الگو:Mvar و الگو:Mvar در الگو:Mvar شروع می‌شود الگو:ریاضی محاسبه می‌کند. برای این کار ابتدا آرایه پسوند الگو:Mvar و آرایه پسوند معکوس الگو:ریاضی را محاسبه می‌کنیم. سپس LCP آرایه الگو:Mvar را به کمک LCP پسوندهای مجاور در الگو:Mvar محاسبه می‌کنیم. پس از محاسبه این ساختارهای داده، و پردازش RMQ کامل می‌شود، طول LCP عمومی را می‌توان در زمان ثابت با فرمول محاسبه کرد: الگو:ریاضی، جایی که ما برای سادگی فرض می‌کنیم که الگو:ریاضی (در غیر این صورت مبادله می‌کنیم).^[۳]

جستارهای وابسته

انگلیسی

فارسی

منابع

الگو:چپ‌چین

↑ ^۱٫۰ ^۱٫۱ Fischer, Johannes; Heun, Volker (2007). A New Succinct Representation of RMQ-Information and Improvements in the Enhanced Suffix Array. Proceedings of the International Symposium on Combinatorics, Algorithms, Probabilistic and Experimental Methodologies. LNCS. 4614. Springer. pp. 459–470. doi:10.1007/978-3-540-74450-4_41.<templatestyles src="Module:Citation/CS1/styles.css"></templatestyles>
↑ الگو:Cite journal
↑ الگو:Cite book

^[۱]الگو:پانویس

الگو:پایان چپ‌چین

پیوند به بیرون

↑ Fischer, Johannes; Heun, Volker (2007). A New Succinct Representation of RMQ-Information and Improvements in the Enhanced Suffix Array. Proceedings of the International Symposium on Combinatorics, Algorithms, Probabilistic and Experimental Methodologies. LNCS. 4614. Springer. pp. 459–470. doi:10.1007/978-3-540-74450-4_41.<templatestyles src="Module:Citation/CS1/styles.css"></templatestyles>

[fischer07-1] ۱٫۰ ^۱٫۱ Fischer, Johannes; Heun, Volker (2007). A New Succinct Representation of RMQ-Information and Improvements in the Enhanced Suffix Array. Proceedings of the International Symposium on Combinatorics, Algorithms, Probabilistic and Experimental Methodologies. LNCS. 4614. Springer. pp. 459–470. doi:10.1007/978-3-540-74450-4_41.<templatestyles src="Module:Citation/CS1/styles.css"></templatestyles>

[bender-jalg-2] الگو:Cite journal

[10.1007/11780441_5-3] الگو:Cite book

[fischer07-4] Fischer, Johannes; Heun, Volker (2007). A New Succinct Representation of RMQ-Information and Improvements in the Enhanced Suffix Array. Proceedings of the International Symposium on Combinatorics, Algorithms, Probabilistic and Experimental Methodologies. LNCS. 4614. Springer. pp. 459–470. doi:10.1007/978-3-540-74450-4_41.<templatestyles src="Module:Citation/CS1/styles.css"></templatestyles>

[۱]

[۲]

[۳]

[۱]

جستجوی مینیمم بازه‌ای

فهرست

تعریف

الگوریتم‌ها

راه حل بدیهی

راه حل با استفاده از زمان ثابت و حافظه خطی

راه حل با استفاده از زمان لگاریتمی و حافظه خطی

راه حل با استفاده از زمان ثابت و حافظه خطی

کاربردها

محاسبه پایین‌ترین جد مشترک در یک درخت

محاسبه طولانی‌ترین پیشوند مشترک در یک رشته

جستارهای وابسته

انگلیسی

فارسی

منابع

پیوند به بیرون

منوی ناوبری