Search results
Jump to navigation
Jump to search
- === Q-learning: یادگیری تقویتی برای مبتدیان === ...وری دادهها استفاده میکند متفاوت است. این مقاله به صورت جامع و گام به گام Q-learning را برای افراد مبتدی توضیح میدهد. ...12 KB (274 words) - 18:35, 29 April 2025
- ...یفیت (Q-value) هر جفت حالت-عمل (State-Action Pair) حفظ میکند. با این حال، Q-learning در محیطهای با فضای حالت بزرگ، مانند باز� [[شبکه کیو عمیق]] (Deep Q-Network یا DQN) یک پیشرفت مهم در Q-learning است که از [[شبکههای عصبی عمیق]] (Deep Neural Netwo ...14 KB (228 words) - 11:54, 28 April 2025
- * [[Q-Learning]]: یک الگوریتم پرکاربرد که تابع Q را بهرو� * [[SARSA]]: الگوریتمی مشابه Q-Learning، اما با استفاده از عمل فعلی برای بهروزر� ...14 KB (119 words) - 18:02, 16 May 2025
- ...ا به حداکثر برساند. مثالهایی از الگوریتمهای یادگیری تقویتی عبارتند از: [[Q-Learning]]، [[Deep Q-Network (DQN)]]، و [[سیاست گرادیان (Policy Gradi ### Q-Learning ...14 KB (215 words) - 01:58, 2 May 2025
- ...خود را تنظیم میکند. مثالهایی از الگوریتمهای یادگیری تقویتی عبارتند از [[Q-learning]] و [[شبکههای عصبی عمیق تقویتی]]. === Q-learning === ...13 KB (83 words) - 04:51, 3 May 2025
- ...ریق آن یاد میگیرد. الگوریتمهای یادگیری تقویتی مختلفی وجود دارند، مانند [[Q-learning]]، [[SARSA]]، و [[Policy Gradients]]. ...ی تقویتی بدون مدل و مبتنی بر ارزش است که سعی میکند تابع Q را یاد بگیرد. [[Q-learning]] یکی از محبوبترین و پرکاربردترین الگور� ...15 KB (125 words) - 20:10, 29 April 2025
- * **Q-Learning:** یک الگوریتم یادگیری تقویتی که یک تابع Q * **SARSA:** یک الگوریتم یادگیری تقویتی مشابه Q-Learning که از یک سیاست خاص برای انتخاب اعمال استف� ...15 KB (135 words) - 07:34, 29 April 2025
- ...چگونه بهترین تصمیمها را بگیرد. مثالهایی از این الگوریتمها عبارتند از [[Q-learning]] و [[Deep Q-Network]]. ...الگوریتمها در بازارهای واقعی به کار گرفته میشوند. الگوریتمهایی مانند [[Q-learning]] و [[Deep Q-Network]] در این استراتژیها کاربرد د ...13 KB (55 words) - 13:47, 2 May 2025
- * **Q-Learning:** یک الگوریتم مبتنی بر ارزش است که یک تابع * **SARSA:** یک الگوریتم مبتنی بر ارزش است که مشابه Q-Learning است، اما از یک سیاست on-policy استفاده میکند ...16 KB (105 words) - 18:04, 16 May 2025
- 12 KB (271 words) - 21:31, 12 May 2025
- ...برای یافتن بهترین استراتژی معاملاتی در یک محیط داده شده استفاده میشود. [[Q-Learning در معاملات]] ...14 KB (115 words) - 13:37, 2 May 2025
- روشهای سنتی یادگیری تقویتی، مانند [[Q-learning]] و [[SARSA]]، تلاش میکنند تا یک تابع ارزش یا ...انجام دهد. این کار معمولاً با استفاده از یک روش یادگیری تقویتی سنتی، مانند Q-learning، انجام میشود. ...15 KB (86 words) - 19:14, 16 May 2025
- ...د. در نتیجه، عامل میتواند با استفاده از الگوریتمهای استاندارد RL مانند [[Q-learning]] یا [[Policy Gradient]]، یک سیاست بهینه را یاد بگی� * **QMIX:** یک الگوریتم مبتنی بر [[Q-learning]] که از یک شبکه Mixing برای ترکیب مقادیر Q از ع ...15 KB (141 words) - 18:06, 16 May 2025
- 14 KB (227 words) - 08:22, 30 April 2025
- [[تحلیل تکنیکال مبتنی بر Q-Learning]] [[تحلیل تکنیکال مبتنی بر Q-Learning]] ...38 KB (702 words) - 11:15, 6 May 2025
- ...نه بهترین استراتژی را برای دستیابی به یک هدف خاص اتخاذ کند. مثالها شامل [[Q-learning]] و [[Deep Q-Network]] هستند. ...13 KB (154 words) - 22:25, 26 March 2025
- 16 KB (151 words) - 08:06, 17 April 2025
- 15 KB (69 words) - 02:51, 7 May 2025
- ...الگوریتمها میتوانند برای توسعه سیستمهای معاملاتی خودکار استفاده شوند. [[Q-learning]] و [[Deep Q-Network]] (DQN) از جمله الگوریتمهای یا� ...16 KB (71 words) - 10:53, 2 May 2025
- [[Category:استراتژی_Q-Learning]] (Q-Learning Strategy) ...20 KB (266 words) - 11:42, 13 May 2025