新葡京娱乐场-大陆娱乐场开户注册

|
北京理工大學(xué)
北京理工大學(xué) 工業(yè)和信息化部
  • 42 高校采購(gòu)信息
  • 934 科技成果項(xiàng)目
  • 1 創(chuàng)新創(chuàng)業(yè)項(xiàng)目
  • 0 高校項(xiàng)目需求

求解魯棒賽汝生產(chǎn)調(diào)度問(wèn)題的雙層魯棒強(qiáng)化學(xué)習(xí)算法

2024-12-31 10:59:24
云上高博會(huì) http://www.g2h0uzv.xyz
點(diǎn)擊收藏
所屬領(lǐng)域:
新一代信息技術(shù)
項(xiàng)目成果/簡(jiǎn)介:

賽汝生產(chǎn)方式是基于多技能化工人和簡(jiǎn)單、易移動(dòng)的設(shè)備等柔性資源,通過(guò)對(duì)人員、設(shè)備和產(chǎn)品的合理組織來(lái)實(shí)現(xiàn)高效率和高柔性的一種面向裝配生產(chǎn)系統(tǒng)的新型生產(chǎn)組織模式。賽汝生產(chǎn)方式由流水裝配線生產(chǎn)方式經(jīng)工序的重新分工以及生產(chǎn)設(shè)備的簡(jiǎn)化演變而來(lái),其采用可移動(dòng)的工作臺(tái)、簡(jiǎn)單的設(shè)備和手工工具取代了流水裝配線上的傳送帶和固定專用的自動(dòng)化機(jī)器設(shè)備,使其能夠快速、頻繁地進(jìn)行建造、改裝、拆除和重組、能有效應(yīng)對(duì)市場(chǎng)環(huán)境的變化。相比之下,傳統(tǒng)的裝配線依賴于大規(guī)模的生產(chǎn)過(guò)程,通常要求工人專注于單一的任務(wù)。在快速變化的市場(chǎng)環(huán)境中,缺乏靈活性的裝配線生產(chǎn)方式已經(jīng)不能滿足多樣化的客戶需求。作為一種電子裝配制造企業(yè)生產(chǎn)現(xiàn)場(chǎng)的新型生產(chǎn)管理方式,賽汝生產(chǎn)方式兼具高效、靈活以及快速響應(yīng)的特點(diǎn),被企業(yè)廣泛采納以提高生產(chǎn)的適應(yīng)性,以降低市場(chǎng)需求波動(dòng)帶來(lái)的負(fù)面影響。

目前賽汝生產(chǎn)調(diào)度問(wèn)題的研究大多是在假設(shè)系統(tǒng)參數(shù)已知且確定的基礎(chǔ)上進(jìn)行的,而現(xiàn)實(shí)的生產(chǎn)過(guò)程受多種不確定因素的影響,致使實(shí)際現(xiàn)場(chǎng)作業(yè)與生產(chǎn)調(diào)度計(jì)劃存在偏差。所以,現(xiàn)有的賽汝生產(chǎn)調(diào)度方法仍存在一定的局限性。為此,團(tuán)隊(duì)提出了一種基于雙層魯棒Q-learning的協(xié)同進(jìn)化算法用于求解工人處理時(shí)間不確定下的賽汝生產(chǎn)問(wèn)題。

團(tuán)隊(duì)提出的基于雙層魯棒Q-learning的協(xié)同進(jìn)化算法框架。該框架采用分而治之的方法,將復(fù)雜的賽汝生產(chǎn)調(diào)度問(wèn)題分解為兩個(gè)層次:頂層負(fù)責(zé)子問(wèn)題的選擇,底層負(fù)責(zé)子問(wèn)題的優(yōu)化。頂層具備遠(yuǎn)見能力,能夠選擇對(duì)優(yōu)化最壞情況下系統(tǒng)性能具有潛力的子問(wèn)題;底層利用迭代過(guò)程中獲取的知識(shí)快速提升解的質(zhì)量。頂層與底層的協(xié)同作用,使得所提出的魯棒Q學(xué)習(xí)模型能夠更加高效地搜索優(yōu)質(zhì)生產(chǎn)調(diào)度方案。

圖1.包含5個(gè)工人、5個(gè)產(chǎn)品批次的巡回式賽汝生產(chǎn)系統(tǒng)的示例

圖2.基于雙層Q-learning的協(xié)同進(jìn)化算法示意圖

應(yīng)用范圍:

新一代信息技術(shù)、智能調(diào)度生產(chǎn)制造領(lǐng)域等。

效益分析:

近年來(lái),賽汝生產(chǎn)系統(tǒng)中的調(diào)度問(wèn)題,尤其是工人分配調(diào)度問(wèn)題以及產(chǎn)品批次調(diào)度問(wèn)題逐漸受到關(guān)注。然而,目前賽汝生產(chǎn)調(diào)度問(wèn)題的研究大多是在假設(shè)系統(tǒng)參數(shù)已知且確定的基礎(chǔ)上進(jìn)行的,而現(xiàn)實(shí)的生產(chǎn)過(guò)程受多種不確定因素的影響,致使實(shí)際現(xiàn)場(chǎng)作業(yè)與生產(chǎn)調(diào)度計(jì)劃存在偏差。所以,現(xiàn)有的賽汝生成調(diào)度方法仍存在一定的局限性。因此,有必要開發(fā)一種基于賽汝生產(chǎn)調(diào)度的魯棒優(yōu)化方法、裝置和設(shè)備,以生成更為準(zhǔn)確的賽汝生產(chǎn)調(diào)度方案,進(jìn)而提高賽汝生產(chǎn)效率。

與傳統(tǒng)的Q-learning框架相比,本研究提出的雙層魯棒Q-learning框架具有以下兩個(gè)關(guān)鍵優(yōu)勢(shì):(i)將系統(tǒng)在最壞情況下的性能作為衡量智能體狀態(tài)的核心指標(biāo)。具體而言,設(shè)計(jì)了三個(gè)狀態(tài)指標(biāo),分別用于表征賽汝構(gòu)造子問(wèn)題、賽汝調(diào)度子問(wèn)題以及子問(wèn)題選擇在最壞情況下的優(yōu)化程度,從而顯著提升了算法在實(shí)際波動(dòng)環(huán)境中的適應(yīng)性和性能;(ii)通過(guò)引入雙層Q-learning結(jié)構(gòu),將決策過(guò)程劃分為子問(wèn)題選擇階段和優(yōu)化階段,顯著增強(qiáng)了算法在動(dòng)態(tài)搜索過(guò)程中的適應(yīng)性和靈活性。

會(huì)員登錄可查看 合作方式、專利情況及聯(lián)系方式

掃碼關(guān)注,查看更多科技成果

取消
吉利百家乐的玩法技巧和规则| 现金网| 永利博百家乐现金网| 德州扑克高级教程| 东莞百家乐官网的玩法技巧和规则| 大发888破解老虎机| 百家乐视频双扣| 在线百家乐官网官方网| 百家乐没边| 百家乐官网凯时娱乐平台| 大发888亚付宝充值| 嘉年华百家乐官网的玩法技巧和规则| 博彩网论坛| 百家乐扎金花现金| 百家乐官网娱乐平台真人娱乐平台| 注册送现金真人棋牌| 百家乐游戏规范| 风水24山对应的字为吉| 真钱百家乐官网五湖四海全讯网 | 真人百家乐ea平台| 百家乐官网透视牌靴哪里有| 二八杠绝技| 大发888官方网| 叶氏百家乐平注技巧| 百家乐官网分享| 百家乐官网桌蓝盾在线| 网络百家乐破| r百家乐娱乐下载| 百家乐官网游戏唯一官网网站 | 恒丰百家乐的玩法技巧和规则| 百家乐娱乐城博彩正网| 百家乐官网对保| 百家乐官网买隔一数| 博九娱乐城| 新濠峰百家乐的玩法技巧和规则 | 百家乐投注科学公式| 百家乐官网龙虎扑克牌游戏技巧打| 都匀市| 188比分直播网| 百家乐群sun811.com| 百家乐白菜价|