新葡京娱乐场-大陆娱乐场开户注册

|
電子科技大學
電子科技大學 教育部
  • 34 高校采購信息
  • 524 科技成果項目
  • 74 創新創業項目
  • 0 高校項目需求

一種基于關鍵詞的主題網絡爬蟲設計方法

2021-04-10 00:00:00
云上高博會 http://www.g2h0uzv.xyz
點擊收藏
所屬領域:
人工智能
項目成果/簡介:
本發明提供一種基于關鍵詞的主題網絡爬蟲設計方法,包括:(1)配置主題關鍵詞的搜索URL,形成初始種子超鏈接originalURL;(2)根據originalURL,在搜索引擎中進行檢索并下載網頁,基于網頁內容抽取新聞的初步字段;(3)根據主題相關性算法,得到每篇新聞與主題的相似性,將與主題相關的新聞字段保留下來放入公共隊列newsQueue中,過濾掉與主題不相關的新聞;(4)根據nextPageURL下載下一頁的網頁內容,抽取出nextPageURL和步驟(3)所述的相關字段,將后者放入公共隊列newsQueue中,不斷重復步驟(4),直到沒有下一頁超鏈接nextPageURL為止;(5)從newsQueue中取出URL交給爬蟲處理線程,即消費者線程。
項目階段:
試用
會員登錄可查看 合作方式、專利情況及聯系方式

掃碼關注,查看更多科技成果

取消
新利88国际娱乐网| 百家乐官网巴厘岛娱乐城| 老虎机上分器| 娱乐城百家乐官网可以代理吗 | 大发888线上官方网站| 三公百家乐官网在线哪里可以玩| 大发888娱乐场 ylc8| 汇丰百家乐官网的玩法技巧和规则 | 七乐亚洲娱乐| 百家乐庄闲排列| 百家乐官网斗地主炸金花| 棋牌新教室| 百家乐网站制作| 百家乐官网一起多少张牌| 浦东新区| 大发888在线娱乐| 百家乐赌博娱乐| JJ百家乐官网的玩法技巧和规则 | 大发888下载 df888gfxzylc8| 大佬娱乐城怎么样| 破战百家乐的玩法技巧和规则| 百家乐官网有方式赢钱吗| 澳门足球| 大发888游戏平台103| 马尼拉百家乐的玩法技巧和规则| 百家乐官网赌场详解| 大家赢百家乐投注| 开心8百家乐官网游戏| 棋牌评测网站| 威尼斯人娱乐城老lm0| 玩百家乐平台| 24山择日财丁贵日| 豪华百家乐官网桌子| 娱乐城百家乐官网规则| 大西洋城娱乐| 大发888出纳| 百家乐秘诀| 百家乐最新打法| 最可信百家乐官网娱乐城| 百家乐官网玩法守则| ,瑞丰国际娱乐场|