字串搜尋演算法
字串搜尋演算法(String searching algorithms)又稱字串比對演算法(string matching algorithms)是一种搜索算法,是字串演算法中的一類,用以試圖在一長字符串或文章中,找出其是否包含某一個或多個字符串,以及其位置。
最直觀的解法是比對,如下例中,在字符串haystack中找出字符串needle
char* haystack;char* needle;int hlen, nlen, found;int i,j,k;found = 0;hlen = strlen(haystack);nlen = strlen(needle);for (i = 0; i < hlen; ++i) { for (j = 0; j < nlen; ++j) { if (haystack[i+j] != needle[j]) break; if (j == nlen - 1) found = 1; };};return found;
上例中,若字符串needle存在於字符串haystack中,則傳回1,否則傳回0。
但是此直觀算法的複雜度為 O(mn),其中haystack的長度為n、needle的長度為m,所以另有更快速的算法。
部分算法比较编辑
令 m 为模式的长度, n 为要搜索的字符串长度, k为字母表长度。
算法 | 预处理时间 | 匹配时间 |
---|---|---|
朴素算法 | 0 (无需预处理) | Θ(nm) |
Rabin-Karp算法 | Θ(m) | 平均 Θ(n + m), 最差 Θ((n−m)m) |
基于有限状态机的搜索 | Θ(mk) | Θ(n) |
克努斯-莫里斯-普拉特算法 | Θ(m) | Θ(n) |
Boyer-Moore字符串搜索算法 | Θ(m + k) | 最好Ω(n/m), 最坏 O(n) |
Bitap算法 | Θ(m + k) | O(mn) |
外部連結编辑
- Huge (maintained) list of pattern matching links(页面存档备份,存于互联网档案馆)
- StringSearch — high-performance pattern matching algorithms in Java[失效連結] – Implementations of many String-Matching-Algorithms in Java (BNDM, Boyer-Moore-Horspool, Boyer-Moore-Horspool-Raita, Shift-Or)
- Exact String Matching Algorithms—Animation in Java(页面存档备份,存于互联网档案馆)
- String similarity metrics
- Project Dedupe http://dedupe.sourceforge.net[永久失效連結]
- Boyer-Moore-Raita-Thomas
🔥 Top keywords: Baike: 首页Special:搜索九龍城寨之圍城淚之女王2024年湯姆斯盃背着善宰跑不夠善良的我們安東尼·愛德華茲 (籃球運動員)金智媛2024年優霸盃胖猫跳江事件伍允龍金秀賢 (男演員)九龍寨城劉俊謙 (香港)怪獸8號春色寄情人汤姆斯杯虽然不是英雄Energy (組合)逆天奇案2习近平我的婆婆怎麼那麼可愛排球少年!!角色列表邊佑錫为人民服务 (2022年电影)Seventeen (組合)張文傑排球少年!!草蜢 (組合)2012搜查班長1958六四事件母亲节乘風2024破墓ILLITWIND BREAKER—防風少年—城市猎人 (2024年电影)支配物种與鳳行歐倩怡BOYNEXTDOOR鄧麗君达柳斯·莫里斯BABYMONSTER中华人民共和国承欢记中華民國胡子彤金惠奫城市猎人周處除三害 (電影)蔡一智蔡一傑郭晉安迷宮飯2024年英雄联盟季中邀请赛IVE (組合)沒有秘密蘇志威周雨彤尤伯杯五月天葬送的芙莉蓮哥吉拉-1.0許瑋甯草榴社区朴成焄日本千玗嬉香港(G)I-DLE林依晨李主儐李琳琳五四运动完全省錢戀愛手冊习明泽林峯鈴木亮平三流之路夜晚的水母不會游泳郭葦昀三体 (小说)李现幕府將軍 (2024年電視劇)白鹿 (演員)毛泽东張員瑛郑保瑞白紙運動立夏嚴爵星汉灿烂·月升沧海莊祖宜無職轉生~到了異世界就拿出真本事~THE NEW GATE張書偉