<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML>
<HEAD><TITLE></TITLE>
<STYLE>
body, table, tr, td, p {margin: 0px 0px 0px 0px}
.bgtabl {BACKGROUND-REPEAT: no-repeat}
</STYLE>
</HEAD>
<BODY bgProperties="fixed" bgcolor="#FFFFFF">



Hi!<br><br>Is it as fast as Klacke "posregex"?<br>http://yaws.hyber.org/download/posregex-1.0.tgz<br><br>cheers<br>Younès<br><br>----Message d'origine----
<br>>Date: Mon, 18 Dec 2006 18:59:01 +0400
<br>>De: Gaspar Chilingarov <nm@web.am>
<br>>A: "Erlang Users' List" <erlang-questions@erlang.org>
<br>>Sujet: [erlang-questions] Fast regular expression implementation
<br>>
<br>>Hi all!
<br>>
<br>>I wish to announce implementation of regular expressions in erlang, 
<br>>which works fast enough to be useful for text processing and extraction.
<br>>
<br>>Please follow the link for download: http://zanazan.am/erlang/re.html
<br>>
<br>>There are some things which are not implemented for now (i.e. or 
<br>>operator "|" between regexp branches).
<br>>
<br>>Subpatterns are extracted using (), grouping without extraction is done 
<br>>as in a perl - (?:pattern). Multiple nested subpatterns are allowed.
<br>>
<br>>I've tried to keep behavior as much as possible close to perl patterns.
<br>>
<br>>All substitute functions are missing at the moment -- I will be glad to 
<br>>get suggestions what should be implemented besides standard sub/gsub.
<br>>
<br>>Library is quite fast - 18kb text matches against
<br>>"class=g.*?<a\s+class=l\s+href=\"(.*?)\">(.*?)" pattern to extract 
<br>>all matches in 10-12ms (if you ask only for positions). If you ask only 
<br>>for subpattern matches (i.e. re:mgg) it works only 18ms.
<br>>
<br>>Same text duplicated together 100 times (1.8Mb) is matched in a first 
<br>>case in 1.2sec, with subpatterns text extraction - about 2.5sec, so
<br>>matching time grows linearly. In case of gregexp implementation time in 
<br>>a exponential manner.
<br>>
<br>>
<br>>I would like to listen any feedback and especially bug reports.
<br>>
<br>>/Gaspar
<br>>
<br>>-- 
<br>>Gaspar Chilingarov
<br>>
<br>>System Administrator,
<br>>Network security consulting
<br>>
<br>>t +37493 419763 (mob)
<br>>i 63174784
<br>>e nm@web.am
<br>>_______________________________________________
<br>>erlang-questions mailing list
<br>>erlang-questions@erlang.org
<br>>http://www.erlang.org/mailman/listinfo/erlang-questions
<br>>


</a\s+class=l\s+href=\"(.*?)\"></erlang-questions@erlang.org></nm@web.am></body></html>