python使用re匹配字符串中重复出现的字母

作者：佚名字体：[增加减小] 来源：互联网时间：2017-06-07

佚名通过本文主要向大家介绍了python re,python中re.compile,python中re模块,python import re,python re模块等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

问题：python使用re匹配字符串中重复出现的字母
描述:

（1）现在想要将字符串中连续出现的同个字母去重，如"abbbcccbba" -> "abcba"，使用re模块的话如何优雅的完成这件事情？

（2）完成需求(1)后，能否顺便统计连续出现的个数，如"abbbcccbba" -> "a1b3c3b2a1"?

解决方案1:

（1）

>>> import re
>>> p=re.compile(ur"(\w)(\1+)")
>>> s="abbbcccbba"
>>> p.sub(ur"\1",s)
'abcba'
>>>

（2）

import re


def count(s):
    p = re.compile(ur"(\w)(\1+)")
    keys = list(p.sub(ur"\1", s))
    words = list(s)
    result = []
    # print keys, words
    for k in keys:
        n = 0
        # print words
        while len(words) > n and k == words[n]:
            n = n + 1
        words = words[n:]
        result.append((k, n))
        # print result
    return result

if __name__ == '__main__':
    s = "abbbcccbba"
    result = count(s)
    print ''.join(["%s%s" % x for x in result])

解决方案2:

(1)

>>> import re
>>> p = re.compile(ur"([a-zA-Z])(\1+)")
>>> s = "abbbcccbba"
>>> p.sub(ur"\1",s)
'abcba'
>>>

(2)

>>> import re
>>> p = re.compile(ur"([a-zA-Z])(\1*)")
>>> s = "abbbcccbba"
>>> p.sub(lambda m: m.group(1)+str(1+len(m.group(2))), s)
'a1b3c3b2a1'

分享到：QQ空间新浪微博腾讯微博微信百度贴吧 QQ好友复制网址打印

您可能想查找下面的文章:

2017-06-07 flask自定义URL转换器
2017-06-07 (shell)crontab如何增量写日志
2017-06-07 有哪些过程式代码转化成声明式代码的手法?
2017-06-07 Redis中incr的问题
2017-06-07 (python)标签树的下行遍历如何跳过第一个标签
2017-06-07 [rails]关于传递ruby数组到javascript的问题
2017-06-07 默认的搜索提供程序(python)默认提供x可执行权
2017-06-07 python小菜遇到问题TypeError:expectedstringorbuffer，求解答
2017-06-07 关于[]符号在mainString[]args{中放置位置的问题
2017-06-07 (VFP)如何筛选出除了字段中含有某些字符的记录。就是含有这些字符的记录不要。

python使用re匹配字符串中重复出现的字母

您可能想查找下面的文章:

相关文章

文章分类

最近更新的内容