
Python处理不定分隔符的字符串切割与提取方法
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本篇文章主要讲解如何使用Python编程语言有效地处理和解析具有不定分隔符的文本数据,并介绍几种实用的方法来实现字符串的精确分割和信息抽取。
我们需要在散沙一般的数据中提取出字符,分隔符不止一个,并且还有不少空格,例如:
原字符串如下:
```
asd ff gg; asd , foo| og
```
我们需要删除上面的`;|`分隔符和多余空格,提取出:
```
[asd, ff, gg, asd, foo, og]
```
这种操作一般用于处理日志或者网页数据提取。在这种情况下,需要的数据分布规律性不强,并且比较散。
下面是一个可以实现上述功能的Python代码示例:
```python
import re
line = asd ff gg; asd , foo| og
data = re.split(r[;,|\s]+, line)
print(data)
```
处理结果如下:
```
[asd, ff, gg, asd, foo, og]
```
全部评论 (0)
还没有任何评论哟~


