赞同 3
分享

Python处理\x开头的表情特殊字符

简介:之前再爬取一些信息的时候,发现有类似\x06\x05\x07这样的字符报错,排查一番后发现是表情符号读取的结果。
  2020.06.14
  Bug Man
  3
  44
  172.17.0.1
  中国.上海
 
 

解决方法

刚开始的时候我以为只需要将\x字符给替换掉就好了,结果发现替换不掉,因为这个是一个表情符号在debug中获取的str类型也是一个方块。我看网上有人用这种方法是可以做到替换的,但是这个信息入库也没有太大的价值,直接通过扩展包过滤掉最好最方便。

安装emoji扩展包用来处理表情的包,pip install emoji安装成功后就可以进行过滤表情特殊字符。

import emoji
result = emoji.demojize(target_string)